ADsP 시험

ADsP 시험[ADsP] 5장 데이터 마이닝 - 3절 앙상블 분

푸른잎 뱅갈고무나무 2021. 5. 11. 15:10

[출처] : 2021 ADsP 데이터분석 전문가, 윤종식, DataEdu 출판사

녹색으로 표시된 부분은 블로그 작성자인 본인이 추가 또는 변경한 것이다.

 

1. 앙상블(Ensemble)

   가. 주어진 자료로부터 여러 개의 예측모형들을 만든 후 예측모형들을 조합하여 하나의 최종 예측 모형을 만드는 방법

   다. 앙상블 기법의 종류 (m.blog.naver.com/jinty/221720587524)

      1) 배깅(Bagging)

          - bootstrap(붓스트랩, 동일한 크기의 랜덤 샘플링 자료)를 생성 ->

                                              다수의 모델링 생성 -> Voting(보팅)을 통해 다수결로 최종 결과 선정

      2) 부스팅(Boosting)

          - 학습데이터 -> 분류기 1st -> Weight -> 분류기 2nd -> Weight ..... -> 분류기 nth -> Weight -> 최종분류

 

       * Bagging vs Boosting : 배깅은 병렬 연결, 부스팅은 직렬 연결(Sequencial, 순차적)

                                              

 

     3) 랜덤 포레스트(random forest)