[출처] : 2021 ADsP 데이터분석 전문가, 윤종식, DataEdu 출판사
녹색으로 표시된 부분은 블로그 작성자인 본인이 추가 또는 변경한 것이다.
1. 앙상블(Ensemble)
가. 주어진 자료로부터 여러 개의 예측모형들을 만든 후 예측모형들을 조합하여 하나의 최종 예측 모형을 만드는 방법
다. 앙상블 기법의 종류 (m.blog.naver.com/jinty/221720587524)
1) 배깅(Bagging)
- bootstrap(붓스트랩, 동일한 크기의 랜덤 샘플링 자료)를 생성 ->
다수의 모델링 생성 -> Voting(보팅)을 통해 다수결로 최종 결과 선정
2) 부스팅(Boosting)
- 학습데이터 -> 분류기 1st -> Weight -> 분류기 2nd -> Weight ..... -> 분류기 nth -> Weight -> 최종분류
* Bagging vs Boosting : 배깅은 병렬 연결, 부스팅은 직렬 연결(Sequencial, 순차적)
3) 랜덤 포레스트(random forest)
'ADsP 시험' 카테고리의 다른 글
[ADsP] 5장 데이터 마이닝 - 2절 분류분석 (0) | 2021.05.11 |
---|---|
[ADsP] 5장 데이터 마이닝 - 1절 데이터마이닝의 개요 (0) | 2021.05.07 |
[ADsP] 4장 4절 시계열자료 (0) | 2021.05.03 |
[ADsP] 3장 1절 통계분석의 이해 (0) | 2021.04.29 |
[ADsP] 4장 3절 회귀분석 (0) | 2021.04.29 |