앙상블 학습 정리: 보팅, 배깅, 부스팅, 스태킹

머신러닝에서 앙상블 학습(Ensemble Learning)은 여러 개의 개별 모델을 결합해 하나의 강력한 모델을 만드는 기법입니다.
주요 목적은 예측 성능 향상과 과적합(overfitting) 완화입니다.

앙상블은 크게 보팅(Voting), 배깅(Bagging), 부스팅(Boosting), 스태킹(Stacking) 네 가지로 나눌 수 있습니다.

1. 보팅 (Voting)

여러 모델의 예측을 단순 취합해 최종 결과를 정합니다. 주로 분류 문제에서 사용됩니다.

특징:

부트스트랩 샘플링과 예측 집계를 결합한 방식입니다.

특징:

대표 모델:

장점:

약한 학습기를 순차적으로 학습시켜 점진적으로 강한 모델을 만드는 방식입니다.

특징:

대표 모델:

장점:

여러 모델의 예측 결과를 다시 입력으로 써서 메타 모델이 최종 예측을 학습하는 방식입니다.

특징:

장점:

단점:

앙상블은 단일 모델의 한계를 보완하는 강력한 도구입니다.

데이터 특성, 계산 자원, 운영 요구사항에 맞춰 적절한 방식을 선택하는 것이 중요합니다.