인공지능
[정형데이터 분류] 트리 모델
Frank_the_Tank
2021. 4. 15. 20:01
📍 Tree Model
🔥 Decision Tree(의사결정나무)
- Feature 값들을 어떤 기준을 통해 group화해서 목적에 맞는 의사결정을 할 수 있도록 하는 방법
* 트리 모델의 발전
🔥 Bagging
- Dataset을 sampling하여 모델을 만들어 나감
- 여러 모델을 합쳐 Decision Tree가 생성됨
- Bootstrap + Aggregation
-> Bootstrap : Dataset을 여러 개로 sampling
-> Aggregation: 종합(Ensemble)
* Boosting의 경우 하나의 트리를 만들고 앞의 오류를 고치며 발전
- Bagging vs Boosting
🔥 LightGBM, XGBoost, CatBoost
- 균형적 구조: XGBoost, CatBoost
- 비균형적 구조: LightGBM
- 세 트리의 parameter 비교
- 밑의 사진처럼 LightGBM과 CatBoost는 Pandas의 Category 타입이 가능한데, XGBoost는 Numeric 데이터 타입만 가능하기 때문에 전처리가 필요