machine learning
Random Forest
Aubreyy
2020. 8. 2. 21:15
목차
- 특징
랜덤포레스트 특징
- Accuracy 뛰어남
- 빅데이터에서 효율적으로 돌아감
- 변수 삭제 없이도 수천개의 변수 사용 가능
- 변수의 상대적 중요성, interaction 측정 가능
- missing value에 영향을 크게 받지 않음 - random forest에서 처럼 missing value가 많아도 예측해서 사용.
- 치우쳐진 데이터 셋에서 error를 바로 잡아줌
- forest 만든 후 저장해서 다른 데이터에도 적용 가능
- 클러스터링, 이상치 탐색 등에 활용할 수 있음
Classification + Regression Tree + Bootstrap aggregation + Randomization
<작성중>