machine learning

Random Forest

Aubreyy 2020. 8. 2. 21:15

목차

- 특징

 

랜덤포레스트 특징

  • Accuracy 뛰어남
  • 빅데이터에서 효율적으로 돌아감
  • 변수 삭제 없이도 수천개의 변수 사용 가능
  • 변수의 상대적 중요성, interaction 측정 가능
  • missing value에 영향을 크게 받지 않음 - random forest에서 처럼 missing value가 많아도 예측해서 사용.
  • 치우쳐진 데이터 셋에서 error를 바로 잡아줌
  • forest 만든 후 저장해서 다른 데이터에도 적용 가능
  • 클러스터링, 이상치 탐색 등에 활용할 수 있음

 

Classification + Regression Tree + Bootstrap aggregation + Randomization

<작성중>