※ 의사결정나무 - 불순도
- 데이터의 불순도(Impurity)를 최소화 하는 구역으로 나누기
불순도?
- 다른 데이터가 섞여 있는 정도
- 지니 계수(Gini Index) : 해당 구역 안에서 특정 클래스에 속하는 데이터의 비율을 모두 제외한 값
다양성을 계산하는 방법임
특징
- 결과가 직관적이며, 해석하기 쉬움
- 나무 깊이가 깊어질수록 과적합(Overfitting) 문제 발생 가능성이 매우 높음
- 학습이 끝난 트리의 작업속도가 매우 빠르다
'기타 > What I Learned' 카테고리의 다른 글
[TIL] 2021.11.08 (0) | 2021.11.08 |
---|---|
[TIL] 2021.11.07 (0) | 2021.11.07 |
[TIL] 2021.11.05 (0) | 2021.11.05 |
[TIL] 2021.11.04 (0) | 2021.11.04 |
[TIL] 2021.11.03 (0) | 2021.11.03 |