기타/What I Learned

[TIL] 2021.11.06

가죽방패 2021. 11. 6. 20:40

※ 의사결정나무 - 불순도

- 데이터의 불순도(Impurity)를 최소화 하는 구역으로 나누기

 

불순도?

- 다른 데이터가 섞여 있는 정도

지니 계수(Gini Index) : 해당 구역 안에서 특정 클래스에 속하는 데이터의 비율을 모두 제외한 값

다양성을 계산하는 방법임

 

특징

- 결과가 직관적이며, 해석하기 쉬움

- 나무 깊이가 깊어질수록 과적합(Overfitting) 문제 발생 가능성이 매우 높음

- 학습이 끝난 트리의 작업속도가 매우 빠르다

'기타 > What I Learned' 카테고리의 다른 글

[TIL] 2021.11.08  (0) 2021.11.08
[TIL] 2021.11.07  (0) 2021.11.07
[TIL] 2021.11.05  (0) 2021.11.05
[TIL] 2021.11.04  (0) 2021.11.04
[TIL] 2021.11.03  (0) 2021.11.03