※ 혼동 행렬(Confusion Matrix)
- 분류 모델의 성능을 평가하기 위함
정확도(Accuracy)
- 전체 데이터 중에서 잘 분류된 데이터의 비율로, 모델이 얼마나 정확하게 분류하는지를 나타냄
클래스 비율이 불균형 할 경우 평가 지표의 신뢰성을 잃을 가능성이 있음
정밀도(Precision)
- 모델이 Positive 라고 분류한 데이터 중 실제로 Positive 인 데이터의 비율
Negative가 중요한 경우. 실제로 Negative인 데이터를 Positive 라고 판단하면 안되는 경우 사용함
Negative가 중요한 경우
- 메일이 스팸인 경우 Positive 아닌경우 Negative 라고 했을때 스팸메일이 아닌, 일반메일을
Positive로 잘못 예측한 경우 필요한 메일을 수신하지 못하는 상황이 발생할 수 있음
재현율(Recall, TPR)
- 실제로 Positive 인 데이터 중 모델이 Positive로 분류한 데이터의 비율
Positive가 중요한 경우. 실제로 Positive인 데이터를 Negative라고 판단하면 안되는 경우 사용함
Positive가 중요한 경우
- 질병 보유 여부를 판결하는 검사일때, 보유할 경우 Positive 미보유인 경우 Negative일때
보유를 미보유(Negative)로 잘못 예측했을 경우 치료시기를 놓치는 불상사가 발생함
'기타 > What I Learned' 카테고리의 다른 글
[TIL] 2021.11.09 (0) | 2021.11.09 |
---|---|
[TIL] 2021.11.08 (0) | 2021.11.08 |
[TIL] 2021.11.06 (0) | 2021.11.06 |
[TIL] 2021.11.05 (0) | 2021.11.05 |
[TIL] 2021.11.04 (0) | 2021.11.04 |