기타/What I Learned
[TIL] 2021.10.30
가죽방패
2021. 10. 30. 12:23
※ 범주형 자료 전 처리
- 범주형 데이터 : n 개의 범주로 나누어진 자료
-> 범주의 크기가 의미가 없는 경우는 명목형 자료라 부르고 의미가 있는 경우는 순서형 자료라고 부른다
명목형 자료는 수치 맵핑 방식 과 더미(Dummy) 기법 을 활용해 자료를 변환할 수 있고
순서형 자료는 수치 맵핑 방식 으로 자료를 변환할 수 있다
수치 맵핑 변환
- 일반적으로 범주를 0과 1로 맵핑함
- (-1, 1), (0, 100) 등 다양한 케이스가 있으나 모델에 따라 성능이 상이함
- 3개 이상인 경우, 수치의 크기 간격을 같게해 맵핑함
더미 기법
- 각 범주를 0 혹은 1로 변환함
수치 맵핑 변환
- 수치에 맵핑해 변환하지만 수치 간 크기 차이는 조절 가능
- 크기 차이가 결과에 영향을 줄 수 있음