자연어 전 처리(Preprocessing) - 단어 표현(Word Embedding) - 모델 적용하기(Modeling) 자연어 전 처리 방법은 Noise canceling, Tokenizing, StopWord removal 과 같은 과정이 필요함 Noise canceling - 자연어 문장의 스펠링 체크 및 띄어쓰기 오류 교정을 함 Tokenizing - 문장을 토큰화 시킴. 토큰은 어절, 단어 등으로 목적에 따라 다르게 정의를 함 StopWord - 불필요한 단어를 의미하는 불용어를 제거함