[TIL] 2021.11.17

기타/What I Learned

가죽방패 2021. 11. 17. 14:20

자연어 전 처리(Preprocessing) - 단어 표현(Word Embedding) - 모델 적용하기(Modeling)

자연어 전 처리 방법은 Noise canceling, Tokenizing, StopWord removal 과 같은 과정이 필요함

Noise canceling - 자연어 문장의 스펠링 체크 및 띄어쓰기 오류 교정을 함

Tokenizing - 문장을 토큰화 시킴. 토큰은 어절, 단어 등으로 목적에 따라 다르게 정의를 함

StopWord - 불필요한 단어를 의미하는 불용어를 제거함

지나가다 보기 좋은 블로그

Python, NIPA, 큐, steam, FLASK, 이진탐색트리, 이진트리, NamingConvetions, 팰월드, 자료구조, java, 연결리스트, Django, matplotlib, 조건문, PALWORLD, 도커볼륨, 리스트, til, kotlin,

방앗간