원핫 인코딩 (One-hot encoding) • 정의 • 임베딩의 한 방법으로 • 0과 1을 통해 단어를 정의 • 특정 단어를 표현하는 위치만 1이고 나머지의 위치는 0으로 구성 • 예를 들어, 전체 단어가 ʻdog’, ʻcat’, ʻapple’ 이 있다고 할 때, • dog : [1, 0, 0] • cat : [0, 1, 0] • apple : [0, 0, 1] • 과 같이 단어의 수 만큼의 크기를 갖는 벡터가 생성 • 각 단어의 위치(1이 표현되는 위치)는 설정하기에 따라 다름 • 직관적으로 쉽게 단어를 벡터로 변환 가능 단어에 원핫 인코딩 적용하기 • 원핫 인코딩을 적용하기 위해 문장을 단어의 형태로 분해 • 이를 tokenize(토크나이즈)라고 함 ‒ 추후 자세히 다룰 예정 • 일단 띄어쓰기 단..