2017-03-03 4 views
0

Word2Vec 모델에 문장을 추가하면 "ISO 9001"이 "ISO 9001"과 같이 숫자 값으로 끝나거나 시작되는 단어를 제거하는 것처럼 보입니다. ...숫자가 포함 된 Word2Vec 단어

미리 감사드립니다.

+0

코드가 있습니까? 분명히 어떤 시점에서 사전 처리가 일어나고 있지만 우리가 당신을 도울 수 있도록 돕지는 않습니다. –

답변

0

이 질문에 대한 귀하의 질문에 귀하가 이미 답변 해 주셨습니다. 대개 tokenizer는 공백으로 나뉘며 숫자를 제외합니다. 여기에 사용하는 토큰 화 코드를 붙여 넣으면 더 이상 당신을 도울 수있을 것입니다.

행운을 빈다.

관련 문제