Convolution Neural Network에 대한 입력을 포함하는 것에 대해 연구 중이며 Word2vec를 이해합니다. 그러나 CNN text classification에 있습니다. dennybritz는 함수 learn.preprocessing.VocabularyProcessor
을 사용했습니다. document. 그들은 문서를 단어 ID 시퀀스에 매핑한다고 말했습니다. 이 기능이 어떻게 작동하는지 잘 모르겠습니다. Ids 목록을 작성한 다음 Id를 단어로 맵핑합니까? 아니면 단어 사전과 ID를 가지고 있습니까?어휘 처리기 기능
6
A
답변
15
두 개의 문서 I like pizza
및 I like Pasta
만 있다고 가정 해 보겠습니다. 귀하의 전체 어휘는 다음 단어들로 구성됩니다. (I, like, pizza, pasta)
어휘의 모든 단어에 대해 이렇게 연관된 색인이 있습니다 (1, 2, 3, 4). 이제 I like pasta
과 같은 문서가 주어지면 벡터 [1, 2, 4]로 변환 할 수 있습니다. 이것이 learn.preprocessing.VocabularyProcessor
의 기능입니다. 매개 변수 max_document_length
는 길이가 max_document_length
보다 짧은하고 클리핑 경우 그 길이이 당신에게
관련 문제
- 1. Xcode 4.6.1 어휘 또는 전 처리기 문제
- 2. 예상되는 ':'어휘 적 또는 전 처리기 오류
- 3. AFNetworking 어휘 또는 전 처리기 문제 예상 ':'
- 4. 처리기 다른 기능 이름과 동일한 기능
- 5. 녹아웃 바인딩 처리기 teardown 기능?
- 6. 사용자 정의 오류 처리기 기능?
- 7. 어휘 또는 전 처리기 문제 'ParseFacebookUtils/PFFacebookUtils.h'파일을 찾을 수 없습니다.
- 8. 어휘 사전 처리기 문제 (파일을 찾을 수 없음)
- 9. 오류 : 어휘 및 전 처리기 문제 : 'tidy.h'파일을 찾을 수 없습니다.
- 10. 어휘 또는 전 처리기 문제 "#import <map>
- 11. 어휘 또는 전 처리기 문제 - Cordova/CDVAppDelegate.h 찾을 수 없음
- 12. 어휘 또는 전 처리기 계정 프레임 워크 문제
- 13. 변수/어휘 환경
- 14. Outlook 추가 기능, 오른쪽 이벤트 처리기
- 15. Visual C++의 전 처리기 기능 __COUNTER__
- 16. 다중 스레드 환경에서 신호 처리기 기능
- 17. 어휘 분석기는
- 18. 어휘 분석
- 19. 어휘 사전
- 20. 어휘 분석
- 21. 어휘 요소
- 22. 어휘 분석에 관한 질문
- 23. gensim의 어휘 수는 학습 데이터의 어휘 수보다 훨씬 적습니다.
- 24. SPDH 용 어휘 분석기
- 25. 이론 : "어휘 인코딩"
- 26. PostgreSQL + GROUP_P의 어휘 정의
- 27. 어휘 분석기 사용하여 C++
- 28. 코드 어휘 통계
- 29. 파이썬에서 어휘 만들기
- 30. 어휘 분석 라이브러리
감사 쉬얍을하는 데 도움이 이상
max_document_length
희망하는 경우 모든 문서 중 하나 패딩 번호로 길이max_document_length
의 벡터로 표현되어 있는지 확인합니다, 그래서 그것은 문서를 벡터 공간으로 만 인코딩합니다. Natural Language Processing에 이름이 있습니까? – ngoduyvu@ngoduyvu 내가 아는 한 아무 것도 없음 ... 이것은 자연어 처리 시스템의 대부분에서 수행되는 전처리 단계 중 하나입니다. – Kashyap
max_document_length는 고유 한 단어의 수 여야합니다. – zsong