모델을 교육하기 위해 문장/레이블 쌍의 목록을 가지고 있는데, 어떻게 문장을 SVM에 입력으로 인코딩해야합니까?word2vec는 감독 학습에 적합한가요?
1
A
답변
2
문장이 동일한 언어입니까? 영어로되어 있다면 Google에서 다운로드 할 수있는 미리 짜여진 word2vec 파일로 시작할 수 있습니다. 줄무늬가 적용되었는지 등 기차 파일이 어떻게 생성되었는지주의를 기울이십시오. 또한 생성 된 코퍼스에서 어느 정도 중요합니다. 뉴스 그룹이나 웹이나 공식적인 텍스트에서 추출한 것이라면 다른 결과를 얻을 수 있습니다.
Word2Vec는 기본적으로 모든 단어를 높은 차원의 벡터 공간으로 인코딩합니다. 이것은 대개 200,300 또는 500 치수입니다. 그것이 훈련 된 후에, "시험"문장은 기본적으로 단어의 모음이며 어떤 순서로도 될 필요가 없습니다.
그러면 단어 가방에있는 각 단어에 대해 해당 단어 2vec 벡터를 찾습니다. 그런 다음 벡터를 평균하여 '최소값', '최대 값'을 구하고 텍스트를 비교하는 경우 벡터 사이의 코사인 유사성을 계산하여 모양을 만들 수 있습니다. 그런 다음 SVM에서 이러한 기능을 사용하십시오.
관련 문제
- 1. 무작위 사람들에 의한 감독 또는 감독되지 않은 학습에 의한 설문 조사를하고 있습니까?
- 2. 감독 학습
- 3. 는 감독
- 4. 파이썬 : 팬더는 사용하기에 적합한가요?
- 5. 싱글 톤이이 디자인에 적합한가요?
- 6. WebServices 학습에 혼란이 있습니다.!
- 7. 학습에 관한 질문 TDD
- 8. JOptionPane 학습에 문제가 있습니까?
- 9. 어떤 종류의 이미지가 VectorDrawable에 적합한가요?
- 10. 내 데이터 모델이 목적에 적합한가요?
- 11. 어느 것이 렌더링에 가장 적합한가요
- 12. MVP - 감독 컨트롤러
- 13. 구문 감독 정의
- 14. MATLAB에서 SOM의 감독 교육
- 15. 감독 컨트롤러 패턴 이해
- 16. 수은 시험 감독 : 비교
- 17. MATLAB - 감독 분류/분할
- 18. 감독 학습을위한 차원 축소
- 19. 감독 비순환 그래프
- 20. Erlang 감독 node.js 인스턴스
- 21. Seq.where는 F 번호를 학습에 Seq.groupBy
- 22. 안드로이드 이클립스 학습에 대한 지원
- 23. Hadoop Framework 학습에 관심이 있습니다
- 24. AngularJS 개발자로서 jQuery 학습에 집중해야합니까?
- 25. 얼랑 감독 및 응용 프로그램
- 26. 감독 대상 컴퓨터 학습 .Net
- 27. 감독 비주기 말씀 그래프 Constuction
- 28. 감독 된 하강 방법 (SDM)
- 29. 기계 학습에서 감독 모델 만들기
- 30. 나무 (감독 비순환 그래프) 구현