저는 유니 그램 언어 모델을 프로그래밍하고 싶습니다. 나는 각 단어의 출현 확률을 계산하는 것을 좋아한다. 그래서 단어의 출현 수를 뚜렷한 단어의 수 또는 훈련 세트의 전체 단어 수로 나눈다.유니 그램 언어 모델의 단어 수는 얼마입니까?
2
A
답변
6
총 숫자 tokens으로 나누어집니다. 즉, 단어 세트는 훈련 세트에서 나타납니다. 그 이유는 아주 쉽게 볼 수 있습니다. 뚜렷한 단어의 수로 나누면, 모든 단어의 확률이 반드시 하나에 합쳐지는 것이 아니라 확률 분포를 형성하지 않을 것입니다.
1
언어 모델링에 대해 읽어 좋은 소개는 Jurafsky의 슬라이드 있습니다 http://www.stanford.edu/class/cs124/lec/languagemodeling.pdf
관련 문제
- 1. 회원의 Google 그룹 단어 수는 얼마입니까?
- 2. JSON의 주소 수는 얼마입니까?
- 3. MATLAB에서지도의 바이트 수는 얼마입니까?
- 4. 파일의 문자 수는 얼마입니까?
- 5. Appstore의 앱 수는 얼마입니까?
- 6. Glassfish 노드의 최대 수는 얼마입니까?
- 7. 최대 웹 메소드 수는 얼마입니까?
- 8. oauth2의 최대 요청 수는 얼마입니까?
- 9. PHP 변수의 문자 수는 얼마입니까?
- 10. B 트리의 리프 수는 얼마입니까?
- 11. 함수 오버로드의 최대 수는 얼마입니까?
- 12. lan의 최대 컴퓨터 수는 얼마입니까?
- 13. GAE 인스턴스의 사용자 수는 얼마입니까?
- 14. IdentityServer3에 필요한 인증서 수는 얼마입니까?
- 15. 초당 게임 업데이트 수는 얼마입니까?
- 16. Socket.io & Mysql : 연결 수는 얼마입니까?
- 17. BufferedReader, 읽은 바이트 수는 얼마입니까?
- 18. rethinkdb의 최대 노드 수는 얼마입니까?
- 19. 높이 h에있는 노드 수는 얼마입니까?
- 20. 디렉토리의 하위 디렉토리 수는 얼마입니까?
- 21. 하둡 단어 수는 예
- 22. 단어 모델의 가방에 세분화
- 23. URL의 최대 단어 크기는 얼마입니까?
- 24. 최대 단어 수는 어떻게 설정합니까?
- 25. 단어 수는 Vim 문서에 인쇄됩니다.
- 26. php의 언어 단어 존재
- 27. 다른 언어 recaptcha 단어
- 28. 페이지에 넣을 요소 ID의 최대 수는 얼마입니까?
- 29. BitTorrent swarm에서 최적의 노드 수는 얼마입니까?
- 30. VB.NET에서 줄 연속의 최대 수는 얼마입니까?
가 별개의 단어 수로 나눈 것 사실 경우, 단독으로 하나 개의 항목에 대한 확률도 100 %를 초과 할 수 있습니다 ...... – Pacerier