"tm"패키지를 사용하여 텍스트 마이닝 용으로 R을 사용하려고합니다. 숲과 숲을 두 단어로 구분하는 주파수 그림을보십시오. 이를 수정하면 어떻게됩니까? 즉, 숲과 숲의 합계로 숲 만의 총 빈도를 선호합니다. 감사합니다 Frequency plot on R텍스트 마이닝 패키지를 사용하여 R에서 "포레스트"또는 "포리스트"중 한 단어로 단어 (포레스트, 포리 스트)를 어떻게 식별 할 수 있습니까?
1
A
답변
3
일종의 형태소 분석 기능을 사용할 수 있습니다. SnowballC
은이 기능을 제공합니다 (wordStem
기능).
모든 줄을 줄기로 줄입니다.
예
stem(forests) = forest
stem(forest) = forest
+0
Snowball C 라이브러리 (SnowballC) > docs
+0
예상대로 작동하지 않는 경우이 스레드를 살펴보십시오. http://stackoverflow.com/questions/24311561/in-r-stemdocument-in-r – PinkFluffyUnicorn
관련 문제
- 1. scikit-learn을 사용하여 임의의 포리 스트를 병렬 생성
- 2. Wordscloud R에서 텍스트 마이닝
- 3. 텍스트 마이닝 (tm 포함), 목록에없는 단어 제거
- 4. 텍스트 마이닝 - 정규화 된 가장 일반적인 단어
- 5. 단어로 한 단어 씩보기 UITextView
- 6. 텍스트 마이닝 : 문장 구성 매트릭스 얻기
- 7. 텍스트 파일에서 핵심 단어 식별
- 8. 어떻게 단어로 꼬리말을 삽입 할 수 있습니까?
- 9. 어떻게 단어 빈도와 그에 해당하는 단어를 얻으려고합니까
- 10. 어떻게 고유 한 nsHTTPChannel을 식별 할 수 있습니까?
- 11. "나쁜"뷰를 어떻게 식별 할 수 있습니까?
- 12. 텍스트 마이닝 데이터 저장
- 13. 어떻게 서버 프로세스를 식별 할 수 있습니까?
- 14. qt에서 개체를 어떻게 식별 할 수 있습니까?
- 15. R에서 상품 가격을 어떻게 얻을 수 있습니까?
- 16. R에서 as.Date()를 사용하여 날짜를 어떻게 포맷 할 수 있습니까?
- 17. 어떻게 워드 프레스에서만 30 단어로 게시물을 표시 할 수 있습니까?
- 18. Kinect를 사용하여 객체를 식별 할 수 있습니까?
- 19. 비디오 마이닝 - 문자 식별 및 명명
- 20. PHP를 사용하여 한 단어로 글자가 변경되었는지 어떻게 확인합니까?
- 21. 어떻게 Heroku에서 패키지를 업그레이드 할 수 있습니까?
- 22. stemDocument R 텍스트 마이닝
- 23. R에서 타사 .dll을로드 할 수 있습니까?
- 24. 오라클 SQL 네비게이터 데이터 마이닝 텍스트 마이닝
- 25. sqlite를 사용하여 문자열의 다른 단어로 단어 바꾸기
- 26. 어떻게 숫자로 끝나는 단어 만 추출 할 수 있습니까?
- 27. 단어 및 문장 식별
- 28. R에서 for 루프를 사용하여 여러 파일에 어떻게 쓸 수 있습니까?
- 29. 같은 단어로 단어 일치하기
- 30. 어떻게 html을 docx라는 단어로 변환 할 수 있습니까?
의 사용 가능한 복제 [R 텍스트 마이닝 - 복수형 처리 (http://stackoverflow.com/questions/34938023/r-text-mining-dealing-with-plurals) – DJack