콘텐츠를 기준으로 텍스트의 카테고리를 자동으로 찾는 방법은 무엇입니까?텍스트 콘텐츠를 기반으로 분류하는 방법은 무엇입니까?
3
A
답변
0
+0
링크가 죽었습니다. ( – Tessmore
0
2
- 읽기 Data Mining: Practical Machine Learning Tools and Techniques - 이안 H. 위튼, EIBE 프랭크
- 사용 Weka 또는 Orange
2
나는 Natural Language Toolkit와 함께 번들로 텍스트 분류 라이브러리를 살펴 보시기 바랍니다 것 . 비록 당신이 파이썬에 익숙하지 않더라도 당신은 API를 다소 직관적이라고 생각할 것입니다. NLTK Book에 많은 좋은 예가 있으며 메일 링리스트의 사람들도 매우 도움이됩니다.
0
텍스트 분류를 수행하는 가장 간단한 방법은 bag-of-words 표현을 사용하는 것입니다. 각 문서에있는 단어의 단어/n-gram을 기능으로 사용할 수 있습니다. 이를 통해 모든 문서를 미터법 공간의 벡터로 나타낼 수 있습니다. 그런 다음 clustering을 적용하여 콘텐츠 측면에서 유사한 문서를 그룹화 할 수 있습니다. 예를 들어, 이러한 벡터와 k-means 클러스터링을 사용하여 어휘 적으로 비슷한 문서를 함께 클러스터링 할 수 있습니다.
파이썬 기반의 텍스트 마이닝 작업대 인 NTLK은 이러한 작업을 빠르게 수행 할 수 있습니다 (일반적으로 파이썬은 텍스트 작업에 매우 유용합니다). 유용 할 수 있습니다.
관련 문제
- 1. 콘텐츠를 기반으로 이미지 정렬
- 2. 큰 '매크로'클래스를 분류하는 방법은 무엇입니까?
- 3. 콘텐츠를 기반으로 WrapPanel 높이를 동적으로 조정하는 방법은 무엇입니까?
- 4. 사이트 목록을 분류하는 가장 좋은 방법은 무엇입니까?
- 5. 사전에서 단어를 자동으로 분류하는 방법은 무엇입니까?
- 6. 바깥쪽으로 향한 Bugzilla를 분류하는 방법은 무엇입니까?
- 7. 기존 애플리케이션을 분류하는 가장 좋은 방법은 무엇입니까?
- 8. 개체 속성을 기반으로 목록에서 개체를 정렬/분류하는 가장 효율적인 방법
- 9. 콘텐츠를 동적으로로드하는 방법은 무엇입니까?
- 10. Google에서 이미지의 텍스트 콘텐츠를 색인하는 가장 좋은 방법은 무엇입니까?
- 11. 해당 속성을 기반으로 개체를 분류하는 접근 방식을 찾고 있습니다.
- 12. Storekit 콘텐츠를 제공하는 방법은 무엇입니까?
- 13. 주소록 콘텐츠를 검색하는 방법은 무엇입니까?
- 14. iframe 콘텐츠를 변경하는 방법은 무엇입니까?
- 15. RichTextBox로 html 콘텐츠를 표시하는 방법은 무엇입니까?
- 16. 가로 스크롤보기가있는보기에서 콘텐츠를 표시하는 방법은 무엇입니까?
- 17. XAML 이미지 소스는 콘텐츠를 기반으로 동적으로 설정됩니다.
- 18. 콘텐츠를 기반으로 jquery로 td를 숨 깁니다.
- 19. PHP에서 원격 URL을 기반으로 콘텐츠를 표시 하시겠습니까?
- 20. 태그를 기반으로 사용자에게 콘텐츠를 추천하기위한 알고리즘
- 21. 동적 콘텐츠를 기반으로 CSS 스타일 만들기
- 22. 콘텐츠를 기반으로 JQuery 크기를 조정하는 div
- 23. SSRS : 텍스트 콘텐츠를 프로그래밍 방식으로 수정하는 방법?
- 24. "studentId"를 기반으로 텍스트 파일에서 행을 제거하는 방법은 무엇입니까?
- 25. 특정 템플릿 위치에 콘텐츠를 게시하는 방법은 무엇입니까?
- 26. 논문에 대한 SQL Server 데이터 액세스를 분류하는 방법은 무엇입니까?
- 27. 일본어 문자를 한자 또는 가타카나 또는 히라가나로 분류하는 방법은 무엇입니까?
- 28. R에서 카테고리를 축소하거나 변수를 다시 분류하는 방법은 무엇입니까?
- 29. 고용주를 조건에 따라 세 개의 열로 분류하는 방법은 무엇입니까?
- 30. HTML 콘텐츠를 렌더링하는 핵심 텍스트
작성자가 이미 카테고리를 가지고 있고 분류하고 싶었거나, 분류하지 않거나, 분류하지 않고, 검색해야 할 필요가있는 경우 원래 게시에서 지정하지 않았습니다. –