답변
찾고 계신 것이 확실하지 않습니다. 아마도 Lucene과 같은 것일까요?
숫자 데이터 마이닝 및 클러스터링이 아닌 텍스트 처리의 경우 NLTK 툴킷을 살펴볼 필요가 있습니다. 이것은 Python에서 자연 언어 처리 기술을 가르치기위한 것입니다. 그래서 이상적입니다. 파이썬을 사용하기로 결정했다면 많은 컴포넌트 클래스와 구현을 찾을 수 있습니다.
고마워요! 내 프로젝트 중 하나가 파이썬에있을 경우이 툴킷을 확인하겠습니다.) – Edward83
RapidMiner는 무료이며 오픈 소스이며 Windows, Mac, Linux에서 실행되며 멋진 그래픽 워크 플로 기반 프로그램입니다. 그것은 모든 Weka 코드를 실행하고 R과 통합합니다.
@EL 감사합니다;) 내가 확인하겠습니다) – Edward83
Apache Mahout은 텍스트 데이터에도 적용 할 수 있고 상당히 확장 가능한 인기있는 알고리즘을 제공합니다! Apache UIMA은 데이터 마이닝 알고리즘을 제공하지 않지만 자연어 처리에 널리 사용되는 프레임 워크입니다. 다음 http://www.RapidMiner.com/
데이터 마이닝 전문가 사이에서 가장 인기있는 데이터 마이닝 도구의 설문 조사입니다 :
RapidMiner 내 선호하는 데이터 마이닝 솔루션입니다 http://www.kdnuggets.com/2011/05/tools-used-analytics-data-mining.html
KDnuggets 설문 조사 2011 : RapidMiner는 가장 널리 사용되는 데이터입니다 전 세계 데이터 마이닝 전문가들 사이의 광업 솔루션.
Weka 및 Rapidminer는 클러스터링에서 그리 강하지 않습니다. 대부분 분류와 유사한 예측을하지만 클러스터링은 거의 없습니다. ELKI을 살펴보십시오. 이것은 WEKA 대학 프로젝트와 비슷하지만 클러스터링 및 이상치 검출 방법이 많습니다.
저는 빈번한 패턴 마이닝을위한 Java 오픈 소스 소프트웨어의 저자입니다.
텍스트 마이닝 용으로 특별히 설계된 것은 아니지만 일부 알고리즘은 텍스트의 빈번한 패턴을 적용하는 데 적용 할 수 있습니다. 예를 들어 여러 문장으로 자주 나오는 일련의 단어를 찾으려면 순차 패턴 마이닝 알고리즘을 적용 할 수 있습니다. 그러나 텍스트 파일이 올바른 형식이되도록 내 소프트웨어를 적용하기 전에 사전 처리가 필요합니다. http://www.philippe-fournier-viger.com/spmf/
아파치 두싯 또는 맵리 듀스 (아파치 하둡)없이 사용할 수있는 OpenSource 다음 Machile 학습 라이브러리입니다 :
당신은 여기에 소프트웨어를 확인할 수 있습니다.
그것은 자바에서 folloeing 알고리즘 구현 제공 :
- 협업 필터링
- 사용자 및 항목을 기반으로 추천인
- K-수단, 퍼지 K-수단 클러스터링을 시프트 클러스터링
- Dirichlet 프로세스 클러스터링
- 잠복 딜리클릿 할당
- 특이 값 분해
- 병렬 자주 패턴 마이닝
- 보완 나이브 베이 즈 분류
- 임의의 숲 의사 결정 트리 기반 분류
당신은 자세한 내용을보실 수 있습니다 : http://mahout.apache.org/
http://girlincomputerscience.blogspot.com.br/2010/11/apache-mahout.html
조언 해 주셔서 감사합니다 :) – Edward83
- 1. Java 오픈 소스 텍스트 마이닝 프레임 워크
- 2. 엔티티 프레임 워크 : 데이터
- 3. 데이터 수집 프레임 워크
- 4. 데이터 마이닝 알고리즘 비교
- 5. WCF 데이터 서비스 및 엔터티 프레임 워크
- 6. 동적 데이터 및 엔터티 프레임 워크 문제
- 7. 젠드 프레임 워크 데이터 맵퍼 및 관계?
- 8. Google 데이터 마이닝 도구
- 9. 데이터 마이닝 - 예측 분석
- 10. 데이터 마이닝 관련 포럼
- 11. Twitter 데이터 마이닝 : 분리도
- 12. 데이터 마이닝 교재
- 13. iframe에서 가져온 데이터 마이닝
- 14. 데이터 마이닝 및 비즈니스 인텔리전스 기술
- 15. 스윙 데이터 바인딩 프레임 워크
- 16. PubSub 프레임 워크 + 핵심 데이터?
- 17. 엔티티 데이터 프레임 워크 - 101
- 18. 금융 도메인 아이디어로 데이터 마이닝
- 19. 데이터 마이닝 도시와 도시 이름
- 20. SQL Server 데이터 마이닝 리소스
- 21. 오픈 소스 데이터 마이닝 소프트웨어
- 22. C#의 데이터 마이닝 리소스
- 23. iPhone 용 타일 기반 게임 엔진 또는 프레임 워크?
- 24. RSS 및 Atom 프레임 워크 및 확장
- 25. Extensible/Customizable 웹 크롤링 엔진/프레임 워크/라이브러리?
- 26. 내가 함께 데이터 마이닝 물건을 할
- 27. .NET 워크 플로 엔진 제안
- 28. 편집자 프레임 워크 및 MVP
- 29. 엔티티 프레임 워크 및 캡슐화
- 30. 젠드 프레임 워크 및 ReCaptcha
실제로 텍스트 마이닝 엔진을 찾으십니까? 데이터 마이닝 엔진은 텍스트 자체보다는 메타 데이터에서 작동하는 경향이 있습니다. – ianmayo