2012-07-08 4 views
2

나는 텍스트 단순화에 관한 프로젝트를 진행 중이며 Stanford 파서와 같은 텍스트 파서를 제공하는 몇 가지 오픈 소스가 있습니다. 기계 학습을 사용하여 텍스트를 구문 분석 할 수있는 파서가 있는지 궁금합니다.기계 학습을 사용한 텍스트 단순화

+1

? 어떤 복잡한 측정 방법을 사용하고 있습니까? – dmh

+0

'ML'을 사용하여 구문 단순화를 수행하려고합니다. 복잡성 측정은 복잡성 분석입니다. 나는 사용자 요구 사항을 포함하는 문서를 가지고 있는데, 나는 문장을 문장으로 바꿔야한다. 그래서 문장은 스토리 카드를 표현할 수있다. "Extreme Programming"Agel 방법론 –

+0

입력과 원하는 출력에 대한 구체적인 예를 들어 줄 수 있겠습니까? "복잡성 분석"은 나에게 잘 정의되어 있지 않은 것 같습니다. 텍스트의 난이도를 결정하는 것은 단순한 작업입니다. 어떤 종류의 사용자 요구 사항이 있습니까? – dmh

답변

1

OpenNLP은이를위한 매우 훌륭한 오픈 소스 라이브러리입니다. MaxEnt와 같은 많은 특정 기계 학습 알고리즘을 사용하여이 라이브러리를 교육하여 필요에 맞는 모델을 생성 할 수 있습니다. 이 discussion도 볼 수 있습니다.

OpenNLP에는 Apache 라이센스가 있지만 LingPipe이라는 다른 도구가 있지만 비슷한 기능을 제공하지만 라이센스가 다릅니다.

Mahout도 기계 학습을위한 훌륭한 라이브러리이지만, 다른 파서 또는 자체 구현을 사용하여 텍스트에서 피쳐를 추출해야합니다. Mahout은 학습을위한 기능을 필요로합니다.

자습서 : 당신이하려고하는 단순화 어떤 종류의 1. OpenNLP Tutorials 2. LingPipe Tutorials

+0

tank vikas, 당신은 그 오픈 소스가 PLZ하는 방법을 보여주는 종이 또는 튜토리얼을 공유 할 수 있습니까? –

+0

이들은 매우 인기있는 프로젝트이므로 자습서를 찾는 것이 큰 일이 아니어야합니다. 아직도 나는 나의 대답에 대한 몇 가지 링크를 추가했다. 또한 기계 학습 라이브러리를 한 대 더 추가했습니다. 희망이 도움이됩니다. – vikas

+0

OpenNLP가 SourceForge에서 Apache로 옮겨졌습니다. 새로운 문서를 참조하십시오 : http://opennlp.apache.org/documentation.html – wcolen

관련 문제