2014-04-12 1 views
3

내 프로젝트에 일리노이 출신 Semantic Role Labeler 도구를 사용하고 싶습니다.Java/vb.net에서 사용되는 의미 적 역할 레이블

나는 SRL 도구의 온라인 데모를 보았습니다. 이 도구를 사용하려면 웹 사이트에서 큐레이터를 다운로드 할 것을 제안합니다. 이 큐레이터 파일을 다운로드했습니다. 하지만 Java 코드 또는 VB.NET 코드에서 큐레이터 파일을 사용하려면 어떻게해야합니까? 아무도 나를 도울 수 있습니까?

답변

0

몇 가지 질문을하고 있습니다.

독립 실행 형 SRL이 개발 중입니다. 곧 출시 될 예정입니다. 난 당신이 VB.Net에서 큐레이터를 사용할 수 있다고 생각하지 않습니다 http://cogcomp.cs.illinois.edu/trac/curator.php

:

SRL에 접근하는 가장 좋은 방법

은 현재 여기에 설명 큐레이터를 설치하고 있습니다. Apache Thrift가 지원하는 언어로 설계되었으므로 : http://thrift.apache.org/about

Java를 설치하면 쉽게 액세스 할 수 있습니다. 연습이 있습니다. http://cogcomp.cs.illinois.edu/curator/CuratorDemo.html

1

큐레이터에 대한 몇 가지 팁을 알려드립니다. 큐레이터가 필요한 이유는 복잡한 소프트웨어 인 SRL 패키지가 일리노이 품사 (Part of Speech), 얕은 파싱 (parsing) 및 현재 Charniak 파서와 같이 몇 가지 외부 종속성을 필요로하기 때문입니다. Curator는 이러한 종속성을 관리하는 데 사용한 도구입니다.

그러나 큐레이터는 SRL에 필요없는 다른 종속성 (예 : Named entity tagger 및 Wikifier)도 설치합니다. 이러한 구성 요소는 충분한 RAM을 소비하는 경향이 있습니다 (예를 들어, 여기에 나열된 두 개는 10GB가 필요합니다). $CURATOR_HOME/dist/startServer.sh의 행을 주석 처리하여 자체 설명해야합니다.

당신이 실행 큐레이터가 있으면 당신이 받는다는 사용하는 큐레이터 - 클라이언트 패키지, JAVA에서이 작업을 수행하는 가장 쉬운 방법을 사용하여 프로그램에서, 당신은 그것을 호출 할 수

먼저 CCG를 받는다는의 repo에 추가하여 프로젝트 : 다음

<repositories> 
    <repository> 
     <id>CogcompSoftware</id> 
     <name>CogcompSoftware</name> 
     <url>http://cogcomp.cs.illinois.edu/m2repo/</url> 
    </repository> 
</repositories> 

그리고 다음을 추가 종속성이 API 및 데이터 구조부터

 <dependency> 
     <groupId>edu.illinois.cs.cogcomp</groupId> 
     <artifactId>curator-interfaces</artifactId> 
     <version>0.7</version> 
    </dependency> 
    <dependency> 
     <groupId>org.apache.thrift</groupId> 
     <artifactId>libthrift</artifactId> 
     <version>0.8.0</version> 
    </dependency> 

는 다른 리터에서 사용할 수 있도록, 드리프트에 정의되어 있습니다 (그러나 Daniel이 지적한 바와 같이 Thrift는 VB.NET을 지원하지 않습니다.) 관심이 있다면 CCG 웹 사이트를 살펴보고이를 수행하는 방법에 대한 자습서를 작성합니다. 곧 공개 될 것이다.

그리고 위의 종속성이 후, 당신은 http://cogcomp.cs.illinois.edu/curator/CuratorDemo.html

에 우리의 연습을 따라 당신은 어떤 문제가 알려줘 할 수 있어야한다.

0
당신은 ASNI의 C에서 개발 한 무료 NLP 도구이며 시각 studion.net http://ronan.collobert.com/senna/ 가 할 수있는 출력에서 ​​실행할 수있는 세나 사용할 수 있습니다

: 품사 (POS) 태그, 청크 (CHK), 이름을 엔티티 인식 (NER), 의미 론적 역할 레이블링 (SRL) 및 구문 구문 분석 (PSG).

관련 문제