2014-03-26 2 views
3

저는 자연어 처리와 GATE를 처음 사용합니다. 현재 GATE/ANNIE를 사용하는 법을 배우고 있습니다. ANNIE의 기본 지명 사전은 훌륭하지만 분명히 모든 것에 대한 목록을 제공하지는 않습니다. 이야기 책에 문자 목록을 작성해야합니다.
GATE Gazetteer Editor (게이트 설명서 13.2.2에서 언급했듯이)에서 목록을 만들고 각 목록에 항목을 추가하거나 텍스트 편집기를 사용하는 것은 실용적이지 않습니다. 누구든지 자체 지명 사전 목록을 만드는 방법을 알고 있습니다. GATE를 통해 직접 작성/편집하거나 텍스트 편집기를 사용하면됩니까?자신 만의 지명 사전 작성

답변

2

GATE manual에서 말한 것처럼 텍스트 편집기에서 기존 목록을 편집 할 수 있습니다. 아마도 가장 직접적인 방법은 프로그램 적으로 이러한 목록을 만드는 것입니다. 나는. 데이터베이스에있는 경우 지명 사전 형식 (기본적으로 한 줄당 한 단어 씩)으로 레코드를 덤프하십시오. csv 또는 웹 페이지에있는 경우 올바른 형식으로 내보내기하십시오.

또 다른 옵션은 온톨로지 또는 의미 저장소를 사용하는 고급 지명 사전을 사용하는 것입니다. 다른 지명 사전과 함께 사용하는 방법에 대해서는 위의 수동 링크를 참조하십시오.

2

위에서 제안한대로 데이터베이스 테이블의 열 내용을 사용하여 목록을 만들었습니다. 단순히 다른 모든 .lst 파일과 동일한 디렉터리에 메모장 + +를 사용하여 .lst 파일로 저장 한 다음 (나는 ANNIE 지명 사전을 사용하고 있습니다.) 지명 사전 편집기를 사용하여 추가했습니다. 올바른 인코딩 (UTF-8)으로 저장하지 못하는 문제가있었습니다. GATE는 그것을 좋아하지 않았고로드 할 때 메시지에 표시했습니다. 일단 내가 알아 냈어 그것을 수정, 그것은 잘 작동했습니다.

텍스트에서 엔티티 목록을 작성해야하는 경우 지명 사전 목록 콜렉터를 볼 수 있습니다. http://gate.ac.uk/sale/tao/splitch13.html - 13.7

관련 문제