2016-06-21 1 views
4

나는 spaCy 파이썬 패키지를 사용하여 텍스트를 구문 분석하고 태그를 지정하고 결과 종속성 트리 및 기타 속성을 사용하여 의미를 파생시킵니다. 이제 SyntaxNet의 Parsey McParseface를 구문 분석 및 종속성 태깅 (더 나은 것으로 보입니다)에 사용하고 싶지만 Parsey가 사용하지 않는 많은 기능을 수행하기 때문에 spaCy API를 계속 사용하고 싶습니다. NNP _ 2 nsubj _ _ spaCy API에 SyntaxNet 파서/타거를 사용하는 방법은 무엇입니까?

  • 가져온 _ 동사 VBD _ 0 ROOT _ _
  • _ DET DT _

    1. 밥 _ 명사 : SyntaxNet는 CoNLL 포맷에서 POS 태그 의존성 태그/출력 트리 4 DET _ _
    2. 피자 명사 NN _ _ _ _ 2 dobj
    3. 에 ADP IN _ _ _ _ 2 준비
    4. 앨리스 명사 NNP _ _ _ _ 5 POBJ
    5. . _. . _ 2 punct _ _

    spaCy는 바로 CoNLL 형식을 읽을 수있는 것 같습니다. here. 하지만 spaCy의 API가 CoNLL 문자열을 사용하는 곳을 알아낼 수는 없습니다. the spaCy blog에서

  • 답변

    3

    :

    은 분명히, 우리는 당신이 감미로운 적응 API로보다 정확한 모델을 사용할 수 있도록, Parsey McParseface와 적응 사이에 다리를 건설하고자합니다.

    그러나이 작업을 수행하려면 아직 많은 작업이 완료된 것처럼 보입니다.

    spaCy 작성자의 응답 here도 참조하십시오.

    1

    누가 SyntaxNet을 아직 서비스로 운영하고 있습니까? 스파이에 주석을로드하는 데 문제가 없습니다. 문제는 SyntaxNet이 주로 연구 시스템이며, 실험적 필요가 디스크의 텍스트 일괄 작업에 충분하다는 것입니다.

    디스크에서 읽을 내용이 있다면 아무 문제가 없어야합니다. 단지 CoNLL 형식으로 읽은 다음 spaCy Doc 개체에 주석을 적용 할 수 있습니다.

    +0

    , SyntaxNet 서비스로, 난 아직 자세하게 보았다하지 않은, 그러나 이것은 뭔가 것 같다 방향 : https://tensorflow.github.io/serving/ –

    0

    나는 spaCy로 시도하지 않았지만, DependencyGraph 및 Tree와 같은 Python NLTK의 클래스/구조 내에서 SyntaxNet의 출력을 사용할 수있었습니다. 여기

    전체 예이다 : 나는 또한으로 찾고 있어요

    http://www.davidsbatista.net/blog/2017/03/25/syntaxnet/

    관련 문제