2014-03-03 2 views
5

Q1. 완전한 문장의 긴장을 찾으려고하는데, nlp를 사용하여 어떻게해야하는지 모릅니다. 도움을 주시면 감사하겠습니다.스탠포드 nlp를 사용하여 문장의 긴장 찾기

질문 2. nlp를 사용하여 문장에서 모든 정보를 추출 할 수 있습니까?

현재 할 수있는 내용은 입니다. 1. 문장 선택 2. 제목 객체 동사 3.POS 태그.

더 자세한 정보를 얻으려면 알려주세요.

+0

나는 완전한 시제를 원한다 : 간단한 현재 또는 완벽한 완벽한 시제 ... POS 태그에서 단순히 얻을 수 없다는 것을 알고있는 한. – swapyonubuntu

+0

문장의 목소리, 주제 객체 동사를 어떻게 결정할 수 있습니까? , etc. ... NLTK를 사용하고 있는데 POS 태그를 얻을 수 있지만 문장이나 제목, 객체의 음성이 아닙니다. – JKC

+0

이 경우 구문 분석 트리를 사용하여 원하는 모든 것을 얻을 수 있습니다. – swapyonubuntu

답변

12

펜실베니아의 treebank VBD는 각각 과거 시제와 동사의 과거 분사로서 VBN 정의한다. 많은 문장에서 단순히 POS 태그를 가져 와서이 두 태그가 있는지 확인하는 것만으로 충분합니다. 그러나 다른 사람에서는 문장이 전체 시제 인 동안 여러 시제에 동사가있을 수 있습니다. 이 경우 선거구 분석을 사용해야합니다. 스탠포드 NLP는 파서도 제공합니다. 이를 통해 바깥 쪽 동사구 (VP 태그)을 감지 할 수 있습니다. 과거의 시제/분사 형태의 동사가 동사구의 다른 모든 동사의 조상이라면 문장의 시제는 과거 시제로 표시되어야합니다.

인 Dror 의해 주어진 예이 산출 :는 과거 시제 아니다 먹을

(ROOT 
    (S 
    (NP (PRP I)) 
    (VP (VBD did) (RB n't) 
     (VP (VB want) 
     (NP (DT the) (NN dog) 
      (S 
      (VP (TO to) 
       (VP (VB eat) 
       (NP (PRP$ my) (NN homework)))))))) 
    (. .))) 

불구 동사구의 최상위 동사 정확하게 (즉 과거 시제) VBD 태그된다.

편집 (몇 가지 추가 정보) :

복잡한 문장은 차 긴장차 긴장을 무엇이라고. "내가 거기에 도달 할 때까지 그는 이미 떠났을 것"과 같은 문장을 위해, 완전한 시제와 같은 것은 존재하지 않는다. 기본 및 보조를 구별 할 수만 있습니다.

정보를 원하는 경우에 대한 완벽한, 연속 등, 당신은 POS 태그를 기반으로 규칙을 도출해야합니다. 예 : 현재 시제의 보조 동사와 과거 시제의 동사 다음에 현재 시제를 나타낼 것입니다 (명백한 반례가있는 경우 답을 추가하십시오 ... 나는 지금 당장 생각할 수 없습니다).

+0

나는 완전한 시제 예를 원한다 : 간단한 현재 또는 완벽한 완벽한 시제 ... POS 태그에서 단순히 얻을 수 없다는 것을 알고있는 한. – swapyonubuntu

+0

그것은 사실이다. POS 태그에서 간단히 알 수 없다. 그러나 내 대답이 제공하는 구문 구조와 같은 구문 구조를 사용하면 훨씬 정확한 결과를 얻을 수 있습니다. 그러나 "나는 거기에 도달 할 때까지 그는 이미 떠났을 것"과 같은 문장을 위해 일하지 않을 것이다. –

+0

하지만 문장에 긴장 되길 원합니다 ... – swapyonubuntu

3

기본적으로 영어 문장의 긴장은 문장의 머리 부분 인 동사의 형태로 결정됩니다. 이 게시물에 대한 자세한 내용은 The Contextors’ Tense Conjugator에 대한 게시물을 참조하십시오. 파문을 사용하여 머리 동사와 그 형식을 식별 할 수 있습니다.

문장에서 추출 할 수있는 정보의 종류는 수행하는 분석에 따라 다릅니다. 전치사 보완, 술어 보완 및 부가뿐만 아니라 양상, 이차 시제, 양상 및 극성과 같은 기타 문법적 특성과 같은 문장의 다른 구성 요소를 추출 할 수 있습니다. 일부 문장에는 Contextors API의 아래 예와 같이 삽입 된 절이 들어 있습니다. 이 경우 임베디드 절에서도이 정보를 추출 할 수 있습니다.

enter image description here

+0

다른 무료 API를 베타 버전으로 제안하십시오. 오픈 소스가 아닐 수도 있습니다. – swapyonubuntu

+0

Steling NLP, Freeling, Gate, NLTK를 사용할 수 있습니다. –

1

내가 긴장 예를 완료하려면 : 당신은 위의 예에서 무엇을 간단한 없거나, 완벽한 연속 긴장 ... 지금까지 내가 POS 태그에서 간단하게 얻을 수 알고

하는 것으로를 긴장의 예가 아니며, 어떤 긴장/애스펙트 구성의 예일뿐입니다. 시제는 과거 (현재, 미래)가 시간에 우발적 인 결과를 가져다 주지만, 종양의 범주 (점진적, 연속적, 완전성 등)는 시간의 흐름과 관계가있다. 지속적인 이벤트, 등). 따라서, 시제와 애스펙트는 두 가지 별개의 문법적 범주입니다. 영어로, 그들은 둘 다 구두 단지의 일부를 형성하기 때문에 혼동하기 쉽고 단일 방법으로 그것들을 찾고 분석 할 수 있습니다. 다른 많은 언어에서는 별도로 구현됩니다 (구별되는 구조적 위치, 기능적 항목, 구조 등). 조심하십시오.

관련 문제