2014-12-26 1 views
-1

수동 음성의 문장은 행동의 수행자가 끝에 있고 동작의 수신자가 시작 부분에있는 문장으로, 활성 문장의 문장 반대쪽에 있습니다 목소리. 예 :자바 스크립트로 수동 음성 문장을 감지하는 방법

존이 공을 잡았습니다.

활성 목소리로,하지만

볼은 요한이 잡혔다.

수동 음성입니다. This answer on English SE는 절이 수동태가되도록하기 위해 필요한 4 가지 조건을 제공합니다.이 절에는 수동 절의 과거 분사, 직접 대상 없음, 보조/돕기 동사가 있습니다 (어떤 형식이든). 제 목적을 위해 우리는 네 번째 조건을 무시할 수 있습니다. 왜냐하면 이것을 코드화하는 것은 극히 어려울 것이고 대부분의 문장은 어쨌든이 범주에 속하기 때문입니다.
몇 가지 참고 사항 :

  • 수동 문장이 매우 자주 (항상은 아니지만), X는 활성 버전의 시작 부분에 될 주제이다 ("X에 의해")는 전치사구가 문장의
  • 문장은 쉼표 나 세미콜론 등으로 구분 된 여러 개의 절을 가질 수 있으며 각 절에는 고유 한 음성이있을 수 있습니다. 예 :

    종소리가 울렸을 때 (교장 선생님이) 지미가 수업을 종료했습니다.

에서 첫번째 절 쉼표 수동적이며, 두 번째는 활성화 "시". 또한, 문장은 괄호 안의 부분이 없어도 괜찮습니다. 첫 번째 점을 참고하십시오.
이것은 엄격하게 사실은 아니지만 동사가있는 모든 단어 그룹과 구두점으로 구분 된 적어도 세 단어를 하나의 절로 간주 할 수 있습니다. 텍스트의 모든 절을 포함하는 배열이 있다고 가정하십시오 (따라서 절을 추출하는 것에 대해 걱정할 필요가 없습니다).

내 질문은 "JavaScript를 사용하여 수동 구문을 어떻게 식별 할 수 있습니까?" 몇 가지 실패한 시도가 있지만 잠시 생각해 봤지만 너무 멀어 질 수는 없습니다. 그것이 도움이된다면, 필자가 stylometry을 사용하여 텍스트 작성자의 특성을 분석하려고하기 때문에 필자가 텍스트에서 수동 절의 비율에 대한 근사치를 필요로하는 이유가 있습니다. 특정 문구의 빈도와 같은 다른 것들 중에서도 수동적 인 문장 사용은 이러한 특성 중 하나입니다.

답변

3

흥미 롭습니다. 모든 절이 포함 된 배열이 있다고 가정하면 참조하는 코드를 4 necessary conditions으로 인코딩하는 방법을 찾아야합니다.조항이 필요합니다

  • 보조 동사의 형태 (보통이거나 얻을)
  • 타동사
  • 직접 개체의 과거 분사는
  • 동사 구문의 피사체가있다 동작을 수행하거나 상태가 변경된 엔터티

1) 보조 동사 사전이있는 경우 이는 케이크 조각입니다. 또한 각 절을 동사 사전 &에 대해 일치시킬 수 있습니다. 둘 이상의 동사가 있는지 확인하십시오 (보조 동사가 더 많을 가능성이 있음).

2) 다시 말하자면, 절에서 동사를 찾아서 몇 가지 검사를 통해 실행해야합니다. 어쩌면 끝 문자를보고 수동적이라고 판단 할 수 있습니다.

3) 절에 직접 객체가 포함되어 있는지 찾기는 다소 간단합니다. 동사와 관련된 명사와 그 위치를 확인하십시오.

4) 3과 유사; 명사를 확인하고 단 하나만 있다면 우리가이면을 통과 할 가능성이 있습니다.

분명히 조금 더 까다 롭고 우리가해야 할 일이 더 많습니다. 명사의 동사에

  • 휴식 절 & 명사
  • 수표 금액 & 동사
  • 검사에 대한 자신의 상대적인 위치는 : 나는 우리가 할 수있는 가장 기본적인 것은 (꽤 끔찍한 정확성이있을 것이다 부여) 생각 동사가 일반 수동 동사 단점에 부합하는 경우 (예 : '-ed')

흥미롭고 어려운 문제이며이 접근법으로 얼마나 정확하게 얻을 수 있는지 궁금합니다.

관련 문제