2009-12-31 3 views
0

지능적으로 구문 분석하고 나중에 번역 할 수 있도록 텍스트를 저장하는 지능적인 방법은 무엇입니까?지능형 텍스트 구문 분석 및 번역

예를 들어, 직원은 자신의 강점과 약점을 식별하고 자신에게 편안함을 나타낼 때 뛰어난 사람입니다.

위의 내용은 평가하기 전에 사용자에게 표시되는 일반 텍스트 일 ​​수 있습니다. 사용자가 남성 (Shaun) 또는 여성 (Mary라고 말한 경우) 인 경우 위 텍스트는 다음과 같이 번역되어야합니다.

메리는 자신의 강점과 약점을 식별 할 수 있고 자신에게 편한만큼 뛰어난 사람입니다.

숀 (Shaun)은 자신의 강점과 약점을 파악하고 자신에게 편한만큼 뛰어난 사람입니다.

  1. 적절한 장소 또는 토큰 소지자를 사용하여 첫 번째 장소에 평가 기준을 저장하는 방법은 무엇입니까? (위의 경우 직원은 직원 이름으로 번역되어야하고 성별에 따라 자신이나 자신이 번역해야 할 단어가 있어야합니다.)

  2. 위의 정보로 텍스트를 자동 번역하는 메커니즘이 있습니까?

+0

글쎄, 성별에 기초한 단어를 번역하기는 쉽지만 ... [직원]과 같은 다른 단어를 얼마나 많이 사용해야합니까? 왜 그것이 입력 텍스트입니까? 누가 이걸 쓰고 있니? 만약 당신이 통제한다면, "과 같이 일종의 템플릿을 사용해야합니다. 을 식별 할 수 있습니다 ..." – mpen

+0

입력 텍스트는 다양한 템플릿을 생성하는 저자의 소유입니다. . 저자가 알 수 있도록하는 방법, 지원되는 가변 매개 변수의 목록 또는 즉시 변환 할 수있는 방법을 모릅니다. – Joe

답변

3

이와 같은 작업을 수행하는 기본적인 개념을 편지 병합이라고합니다.
This page 루비에서 이런 식으로 구현하는 방법을 생각해보십시오.

[편집] 구글 검색이 나에게 준
이 - http://freemarker.org/ alt text http://freemarker.org/images/overview.png
나는이 라이브러리에 대해 잘 모르겠지만, 당신이 필요한 것 같습니다.

+0

설명은 유용하지만 Java 기반 솔루션을 찾고 있습니다. – Joe

1

이것은 Natural Language Processing의 분야에서 매우 광범위한 질문입니다. 여러 가지 방법으로 둘러 볼 수 있습니다. 질문 한 내용이 너무 광범위하게 보입니다.

@variable {이름} @gender {그/그녀}가 자신의 @gender {그/그녀}을 식별 할 수있는 뛰어난입니다 :

나는이 이런 식으로 일을 할 수 귀하의 질문에 제대로 부분을 이해한다면 강점과 약점이 있으며 @ gender {자신/자신}에게 익숙합니다.

또는 : @he이 @his 자신의 강점과 약점을 파악하고 @himself과 편안 수

@name 뛰어난입니다.

... 성별이 주요 문제인 경우.

+0

현재 변수 매개 변수 목록은 이름, 성별 (he | she, him | her, his | herself)로 제한되어 있습니다 ... – Joe

1

수식 분석 및 평가 엔진과 같은 사용자 지정 사용자 입력을 작성할 때 Grammatica이라는 도구로 작업 한 경험이 있습니다. 그것은 당신이 찾고있는 세련미의 수준에 이르지 못할 수도 있지만 그것은 시작입니다. 이것은 기본적으로 대중적인 코드 컴파일러 파서가 사용하는 많은 개념을 사용합니다. 그것은 확실히 체크 아웃 할만한 가치가 있습니다.

0

나는 Kornel에 동의합니다.이 질문은 너무 광범위합니다.RDF와 OWL이 좋은 시작점이 될 수있는 의미 체계에 대해 이야기하고있는 것처럼 보입니다. 마크 업을 사용하여 모델링 의미론을 읽고 거기에서부터 작업 할 수 있습니다.

+0

RDF와 비교하면 더 익숙하지 않은 OWL보다 더 간단한 접근 방법을 선호합니다. – Joe