1

동일한 사건에 관한 두 개의 기사가 있지만 문법적으로나 논리적으로 다른 기사가 같거나 다른 경우 어떻게 말 할 수 있습니까?How do you say 서로 다른 출처에서 동일한 사건에 대한 기사가 AI를 사용하여 동일합니까?

예 :

사례 1 :

  • 제 1 조 (뉴스 소스 1) : 미국의 무역 적자가 상승이 재정

  • 제 2 조 (뉴스 소스 2) 상승하는 미국 무역 적자

결과 :

  • 제 1 조 (뉴스 소스 1) : 모두 같은

    사례 2있는 하버드는 올해 어린 학생들이있다.

  • 제 2 조 (뉴스 출처 2) : 올해 하버드 대학의 입학이 어려워졌습니다.

결과 : 서로 다릅니다.

전체적으로 단어가 일치하지 않지만 전체적으로 우리가 의미를 비교할 수 있다면 더 나아질 것입니다. 어떤 인공 지능 개념을 사용하고 누구에게도 동일한 정보를 공유 할 수 있다면 도움이 될 것입니다. Natural Language Processing이 도움이 될 것이라고 들었습니다. 도와주세요!!

추신 : 동일한 오픈 소스 API가 있는지 알려주세요.

+0

http://stackoverflow.com/questions/9540315/mysql-find-how-different-two-text-fields-are – hsmit

답변

1

시작하려면 the Levenshtein distance 또는 edit distance을보십시오. 두 개의 문자열 (또는 텍스트)이 '다른'방법에 대한 측정 값을 만드는 데 도움이 될 수 있습니다.

더 높은 수준의 비교를 위해서는 실제로 의미를 고려해야합니다. 나는 WordNet이 단어의 의미에 접근 할 수 있다고 생각한다. 이것은 단어를 비교하는 데 도움이 될 수있다. see example

+0

감사합니다 ... WordNet이 내 목적을 달성한다고 생각합니다 .Is 이 비슷한 API가 있습니까? – sathish

+0

@ user2513500 : http://www.princeton.edu/wordnet/related-projects/ – hsmit

관련 문제