예를 들어, 주어진 문자열 :이름의 존재를 감지하는 잘 알려진 알고리즘이 있습니까?
"Bob은 친구 Jim Smith와 낚시를했습니다."
밥과 짐 스미스는 모두 이름이지만 밥과 스미스는 모두 단어입니다. 그들이 대문자가 아니 었는지, 우리가 알고있는 문장 밖의 내용이 적다. 이름, 적어도 서양 이름의 존재를 탐지하기위한 잘 알려진 알고리즘이 있습니까?
예를 들어, 주어진 문자열 :이름의 존재를 감지하는 잘 알려진 알고리즘이 있습니까?
"Bob은 친구 Jim Smith와 낚시를했습니다."
밥과 짐 스미스는 모두 이름이지만 밥과 스미스는 모두 단어입니다. 그들이 대문자가 아니 었는지, 우리가 알고있는 문장 밖의 내용이 적다. 이름, 적어도 서양 이름의 존재를 탐지하기위한 잘 알려진 알고리즘이 있습니까?
명명 된 엔티티 인식에 대해 살펴보십시오.
http://en.wikipedia.org/wiki/Named_entity_recognition이 기사는 두 가지 좋은 구현에 대한 링크입니다.
글자가 문법 분석의 정의에 속할지 모르겠다.
위대한 링크, 많은 감사합니다! – Rhubarb
미리 계산 된 이름 목록이있는 Boyer-Moore? –
흥미 롭다. 그래서 미리 계산 된 목록에서 이름 당 한 번 Boyer-Moore를 실행하겠습니까? 나는 당신이 테스트하고있는 이름과 같은 첫 글자를 가지고있는 이름들에 대해서만 검색함으로써 비트를 최적화 할 수 있다고 생각하고, BM이 마지막 문자를 테스트하고 거꾸로 작업하도록 할 것인가? 이것은 여전히 단어 인 이름 간의 모호성을 해결하지 못합니다. – Rhubarb
문법 분석없이해야한다는 요구 사항을 제거했습니다. – Rhubarb