2011-04-30 6 views
0

나는 용어와 구문의 데이터베이스를 가지고 있습니다.
해당 용어/구문이 텍스트에 존재하는 경우 해당 용어/구문이 관련성이 있음을 알려줍니다. 그것은
http://developer.yahoo.com/search/content/V1/termExtraction.html
http://developer.zemanta.com/
온라인으로 제공이 API를 사용하여 수행하지만 결과는 내가 원하는 것을하지 않습니다 수 있습니다.
직관적으로 볼 때 매우 정교한 방법으로 처리 할 수 ​​있습니다 (리소스 집약적이지 않음)
내 문제가 있습니다. 나는 급속히, 매우 낮은 리소스 스트레인 (CPU 및 메모리)으로이를 수행하는 방법을 생각할 수 없다.
용어/구문은 수백만 개이며, 텍스트 문자열도 마찬가지다. 내가 익숙한 언어는 PHP 뿐이다. 제안 해 주셔서 감사합니다.텍스트의 용어/문구 검색

답변

0

lucene을 사용하여 문서에서 용어를 추출하고이를 데이터베이스에 일치시킬 수 있습니다. 내가 아는 한 lucene 용 PHP/Zend API/Port가 있습니다.

java에서 lucene을 사용하여 이와 유사한 작업을 수행하는 방법에 대한 비슷한 질문이있었습니다. 올바른 방향으로 안내해야합니다. Effective search on a small text