2013-08-26 5 views
1

나는 데이터베이스에 저장하고 싶습니다 1500 만 개 단어의 신체가의 코퍼스에서 단어의 문장을 찾고 있습니다. 그러면 주어진 단어, 해당 코퍼스 내에서의 컨텍스트를 찾을 수 있기를 바랍니다. 예를 들어, 단어를 "친구"나는 선택 다섯 개 단어 전에 각각의 "친구"후도 나는 다음을 선택할 수 있습니다 : 최고의 내가 효율적으로 제공하기위한 선택 내 데이터베이스를 구성 할 수 있습니다 방법1500 만 개 단어

... night i went to my FRIENDS house for a cup of tea ... 
... what did you say my FRIENDS cat is sick and ... 
... if you like my FRIENDS dad can pick you up ... 

그런 식으로 단어? 나는 보통 데이터베이스가 필요할 때 sqlite를 사용하지만이 경우에는 다른 것이 더 좋다.

+0

[전체 텍스트 검색] (http://en.wikipedia.org/wiki/Full_text_search)을 구현하고자하는 것 같습니다. 데이터베이스가 최선의 선택이 아닐 수도 있습니다. –

답변

1

코퍼스에서 단어를 찾으려면 전체 텍스트 검색 기능이 필요합니다. SQLite는 실제로 확장 기능과 같은 기능을 제공합니다. 설명은 here입니다.

전체 텍스트 검색은 주어진 쿼리와 일치하는 문서을 반환 할 것입니다. 먼저 코퍼스를 별도의 문서로 분리해야합니다. 일반적으로 이것은 매우 쉬운 작업입니다. 문서는 전자 메일, 고객 서비스 기록 또는 의사 노트 또는 보고서 등일 수 있습니다. 그러나 귀하는 귀하가 소송 한 서류가 무엇인지 설명하지 않습니다.

SQLite의 전체 텍스트 확장 기능에 익숙하지 않습니다. 전체 텍스트를 지원하는 MySQL과 같은 다른 데이터베이스 솔루션을 고려해보십시오.