2013-03-31 4 views
4

나는 약 80,000 개의 텍스트 파일을 가지고 있으며, 그들에 대한 고급 검색을 수행 할 수 있기를 원합니다. 두 개의 키워드 목록이 있고 첫 번째 목록에 키워드 중 적어도 하나를 포함하고 두 번째 목록에 적어도 하나를 포함하는 모든 파일을 반환하고자한다고 가정 해 봅시다. 이미 그렇게 할 라이브러리가 있으며, 존재하는 경우 다시 쓰고 싶지 않습니다.파이썬 고급 검색 라이브러리

+0

한 번 시도하거나 여러 번 수행해야합니까, 여러 번 검색 쿼리, 텍스트 파일 또는 둘 다 다를 수 있습니까? – icktoofay

+0

같은 파일에 대해 다른 목록을 여러 번 사용해야 할 것입니다. –

답변

3

문서를 여러 번 검색해야하므로 텍스트 파일의 색인을 생성하여 최대한 빨리 검색 할 수 있습니다.

자신이 확실히 가능하다 합리적인 인덱스를 구현하지만, 빠른 검색으로 저를 인도 :

는 문서를 살펴 보자. 원하는 동작을 얻는 것이 다소 바람직 할 것입니다.

0

MapReduce 유형의 검색을 사용하려는 느낌이 들었습니다. 매우 확장 성이 있어야하며 Python에는 MapReduce 패키지가 있어야합니다.