2011-03-22 4 views
0

웹 사이트에서 데이터를 긁어 모을 응용 프로그램을 개발 중입니다. page_url, site_url, last_modified와 같은 세부 정보는 데이터베이스에 저장되고 page_content는 파일에 저장됩니다. 나중에 파일의 내용을 검색하려고합니다. 나는 이것을 달성하기 위해 Thinkingsphinx에 노력하고 있습니다. 어떤 신체가 그것을 구현하는 방법을 알고 있습니까?SPHINX/ultrasphinx로 파일 인덱싱

답변

1

저는 Sphinx/ThinkingSphinx가 데이터베이스와의 대화를 목적으로한다고 생각하지 않습니다. http://groups.google.com/group/thinking-sphinx/browse_thread/thread/69cdc1c8e1c096ff/aa4ae8e21c42e67c?lnk=gst&q=files#aa4ae8e21c42e67c

+0

당신이 나에게 좋은 솔루션을 제안 할 수 있습니다 소리 그때? – Pravin

+0

나는 나 자신을 몰라. 나는 그 순간 주위를 잠시 둘러 보았고, 무엇이라도 발견하면 알려 줄 것이다. 나는 Solr/Sunspot이 옵션들처럼 보이지 않는다고 말할 수있다. – lebreeze

+0

스핑크스 아래의 xmlpipe 옵션은? 나는 실제로 그것을 구현하려고했지만, 방법을 얻지 못했습니다. – Pravin

0

는 대신 전체 텍스트 검색을 SOLR로 전환 할 수 없습니다 :

이 스레드를보세요? 나는 PDF 또는 워드 여기

http://lucene.apache.org/solr/tutorial.html[enter 링크 설명] 같은 경우에도 인덱스 바이너리 파일은 [1]