2013-05-27 3 views
1

NoSQL에 대해 배우기 시작했는데 RavenDB에 대한 좋은 예제를 찾을 수 없습니다. 아무도 Word, PDF, Excel, ... 이진 문서를 RavenDB의 첨부 파일로 추가하고 해당 문서의 내용을 검색하는 방법을 말해 줄 수 있습니까? 거기에 어떤 예가 있습니까? 그게 가능하니? 어떻게 MVC 응용 프로그램을 만들 수 있습니까?RavenDB에서 첨부 파일 검색

답변

2

먼저 NoSQL에서 "문서 데이터베이스"에 대해 이야기 할 때 Word, PDF, Excel 문서에 대해 언급하지 않습니다. 일반적으로 도메인 엔티티에서 직렬화 된 특정 데이터를 나타내는 JSON 형식의 문서에 대해 이야기하고 있습니다. 대다수의 RavenDB는 이러한 종류의 데이터 작업에 초점을 맞추고 있습니다.

그러나 실제로 말하는 문서 종류로 작업 할 수 있습니다. 내장 된 무언가가 아니라 부가 기능 인 "번들"로 끝났습니다.이 기능을 "색인 첨부물 번들"이라고하며 필자는이를 작성했습니다. 소스 코드는 here입니다. 또한 어떻게 사용할 수 있는지 보여주는 단위 테스트가 있습니다. 예를 들어 this test을 참조하십시오. 검색 결과를 강조 표시하려면 this test을 참조하십시오.

번들은 Windows IFilters을 사용하여 이진 문서에서 텍스트를 추출합니다. 로컬 시스템에 설치하려는 문서 유형에 적절한 IFilter가 필요합니다. PDF 파일을 많이 사용하려면 the Foxit PDF IFilter을 적극 권장합니다. Adobe보다 훨씬 빠르고 빠릅니다. Word 및 Excel 문서로 작업하는 경우 Microsoft의 Office IFilter가 필요합니다. x86 또는 x64Service Pack을 다운로드하십시오.

적절한 IFilter를 설치하면 RavenDB에 첨부 파일을 업로드하기 만하면됩니다. 번들은 업로드를 가로 채고, IFilter로 내용을 추출하고, 내용을 JSON 문서에 저장하고, 쉽게 찾을 수 있도록 해당 문서의 색인을 생성합니다.

Nuget here에서 번들의 컴파일 된 버전을 얻을 수도 있습니다. dll은 RavenDB 서버의 plugins 디렉토리에 있어야합니다.

현재이 번들을 사용하는 응용 프로그램이나 웹 사이트의 전체 종단 간 샘플을 가지고 있지 않습니다. 이 번들에 대한 문서가 없으므로 단위 테스트를 반드시 읽으십시오.

일반적인 첨부 파일에 대한 정보가 필요하거나 인덱싱이나 검색이 아니라 첨부 파일이 필요하면 RavenDB documentation을 읽어야합니다.

+0

도움을 주셔서 대단히 감사합니다. 나는 RavenDB가 제공 할 수있는 모든 것을 배우기위한 전자 책이 없거나 아직 찾지 못했다고 생각합니다. – mrakodol

+0

다른 작가의 책이 여러 권 있는데, 아직 책을 읽지 않은 책은 없습니다. 그러나 당신이 어떤 것을 발견 할 지 확신하지 못합니다. –