Apache Lucene을 사용한 검색 최적화

저는 Apache Lucene을 사용하여 검색 최적화를 위해 트위터 데이터에 대규모 인덱싱을 구현하는 프로젝트를 진행하고 있습니다. Lucene은 역순 인덱스를 제공하여 지정된 선택 기준과 일치하는 블록을 필터링합니다.Apache Lucene을 사용한 검색 최적화

이 프로젝트를 구현하려면 어떻게해야합니까? - Cloudera VM을 설치하고 진행해야합니까? 또는 우분투 플랫폼에 Apache에서 Hadoop을 배포해야합니까?

내가 이것을 묻는 이유는 Cloudera가 Lucene을 사용하여 검색을 최적화했는지 확인할 수 없기 때문입니다.

알려 주시기 바랍니다.

2014-10-13 Saurabh

Cloudera는 자동 설치 및 클러스터 관리를위한 데비안 패키지와 소프트웨어를 제공합니다. 그게 전부 야. Hadoop 스택에는 검색 (및 최적화) 기능이 없습니다. 따라서 프로젝트를 위해 바닐라 또는 클로 데라 중 하나를 선택할 수 있습니다.

검색시 Elasticsearch를 사용할 수 있습니다. 그것은 integration with hadoop이고 내부적으로 Lucene을 사용합니다.

2014-10-13 08:54:20

답변