2014-10-13 1 views
0

저는 Apache Lucene을 사용하여 검색 최적화를 위해 트위터 데이터에 대규모 인덱싱을 구현하는 프로젝트를 진행하고 있습니다. Lucene은 역순 인덱스를 제공하여 지정된 선택 기준과 일치하는 블록을 필터링합니다.Apache Lucene을 사용한 검색 최적화

이 프로젝트를 구현하려면 어떻게해야합니까? - Cloudera VM을 설치하고 진행해야합니까? 또는 우분투 플랫폼에 Apache에서 Hadoop을 배포해야합니까?

내가 이것을 묻는 이유는 Cloudera가 Lucene을 사용하여 검색을 최적화했는지 확인할 수 없기 때문입니다.

알려 주시기 바랍니다.

답변

1

Cloudera는 자동 설치 및 클러스터 관리를위한 데비안 패키지와 소프트웨어를 제공합니다. 그게 전부 야. Hadoop 스택에는 검색 (및 최적화) 기능이 없습니다. 따라서 프로젝트를 위해 바닐라 또는 클로 데라 중 하나를 선택할 수 있습니다.

검색시 Elasticsearch를 사용할 수 있습니다. 그것은 integration with hadoop이고 내부적으로 Lucene을 사용합니다.