저는 Apache Lucene을 사용하여 검색 최적화를 위해 트위터 데이터에 대규모 인덱싱을 구현하는 프로젝트를 진행하고 있습니다. Lucene은 역순 인덱스를 제공하여 지정된 선택 기준과 일치하는 블록을 필터링합니다.Apache Lucene을 사용한 검색 최적화
이 프로젝트를 구현하려면 어떻게해야합니까? - Cloudera VM을 설치하고 진행해야합니까? 또는 우분투 플랫폼에 Apache에서 Hadoop을 배포해야합니까?
내가 이것을 묻는 이유는 Cloudera가 Lucene을 사용하여 검색을 최적화했는지 확인할 수 없기 때문입니다.
알려 주시기 바랍니다.