2009-06-23 2 views
2

내 프로젝트에서 전체 검색 및 콘텐츠 목록은 Lucene에 따라 다릅니다. 나는 성능 문제에 직면하지 않고있다. 여전히이 프로젝트는 개발 단계에 있고 생산 단계에 있습니다.lucene을 과도하게 사용하면 좋습니까?

프로젝트가 큰 구조로 완료되기 전에 성능 문제를 찾아야합니다. lucene의 과도한 사용이 가능한지 여부

+10

과도한 것은 정의상 좋지 않다는 뜻입니다. http://www.merriam-webster.com/dictionary/excessive;) –

+0

몇 가지 예를 설명해야합니다.아마도 당신은 당신의 사용이 과도하다고 생각할 것입니다. 그러나 그것은 전혀 아닙니다. –

+0

혼란을 드려 죄송합니다. 전체 응용 프로그램은 Lucene 검색을 기반으로합니다. 나는 루신을 과도하게 과도하게 사용하고 있다고 생각했다. – Shashi

답변

7

예를 들어, Lucene 인덱스에 약 3GB의 텍스트가 있으며 매우 빠르게 작동합니다 (검색, 필터 및 정렬에 대한 밀리 초 응답 시간). 이 색인에는 약 30 만 개의 문서가 들어 있습니다.

희망 사항은 귀하의 우려에 대한 약간의 배경을 제공합니다. 이것은 프로덕션 환경에 있습니다.

0

과도한 것으로 정의 하시겠습니까?

응용 프로그램의 디자인이 견고하고 성능이 좋다면 걱정할 필요가 없습니다.

아마도 실제 시나리오에서 성능을 테스트하기 위해 데이터 덤프를 얻을 수 있습니다.

3

Lucene은 매우 성숙하고 설계된 기능에 대해 매우 우수한 성능을 제공합니다. 그러나 RDBMS가 아닙니다. 성능을 향상시키기 위해 수행 할 수있는 미세 조정의 양은 데이터베이스 엔진보다 더 제한적입니다. 경우

만 루씬에 의존해서는 안 : 당신은 자주 업데이트가 필요

  • 당신은 가입 질의를 할 필요가
  • 당신이 필요로하는 정교한 백업 솔루션

내가 말할 것 프로젝트가 DBA를 고용 할만큼 충분히 크다면, 하나를 사용해야합니다 ...

Perform 10 대의 서버 (4GB, 2CPU)의 400GB 인덱스에서 40GB의 lucene 인덱스를 처리 할 수 ​​있지만 더 이상 만족할만한 성능을 얻지는 못합니다. YMMV).

+1

"수용 가능한 성능"에 대해 어떻게 생각합니까? – Avi

1

지나치게 많으면 독점적입니까? 독점입니까?

Lucene의 성능은 일반적으로 매우 좋습니다. 나는 QuadCore @ 2.4GHz 2.39GHz로 내 데스크톱에서 Lucene에 대한 성능 테스트를 최근에 수행했습니다.

10MM 문서로 구성된 디스크 색인에 대해 다양한 검색 쿼리를 실행했으며 가장 느린 쿼리 (MatchAllDocs)가 1500ms 이내에 결과를 반환했습니다. 두 개 이상의 검색어가 포함 된 검색어는 약 100 밀리 초를 반환합니다.

Lucene을 위해 할 수있는 많은 성능 조정이 있으며 검색 속도가 크게 향상 될 수 있습니다.

0

우리는 유형 사전 검색을 가능하게하기 위해 lucence를 사용합니다. 이것은 입력 된 모든 문자에 대해 결과를 얻으려는 경우 lucence 인덱스에 도달한다는 의미입니다. 여러 인터페이스에서 수십 개의 텍스트 상자를 사용하고 수십 명의 직원이 불만을 제기하지 않고 매우 빠른 응답 시간을 제공합니다. (실제로 우리가 시도한 다른 유형 선행 솔루션보다 빠르게 작동합니다.)

관련 문제