2011-03-19 6 views
0

내가 입력 한 로그 레코드를 enterprice networks에서 캡처해야합니다. 현재 구현 된 모든 프로토콜에는 연도/mont/day/lucene 파일로 색인 파일이 있습니다. 하나의 단일 lucene 색인 파일 만 사용하는지 알고 싶습니다. 매일이 파일 하나를 업데이트하여이 효과 검색 시간을 어떻게 계산합니까? .is 그것은 상당한 증가, 현재 sitiuation 때 내가 그날 exacly 쿼리 오전 검색. 현재 : SMTP/년/월/AY/luceneindexlucene 파일 인덱스

내가 SMTP/luceneindex에게 나를 요소의 전체 범위에 따라 prons과 단점

+0

Sawmill이나 AWStats와 같은 로그 분석 응용 프로그램이 아닌 Lucene이 필요한 이유는 무엇입니까? – allnightgrocery

답변

1

을 알고있는 하나의 file.Let의 모든 IDEX을합니다.

단일 lucene 파일을 말할 때? Lucene은 여러 유형의 파일을 사용하여 색인을 저장하고 세그먼트를 가지고 있으므로 어쨌든 하나 이상의 파일이 있습니다.

무엇을 어떻게 로그 데이터에 인덱싱합니까?

lucene 인덱스 solr, elasticsearch, custom을 통해 쿼리 할 때 무엇을 사용합니까?

단일 인스턴스, 단일 시스템 구성을 실행하고 있습니까?

별도의 호스트에서 여러 프로세스를 실행할 수 있으며 일부는 검색 작업에 사용하고 다른 프로세스는 인덱스 업데이트에 사용할 수 있습니까?

이러한 일반적인 경우와 같은 일반적인 검색어는 무엇입니까?

분산 검색 옵션은 http://elasticsearch.org/ 또는 http://lucene.apache.org/solr/입니다.

lucene에는 RAMDirectory와 같은 메모리에서 실행할 수있는 옵션이 있습니다. 조사하고 싶을 수도 있습니다.

1 일 파일의 크기가 관리에 문제가 있습니까? 파일 크기가 디스크에 비해 너무 커지므로 복사, 이동으로 인해 문제가 발생할 수 있습니다.