2011-02-28 4 views
0

자바의 매우 큰 텍스트 파일에서 색인 파일을 만들고 싶습니다. 사실 인덱스 파일의 각 줄에있는 첫 번째 문자의 숫자와 바이트를 유지하려고합니다. 원본 파일에서 최대한 빨리 검색을 수행하기 위해이 파일을 사용하려고합니다.Java에서 색인 파일을 만들려면 어떻게해야합니까?

누군가가 샘플 코드로 나를 도울 수 있다면 좋을 것입니다.

+0

이 숙제입니까? –

+0

또한 [내 대답은 [이 나중에 질문] 참조 (http://stackoverflow.com/questions/5143258/how-can-i-determine-the-number-of-bytes-of-each-line-of-a- 파일 - 인 - 자바/5147316 # 5147316). –

답변

4

Apache Lucene을 확인하셨습니까?

+0

예, 전에 확인했지만이 라이브러리를 사용하는 대신 색인 파일을 만드는 또 다른 방법을 찾으려고합니다. – sylvester

0

색인 파일은 단지 매핑 워드입니다 -> 위치입니다. 간단한 문제의 경우 단어에서 파일의 단어 위치까지 Multimap을 사용하여 직접 작성할 수 있습니다.

중지 목록, 형태소 분석 및 기타 언어 처리, 사전, 사후 또는 중위 검색이 필요하면 검색 엔진을 고려해야합니다.

관련 문제