2011-11-01 2 views
1

필자의 요구 사항은 동일한 폴더에있는 둘 이상의 MS 단어 또는 MS Excel 파일의 내용을 검색하는 것입니다. 어떻게 자바 기술을 사용하여 구현할 수 있습니까? pls 내게 개요를 제공합니다. 당신은 할 수 있습니다자바를 사용하여 Ms-word 파일의 내용 검색

감사

답변

1

쉽게 마이크로 소프트 워드 파일의 내용을 추출하고 텍스트를 검색 할 Apache Tika를 사용할 수 있습니다에

을 참조하십시오.

샘플 코드 -

File f = new File("path to file"); 
FileInputStream is = new FileInputStream(f); 
ContentHandler contenthandler = new BodyContentHandler(); 
Metadata metadata = new Metadata(); 
metadata.set(Metadata.RESOURCE_NAME_KEY, f.getName()); 
Parser parser = new AutoDetectParser(); 
parser.parse(is, contenthandler, metadata); 
System.out.println(metadata.get(Metadata.TITLE)); 
System.out.println(contenthandler.toString()); 

당신은 내용입니다 contenthandler.toString()를 통해 검색 할 수 있습니다.

+0

감사합니다. Jayendra. 귀하의 정보가 제 요구 사항에 매우 유용 할 것입니다. –

관련 문제