2012-09-05 4 views
0

Apache Tika는 텍스트 추출기라는 것을 알고 있습니다. 그것은 doc, pdf, ppt 및 기타 많은 파일 형식에서 텍스트를 추출 할 수 있습니다. 이제 ios에서이 기능이 필요합니다. 그래서 iOS 용 Apache Tika에 대한 대안이 있는지 알고 싶습니다.Apache Tika iOS 용 대안

ios 용 라이브러리가 없으면 지정된 파일 형식을 추출 할 수있는 도구를 알려줄 수 있습니다.

미리 감사드립니다.

답변

2

libopc docx, xlsx, pptx에서 텍스트를 추출합니다.

Antiword (구 MS 형식)

You can extract strings from a PDF using CoreGraphics also 및 도 PDFiPhone을 사용합니다.

HTML 문서에서 텍스트를 추출하려면, NSXMLParser을보십시오.

+0

답장을 보내 주셔서 감사합니다. 그것은 매우 유용합니다. 또한 iwork 파일 (페이지, 기조 연설, 번호)에서 텍스트를 추출하는 방법을 알고 싶습니다. 힌트 좀 줄 수있어? – jjyao