Objective-C의 PDF 페이지에서 텍스트를 가져 오는 방법은 무엇입니까?PDF 페이지에서 텍스트를 가져올 수 있습니까?
2
A
답변
2
iOS 또는 OS X 용입니까? OS X의 경우 Automator 워크 플로를 생성하여 텍스트를 추출하고 앱에서 해당 워크 플로를 호출 할 수 있습니다. Automator는이 목적을 위해 PDF 작업 "PDF 텍스트 추출"기능을 제공합니다. Automator framework을 사용하면 앱에서 자동화 작업을 호출 할 수 있습니다. 그리고 일부 샘플 코드는 http://rogueamoeba.com/utm/2005/06/03/에서 찾을 수 있습니다 (실제 코드는 Automator 프레임 워크를 사용하도록 업데이트되었습니다).
4
먼저 PDF 파싱을 위해 "빠른 & 더티 (dirty)"솔루션을 포기하면 비참하게 실패합니다. 동료는 iOS에서이 문제를 올바르게 해결하기 위해 많은 시간을 보냈습니다. 그의 상위 3 개 (품질, 내림차순) 옵션 :
- muPDF (http://www.mupdf.com/) 훌륭한 라이브러리 - 추출이 잘됩니다. GPL은 당사의 독점적 인 응용 프로그램에 대한 쇼 스토퍼이지만 GPL 라이센스를 받았습니다.
- CGPDFScanner을 기반으로하는 수제 솔루션. 이 작업을 수행하는 방법에 대한 간단한 설명을 참조하십시오. here. 이 접근 방식의 가장 큰 문제점은 SDK 자체입니다. PDF 용 Apple API는 제한적이며 심하게 제한되어 있습니다. 예를 들어 2D 공간에서 추출 된 텍스트 블록을 배치해야합니다. PDF에서 드로잉 순서가 텍스트 흐름과 일치하는지, iOS SDK가 여기에 도움이되지 않을지를 보장하지 않기 때문입니다.
- Poppler (http://poppler.freedesktop.org/)는 괜찮습니다. 그러나 텍스트 추출의 경우 두 번째 옵션 (대다수의 추가 종속성 포함)과 대략 동일합니다.
Mac OS X에서는 더 많은 옵션이있을 수 있지만 잘 모르겠습니다.
+1
muPDF는보기 전용입니다. – Jamil
관련 문제
- 1. 웹 브라우저에서 텍스트를 가져올 수 있습니까?
- 2. pdf 페이지에서 Zend_Pdf를 사용하여 텍스트를 추출하는 방법
- 3. 프로그래밍 방식으로이 페이지에서 이미지를 가져올 수 있습니까?
- 4. Facebook 페이지에서 데이터를 가져올 수 있습니까?
- 5. textBlock에서 렌더링 된 텍스트를 가져올 수 있습니까?
- 6. xml이 클립 보드 텍스트를 가져올 수 있습니까?
- 7. OS X에서 _all_ 렌더링 된 텍스트를 가져올 수 있습니까?
- 8. 브라우저에서 젠드 PDF 쇼를 가져올 수 없습니다
- 9. 바이너리 데이터로 PDF 파일을 가져올 수 없습니다
- 10. ASPX 페이지에서 PDF 생성
- 11. XML 노드에서 텍스트를 가져올 수 없습니다.
- 12. 어떤 사용자의 Facebook 페이지에서 전체 이름과 그림을 가져올 수 있습니까?
- 13. 자바 스크립트를 사용하여 웹 페이지에서 데이터를 가져올 수 있습니까?
- 14. 다른 페이지의 프레임에있는 페이지에서 컨트롤을 가져올 수 있습니까?
- 15. C#이 정보를 어떻게 가져올 수 있습니까? HTML 페이지에서
- 16. dojo는 전체 페이지에서 모든 이벤트를 가져올 수 있습니까?
- 17. Python BeautifulSoup - 페이지에서 X 개의 링크를 가져올 수 있습니까?
- 18. 한 페이지에서 양식으로 특정 HTML을 다른 양식으로 가져올 수 있습니까?
- 19. 다운로드하지 않고 웹 페이지에서 PDF 파일을 볼 수 있습니까?
- 20. asp.net 페이지에서 pdf 페이지보기
- 21. extjs 4에서 열 헤더 텍스트를 가져올 수 있습니까?
- 22. C#에서는 어떤 소프트웨어에서든 선택한 텍스트를 어떻게 가져올 수 있습니까?
- 23. DIV 뒤에 단락 안쪽에서 jQuery를 사용하여 텍스트를 가져올 수 있습니까?
- 24. 어떻게하면 클라이언트 측에서 rad 편집기로 텍스트를 가져올 수 있습니까?
- 25. jQuery를 사용하여 어린이가있는 요소 내부의 텍스트를 가져올 수 있습니까
- 26. 대체 된 텍스트를 preg_replace로 어떻게 가져올 수 있습니까?
- 27. javascript : charAt 함수를 사용하여 선택한 텍스트를 가져올 수 있습니까?
- 28. SqlParameters를 사용하여 SqlCommand의 구문 분석 된 텍스트를 가져올 수 있습니까?
- 29. 원격 응용 프로그램 StatusBarWndClass에서 셀 텍스트를 가져올 수 있습니까?
- 30. 온라인 .txt 파일에서 bash를 통해 텍스트를 가져올 수 있습니까?
중복 질문입니다. http://stackoverflow.com/questions/3287635/how-to-parse-pdf-in-objective-c-for-ipad – Avi
그래서 대답은 어디에 있습니까? – demon9733
@Avram 그 질문은 PDF에서 텍스트 추출과 아무런 관련이 없습니다. – hoha