2012-12-26 2 views
1

PDF 파일에서 일반 텍스트를 추출하여 UITextView에 표시 할 iOS 앱을 만들려고합니다. pdf 파일을 볼 수있는 PDF 리더가 아니지만 나중에 해당 텍스트에 대한 특정 작업을 수행하고자합니다. 나는 이미 많은 봤지만 아직 정확한 해결책을 얻을 수 없습니다.NSString의 PDF에서 텍스트 가져 오기

내가 이미 https://github.com/zachron/pdfiphone 를 사용하여 시도하지만 파일은 엑스 코드와 사용되지 않는 것 같다의 ARMv6 아키텍처를 사용하여 4.5

그리고 누군가가 아이폰 OS의 석영 - 2D 프레임 워크를 사용하여 일부 정확하고 비 혼란 코드를 제안 할 수 있다면 그것은 것 큰.

답변

1

Here은 PDF에서 텍스트를 추출하는 샘플 코드입니다. 도움이 되시길 바랍니다.

https://github.com/zachron/pdfiphone

아이폰을위한 PDF에서 텍스트를 얻을 수있는 라이브러리입니다.

또 다른 데모

은 당신이 열 및 iOS에서 PDF 파일을 구문 분석하는 데 필요한 모든 것을 다루고, 또한 t에게 Quartz 2D Programming Guidehis page을 확인

https://github.com/nolanbrown/Tesseract-iPhone-Demo

아래의 링크를 찾을 수 OCR technology이 사용하는 것입니다. 한 줄에 전체 텍스트를 추출 할 방법이 없으므로 간단한 작업이 아닙니다. 당신은 CGPDFScanner

두 다른 도서관

  1. https://github.com/KurtCode/PDFKitten/
  2. https://github.com/mobfarm/FastPdfKit
+0

Sir 이미 ZACHRON을 검색했지만 armv6 및 현재 XCODE 버전에서만 작동하는 코드는 armv7을 지원합니다. armv7은 해당 클래스로 컴파일하는 동안 컴파일러 문제를 제공합니다. –

+1

그럼 이미 시도한 내용으로 질문을 업데이트하고 직면 한 문제는 무엇입니까? 그럼 당신은 분명히 당신의 질문에 대한 완벽한 답변을 얻을 것입니다. –

+0

내 질문을 업데이트했습니다 ... 다른 유용한 링크를 제공 할 수 있는지 확인해보십시오. –

0

Here (Extracting text from pdf using objective-c)를 사용하여, 입력 스트림으로 데이터에 사용할 수 있고, 나는 당신의 질문과에 대한 답변을 찾을 공장. 그러나 그렇게 잘하지 내가 그것을 :(

  • 을 필요로는

행운을 빕니다.

1

이 질문은 모든 시간을 제공 그것은 나에게 하나 개의 단락을 돌려에만 아스키

  • 을 추출 할 수 있습니다 일반적으로 PDF에서 텍스트를 추출하는 것은 매우 어렵습니다 .PDF 사양은 텍스트 추출을 염두에두고 고안된 것이 아니며, 본질적으로 개별 글리프의 기하학적 배치에서 텍스트를 재구성하여 많은 작업을 수행하는 라이브러리가 있습니다. 이 도서관들은 학위가 다양합니다. 그러나 특정 PDF 문서에서는 모두 실패합니다. 실제로 일부 PDF 문서에는 글리프가 있지만 문자와 문자를 연결할 수있는 방법은 없습니다. 이러한 문서의 경우 OCR 방식을 사용하지 않으면 텍스트를 추출 할 수 없습니다.

    PDF는 PDF 문서가 모든 플랫폼에서 동일하게 렌더링된다는 점에서 이식 가능한 읽기 전용 형식으로 설계되었습니다. 그것은 그것이 무엇에 가장 좋으며 무엇을 위해 사용해야하는지입니다.

    텍스트를 편집하려면 PDF를 사용하지 마십시오.