2009-08-29 3 views
0

기존 PDF 파일을 읽고 텍스트뿐 아니라 글꼴 (굵게, 기울임 꼴 ...) 및 단락과 같은 형식 정보를 가져오고 싶습니다. 이 일을하기위한 코드 라이브러리는 오픈 소스인가 상업인가?모든 형식 정보가있는 기존 PDF 파일 읽기

나는 Windows에 있으며 C# 라이브러리를 선호하지만 C/C++도 허용됩니다.

+0

어떤 언어입니까? 환경? –

답변

1

난 아주 많이 pdflib (http://www.pdflib.com/)을 추천 할 수 있습니다. 상업용이지만 자유롭게 개인적으로 사용할 수있는 라이트 버전도 있습니다. 그것은 매우 muach 기능이 포함되어 있으며 모든 plattforms 사용할 수 있습니다.

0

저는 Mr. Meyers에게이 사실을 알려줍니다. 그들 중 다수가있는 것처럼 보입니다. 좋아하는 검색 엔진에서 "pdf parser library"(귀하의 언어 포함)를 검색하십시오.

몇 최고 히트 :

http://www.lowagie.com/iText/

http://metacpan.org/pod/PDF::Parse

http://podofo.sourceforge.net/

http://www.vicman.net/download/13733/ (.NET에 대한 몇 가지) 기존 편집하고자하는 경우 있음을

주 PDF를 읽을 수 있습니다.

http://1t3xt.info/tutorials/faq.php?branch=faq.pdf_in_general&node=replace_word

+0

감사합니다. TrueWill, 필자는 전에 검색 한 결과 파싱 할 때 강력하지는 않지만 PDF를 만드는 데 강력한 능력이있는 것으로 나타났습니다. 경험이 많은 사람들로부터 약간의 조언을 얻기를 바랍니다. 너무 오랜 시간을 보내지 않고 올바른 방향으로 이동할 수 있기를 바랍니다. 모든 해당 도서관을 평가하십시오. –

+0

그리고 추천 한 기사를 읽은 후, 그런 도서관이 있다면 비관적입니다. –

0

Pdfium.Net SDK도 도움이됩니다. 이 API를 통해 텍스트, 이미지 및 기타 개체 및 해당 속성 모음에 액세스 할 수 있습니다. 이 API를 개발 한 회사에서 근무하고 있습니다.