2011-09-18 2 views
1

PDF 파일을 비교하기 위해 C# Windows 응용 프로그램에서 사용할 수있는 라이브러리를 찾고 있습니다. 페이지 별 pdf 비교 (예 : http://www.inetsoftware.de/other-products/pdf-content-comparer)와 관련하여 많은 도구가 있습니다. 그러나 콘텐츠 비교를 원합니다. 즉, 변경 후 모든 내용이 쉬프팅되도록하는 콘텐츠가 추가되거나 제거되면 변경된 콘텐츠가 변경된 것으로 간주되지 않기를 바랍니다.내용별로 페이지 별 PDF 비교 라이브러리

하나의 옵션은 pdf 파일에서 텍스트를 추출한 다음 Eugene W. Myers가 제안한 "O (ND) Difference Algorithm and Variation"과 같은 알고리즘을 사용하여 텍스트 비교를 수행하는 것입니다. 그러나 C#에서이 도구 또는 라이브러리를 사용할 수 있는지 궁금합니다. 이상적으로는 도구가 전체 원본 문서를 표시하고 변경 내용을 강조 표시합니다. 이 도구는 이미지 변경과 같은 다른 콘텐츠 변경도 감지합니다.

감사합니다.

+0

원하는 것은 라이브러리에 대해 정확합니다. 응용 프로그램이나 GUI 구성 요소를 원한다면 이해할 수 있지만 라이브러리는 조금 있습니다. 당신은 옳은 것을 요구하고 있습니까? – ArtB

답변

2

상업 옵션은 (또한 DocuComp라고도 함) DocsCorp compareDocs SDK http://www.docscorp.com/public/products/publicProductsDocuCompServer.cfm

그것은 콘텐츠를 기반으로 비교 솔루션입니다. 예를 들어 새로운 문단 삽입으로 인해 내용이 이동해도 모든 후속 텍스트가 '변경된'것으로 간주되지는 않습니다. 삽입 된 단락은 '삽입 됨'으로 표시되지만 후속 텍스트는 '동일'으로 간주됩니다.

PDF를 PDF로 출력하여 단일 PDF로 출력 비교. 변경 사항은 주석으로 표시됩니다 (삽입은 밑줄이 그어진 텍스트로 표시되고, 삭제는 삭제가 발생한 지점에 고정 된 PDF 주석 (노란색 스티커 메모)으로 표시됩니다). 출력은 변경 사항을 보여주는 단일 PDF 일 수 있습니다. 이는 수정 된 PDF를 기반으로합니다. 또는 두 PDF를 하나의 PDF로 나타내는 사이드 뷰를 보여줄 수 있습니다.

비교는 텍스트 기반입니다. 현재 PDF의 이미지 나 다른 그래픽 요소에 변경 사항을 표시하려고 시도하지 않습니다.

전체 공개를 위해 저는이 회사를 소유하고 있으며 일부 고용주입니다. 내 위치는 R & D VP입니다.

감사합니다. 셰인