나는 pdf 리더를 개발 중입니다. 나는 pdf에있는 어떤 끈든지 찾아 내고 대응 페이지 번호를 알고 싶다. iTextSharp를 사용하고 있습니다. 이 같은C에서 #에서 pdf 파일의 문자열의 페이지 번호를 찾으십시오
4
A
답변
1
뭔가 작업을해야합니다 :
// add any string you want to match on
Regex regex = new Regex("the",
RegexOptions.IgnoreCase | RegexOptions.Compiled
);
PdfReader reader = new PdfReader(pdfPath);
PdfReaderContentParser parser = new PdfReaderContentParser(reader);
for (int i = 1; i <= reader.NumberOfPages; i++) {
ITextExtractionStrategy strategy = parser.ProcessContent(
i, new SimpleTextExtractionStrategy()
);
if (regex.IsMatch(strategy.GetResultantText())) {
// do whatever with corresponding page number i...
}
}
1
현재 페이지 번호를 찾을 수 Acrobat.dll
을 사용할 수 있습니다 Itextsharp
을 사용하려면. 우선은 pdf 파일을 열고이 PDF 파일에있는 문자열이 다음 커서가 특정 페이지로 이동하고 검색 문자열이 강조 될 경우 문자열 usingL
Acroavdoc.open("Filepath","Temperory title")
및
Acroavdoc.FindText("String").
검색 . 이제 Acroavpageview.GetPageNum()
을 사용하여 현재 페이지 번호를 가져옵니다.
Dim AcroXAVDoc As CAcroAVDoc
Dim Acroavpage As AcroAVPageView
Dim AcroXApp As CAcroApp
AcroXAVDoc = CType(CreateObject("AcroExch.AVDoc"), Acrobat.CAcroAVDoc)
AcroXApp = CType(CreateObject("AcroExch.App"), Acrobat.CAcroApp)
AcroXAVDoc.Open(TextBox1.Text, "Original document")
AcroXAVDoc.FindText("String is to searched", True, True, False)
Acroavpage = AcroXAVDoc.GetAVPageView()
Dim x As Integer = Acroavpage.GetPageNum
MsgBox("the string found in page number" & x)
관련 문제
- 1. 페이지 번호를 페이지 목록에서 찾으십시오.
- 2. C 코드를 사용하여 파일의 inode 번호를 찾으십시오.
- 3. 프로그래밍 방식으로 PDF 파일의 텍스트를 검색하고 페이지 번호를 알려주십시오.
- 4. 는 C#에서 파일의 항목에 번호를 할당
- 5. 페이지 번호를 사용하여 다른 PDF에서 PDF 생성
- 6. ID 열에없는 번호를 찾으십시오.
- 7. 문자열의 시작 부분을 찾으십시오.
- 8. C에서 PDF 읽기 #
- 9. PHP를 사용하여 PDF 파일의 페이지 추출하기
- 10. pdf 문서 (itextsharp)에 페이지 번호 추가
- 11. PDF 파일의 <! - FTCACHE-1-> 문자열의 의미는 무엇입니까?
- 12. PDF 파일의 CUPS 인쇄
- 13. C에서 문자열의 형식을 확인해야합니다.
- 14. C에서 문자열의 공백 제거 #
- 15. C에서 문자열의 문자 바꾸기
- 16. PDF 파일의 텍스트 검색
- 17. 밑줄로 쓰여진 PDF 페이지
- 18. C에서 현지화 문자열의 새 라인
- 19. 파일의 버전 번호를 바꿉니다.
- 20. 에서 TableLayoutPanel 컨트롤을 찾으십시오.
- 21. 자바에서 PDF 파일의 글꼴 크기 분석하기
- 22. C에서 변환을 수행하는 Pdf #
- 23. Objective-C에서 PDF 생성
- 24. C++에서 nsITreeView 구현 샘플을 찾으십시오.
- 25. PDF 부품 번호를 링크로 변환
- 26. 두 HTML 파일의 차이점을 찾으십시오.
- 27. 바자와 파일의 특정 변경을 찾으십시오.
- 28. Sqlite3와 Xcode, Objective-C에서 테이블 이름을 찾으십시오
- 29. 배열의 요소 및 모양 번호를 찾으십시오.
- 30. BST에서 레벨이있는 일부 자릿수로 주문 번호를 찾으십시오.
모든 페이지에서 텍스트를 추출해야합니다. PdfTextExtractor, http://stackoverflow.com/a/4893285/231316 –