두 개의 pdf 파일이 있습니다. Sercurity 탭의 두 파일 모두 보안 방법 : 보안 없음 및 문서 어셈블리 : 허용되지 않음과 페이지 추출 : 허용되지 않음을 설정했습니다. 다른 항목도 허용됩니다. 내가 PDF에서 텍스트를 검색 할 STANDART ITextSharp 방법을 사용하여 :C에서 ITextSharp의 PDF에서 텍스트를 읽을 수 없습니다
PdfReader pdfReader = new PdfReader(fileName);
for (int page = 1; page <= pdfReader.NumberOfPages; page++)
{
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy(); //LocationTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
text.Append(currentText);
을 첫 번째 파일에서 나는 텍스트를 검색 할 수 없습니다 두 번째 파일에서 문제 wihtout currentText를 얻을 수 currentText가 비어 있습니다. LocationTextExtractionStrategy로 시도했지만 결과는 같습니다. SodaPDF에서이 파일을 열어 txt 파일로 변환했지만이 파일도 비어 있습니다 (frist 파일은 문제없이 txt로 변환됩니다). C#이나 다른 응용 프로그램에서이 파일의 텍스트를 읽을 수 있습니까? Adobe Reader를 구입하면이 파일을 txt로 변환합니까? 두 파일의 차이점은 무엇입니까?
감사합니다.
가능하면이 두 파일을 사람들이 체크 아웃 할 수 있도록하십시오. –
Adobe Reader에서 텍스트를 복사/붙여 넣기 할 수 있습니까? 그렇지 않은 경우 텍스트를 OCR하지 않는 한 어떤 소프트웨어로도 추출 할 수 없습니다. –
Pdf 파일 https://jumpshare.com/b/GRUHz0e1iXRPRpgL6nHE – Robert