매우 이상한 문제가있어서 아마존 EC2 인스턴스에서 무슨 일이 일어날 지 모르겠습니다.itextSharp PDF를 Amazon EC2 인스턴스의 C# 문제에서 텍스트 파일로 변환
iTextsharp 구성 요소 (버전 5.4.1)를 사용하여 PDF를로드하고 데이터를 추출하고 출력을 문자열로 반환합니다. 내 로컬 컴퓨터에서 절대적으로 작동합니다.
하지만 Amazon EC2 인스턴스 (Windows Server 2008 R2)에 배포했을 때 작동하지 않고 오류가 발생했습니다. 다음과 같이 로그 파일에 오류를 캡처했습니다.
java.io.IOException: Error: End-of-File, expected line
iTextSharp.text.exceptions.InvalidPdfException: PDF header signature not found
내 코드가 아래에 있었고 도움이나 제안이 정말 감사 할 것입니다.
가 FileInputStream
PDFFilePath
에 만들기 :
public static string parseUsingPDFBox(string PDFFilePath)
{
PdfReader reader = new PdfReader(PDFFilePath);
StringWriter output = new StringWriter();
for (int i = 1; i <= reader.NumberOfPages; i++)
output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));
reader.Dispose();
return output.ToString();
}
나는 EC2 인스턴스 다음과 같이 디버깅하십시오 닷넷 프레임 워크 4.0
행운을 빌어 요 ... 나는 PDFFilePath의 바이트 [] 길이로 얻을 수 있지만 다시 몇 가지 문제가 발생합니다. – user2508802
"PDFFilePath의 바이트 [] 길이로 얻을 수있다"고 할 때 당신은 무엇을 의미합니까? 나는 당신의 의견을 이해하지 못합니다. "% PDF-"로 시작하는 바이트 배열로 PDF를 가져올 수 있습니까? –