2013-06-21 2 views
0

매우 이상한 문제가있어서 아마존 EC2 인스턴스에서 무슨 일이 일어날 지 모르겠습니다.itextSharp PDF를 Amazon EC2 인스턴스의 C# 문제에서 텍스트 파일로 변환

iTextsharp 구성 요소 (버전 5.4.1)를 사용하여 PDF를로드하고 데이터를 추출하고 출력을 문자열로 반환합니다. 내 로컬 컴퓨터에서 절대적으로 작동합니다.

하지만 Amazon EC2 인스턴스 (Windows Server 2008 R2)에 배포했을 때 작동하지 않고 오류가 발생했습니다. 다음과 같이 로그 파일에 오류를 캡처했습니다.

java.io.IOException: Error: End-of-File, expected line 
iTextSharp.text.exceptions.InvalidPdfException: PDF header signature not found 

내 코드가 아래에 있었고 도움이나 제안이 정말 감사 할 것입니다.

FileInputStreamPDFFilePath에 만들기 :

public static string parseUsingPDFBox(string PDFFilePath) 
{ 
     PdfReader reader = new PdfReader(PDFFilePath); 
     StringWriter output = new StringWriter(); 

     for (int i = 1; i <= reader.NumberOfPages; i++) 
      output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy())); 

     reader.Dispose(); 
     return output.ToString(); 
} 

나는 EC2 인스턴스 다음과 같이 디버깅하십시오 닷넷 프레임 워크 4.0

답변

0

를 사용하는 모든 관리자 권한을했습니다.

이 스트림의 bytes을 배열로 읽습니다.

첫 번째 5 바이트를 확인하십시오.

로컬 시스템에

, 그들은 '%', 'P', 'D', 'F', '-'이야.

Amazon EC2 인스턴스에서는 그렇지 않습니다.

모든 내용이 잘못되었는지 확인하십시오.

+0

행운을 빌어 요 ... 나는 PDFFilePath의 바이트 [] 길이로 얻을 수 있지만 다시 몇 가지 문제가 발생합니다. – user2508802

+0

"PDFFilePath의 바이트 [] 길이로 얻을 수있다"고 할 때 당신은 무엇을 의미합니까? 나는 당신의 의견을 이해하지 못합니다. "% PDF-"로 시작하는 바이트 배열로 PDF를 가져올 수 있습니까? –

관련 문제