2012-11-27 4 views
1

내가 줄에 PDF 파일 라인을 읽고 싶어하지만 난itextsharp 및 PDF

가 ¿ 내가 itextsharp하여이 작업을 수행 할 수 있습니다 자신의 원래 형식으로 유지하려면?

내가 다음 코드를 사용합니다

private void button1_Click(object sender, EventArgs e) 
     { 

      string text = string.Empty; 
      string path = string.Empty; 
      path = "C:\\Documents and Settings\\Rafael\\Desktop\\Imprimiendo\\Print1.pdf"; 
      PdfReader reader = new PdfReader(path); 

      for (int page = 1; page <= reader.NumberOfPages; page++) 
      { 
       text = PdfTextExtractor.GetTextFromPage(reader, page); 
       richTextBox1.Text = text; 

      } 
      reader.Close(); 
      return; 
     } 

덕분에, 당신이 작은 데이터를 PDF 파일을 읽고 싶다면 난 정말 당신의 도움이

+0

당신이 무엇을 의미합니까 줄에 PDF 파일 라인을 읽어? 그리고 유지하고자하는 형식은 무엇입니까? 샘플 코드에서 텍스트 추출 만 사용하는 텍스트 추출기를 사용합니다. 특히 형식 정보가 없습니다. 오래 전부터 rich text extraction strategies에 대한 이야기가있었습니다 .... – mkl

+0

pdf 파일을 읽을 필요가 있지만 원래 형식으로 읽으려면 도움이 필요한 이유를 itextsharp thats에 많이 알지 못합니다. –

+0

'형식' 너 무슨 뜻이야? 글꼴 및 스타일 정보를 의미합니까? 또는 단어의 순서를 의미합니까? 예 : 여러 칼럼 텍스트를 존중합니까? – mkl

답변

1

필요 iTextsharp가 최선의 선택이 될 것입니다, 당신은 할 수있다 여기에 답을 찾기 :

Reading PDF content with itextsharp dll in VB.NET or C#

을하지만, 당신이 당신의 PDF 파일에 엄청난 데이터가있는 경우, iTextsharp이 작업을 실현에 문제가있는 것입니다. 이 경우 제 3 자 라이브러리가 필요할 수 있습니다. 이 문서는 당신에게 많은 도움이 될 수

Read PDF file in C#

+0

호프가 도움이되기를 바랍니다. –