itextsharp.dll해야한다 함유량. 모든 값은() Tj로 묶여 있기 때문에 모든 값을 찾는다. 그러면 resulst라는 문자열로 무엇이든 할 수있다.
string _filePath = @"~\MyPDF.pdf";
public List<String> Read()
{
var pdfReader = new PdfReader(_filePath);
var pages = new List<String>();
for (int i = 0; i < pdfReader.NumberOfPages; i++)
{
string textFromPage = Encoding.UTF8.GetString(Encoding.Convert(Encoding.Default, Encoding.UTF8, pdfReader.GetPageContent(i + 1)));
pages.Add(GetDataConvertedData(textFromPage));
}
return pages;
}
string GetDataConvertedData(string textFromPage)
{
var texts = textFromPage.Split(new[] { "\n" }, StringSplitOptions.None)
.Where(text => text.Contains("Tj")).ToList();
return texts.Aggregate(string.Empty, (current, t) => current +
t.TrimStart('(')
.TrimEnd('j')
.TrimEnd('T')
.TrimEnd(')'));
}
샘플 PDF를 제공하지 않았으므로 일반적인 질문에만 답변 할 수 있습니다. 따라서 특정 표 (또는 특정 종류의 표)를 읽으려는 경우 샘플 PDF를 제공하여 구체적인 답변을 얻을 수 있습니다. – mkl
이 게시물 및 링크를 참조하십시오. http://stackoverflow.com/a/7515625/231316 –