MuPDF를 사용하여 PDF에서 텍스트를 추출 할 때 마지막 줄의 텍스트가 잘립니다.

저는 MuPDF를 사용하여 PDF 파일에서 일부 텍스트를 추출합니다. 대부분의 경우 잘 작동하지만 마지막 줄은 추출되지 않거나 인쇄되지 않는 경우가 있습니다.MuPDF를 사용하여 PDF에서 텍스트를 추출 할 때 마지막 줄의 텍스트가 잘립니다.

fz_text_sheet *sheet = fz_new_text_sheet(self.ctx); 
fz_text_page *text = fz_new_text_page(self.ctx, &fz_empty_rect); 
fz_device *dev = fz_new_text_device(self.ctx, sheet, text); 

fz_page *page = fz_load_page(self.doc, pageNumber); 
fz_run_page(self.doc, page, dev, &fz_identity, NULL); 

fz_output *out = fz_new_output_file(ctx, stdout); 
fz_print_text_page_html(ctx, out, text);

이 PDF의 첫 페이지는 해당 페이지에 텍스트의 마지막 줄을 인쇄하는 데 실패합니다.

내가 잘못했거나 버그입니까?

감사합니다.

출처

2013-06-02 user2444342

fz_text_page를 안전하게 사용하려면 먼저 텍스트 장치를 해제해야합니다. 장치에 버퍼링 된 일부 항목이 해제 될 때까지 플러시되지 않을 수 있습니다.

출처

2013-06-03 13:20:03 ccxvii

생명의 은인! 실제로 fz_free_device (dev)가 문제를 해결합니다. –

MuPDF를 사용하여 PDF에서 텍스트를 추출 할 때 마지막 줄의 텍스트가 잘립니다.

답변

관련 문제