2012-04-24 4 views
2

나는 사용자가 HTML 페이지의 텍스트 또는 컨텐트를 일본어로 업로드 한 다음 커서를 사용하여 텍스트/컨텐트의 단어를 선택하여 영어로 번역 할 수있는 프로젝트를 진행 중이다. 그러나이 기능을 PDF 파일로 확장 할 수 있기를 바랍니다. 기본적으로 사용자가 PDF 파일을 제출하고 브라우저에서 해당 PDF 파일을 렌더링하게하여 사용자가 PDF에서 단어를 선택/강조 표시 할 때 브라우저가 어떻게 든 PDF의 텍스트를 중계 할 수있게하고 싶습니다. 강조 표시된 섹션은 자바 스크립트를 통해 PHP 변수로 전달됩니다.PHP - PDF에서 사용자가 선택한 텍스트를 읽는 문제를 해결하려면 어떻게해야합니까?

비슷한 질문을하는 stackoverflow에 대한 게시물이 많이 있다는 것을 알고 있습니다. (시간을 들여서 정렬 해 보았습니다!) 그러나 이것이 가능한지에 대한 확실한 답을 찾지 못하는 것 같습니다. . PDF로 HTML을 변환하거나 PDF에서 텍스트를 추출하는 옵션이 많이 있지만, 솔직히 말해서 이러한 옵션 중 어떤 것이 내가 성취하려고하는 것과 관련이 있는지 혼란 스럽습니다. 그리고 어도비 용 자바 스크립트 API가 있다는 것을 알고 있지만 자바 스크립트를 PDF에 이미 임베드해야한다는 인상을 받고 있습니다. 사용자가 자신의 PDF 파일을 업로드하여 업로드하는 경우에는 사실이 아닙니다. 가능한 경우에도 Adobe 자바 스크립트 API에는 기본 텍스트 선택 지원이없는 것 같습니다.

이렇게하는 간단한 해결 방법은 있습니까 (모근?)? 다시 말하지만 PDF에서 선택한 텍스트를 변수에 전달할 수 있기를 원합니다. 사용자가 모르는 단어를 하이라이트하여 해당 단어를 사전에 검색 할 수 있도록 단어 은행에 추가 할 수 있습니다.

내가 무엇이 더 명확 할 수 있는지 알려주세요. 고맙습니다!

답변

0

가장 좋은 방법은 PDF를 HTML (this answers 참조)로 변환 한 다음 일반 HTML에 대해 이미 모든 것을 구현 했으므로 이미 설정되어 있다고 생각합니다.

+0

그래, 아마도 이상적인 해결책 일 것입니다. 그러나 문제는 내가 변환하는 동안 일본어 글꼴을 처리 할 수있는 라이브러리를 모두 쓰레기로 뒤죽박죽으로 찾지 않는 것입니다. 이를위한 해결책이 있습니까? 아니면 영어 PDF 텍스트를 HTML로 변환 할 수있는 능력이 궁극적으로 제한되어 있습니까? – braunsg

+0

저는 PDF에서 변환을한지 얼마되지 않았습니다. 심지어 일본어를 다루지 않았습니다. 그러나 추측하면 다음 중 하나가 누락되었습니다. 변환 라이브러리가 UTF8을 지원하지 않거나 일본어를 표시 할 수있는 글꼴을 가지고 있지 않습니다. –

+0

음, 음. UTF8 자체에 대한 기본 지원이 계속 실행되고 있다고 생각합니다. 어쩌면 이것이 가능하지 않을 수도 있습니다 ... 나는 그 일에 대해 다른 생각을해야합니다. – braunsg

관련 문제