Apache PDFBox 및 Java를 사용하여 PDF를 파싱하고 PDF에서 모든 정보를 가져옵니다. 텍스트를 추출하는 것은 영어로만 잘 작동합니다. 다른 언어의 경우 일부 특수 문자 만 표시됩니다. 예를 들어, 아라비아 문자 ش를 추출하면 문자열이 "?"로 인쇄됩니다. 컴퓨터의 "지역 및 언어"를 영어에서 아랍어로 변경할 때 문제가 없습니다. 문자의 유니 코드를 추출하면이 문제를 해결할 수 있다고 생각합니다. 문제.이 문제를 해결하기 위해 PDF에서 문자의 유니 코드를 얻거나 좀 솔루션을 제안 제발 도와주세요.java 및 PDFBox를 사용하여 PDF에서 유니 코드 문자를 가져 오는 방법
3
A
답변
0
전용 문자열 이스케이프 (문자열 문자)은 문자를 uni 암호.
2
을 changing the Java system locale를 사용해보십시오. 자바 프로그램에서, 이것은 OS 설정을 변경하는 것과해야한다.
관련 문제
- 1. Java (pdfbox를 사용하지 않음)를 사용하여 pdf에서 이미지를 추출하는 방법
- 2. pdfbox를 사용하여 pdf에서 아랍어 텍스트를 표시하고 싶습니까?
- 3. Java 및 유니 코드
- 4. 유니 코드 문자를 스풀링하도록 SQLPlus를 가져 오는 중입니까?
- 5. Java 및 유니 코드
- 6. Java 문자열에서 유니 코드 문자를 어떻게 검색합니까?
- 7. excel에서 chinese 문자를 oracle로 가져 오는 방법
- 8. 유니 코드가 아닌 C++ 환경에서 아랍어 문자를 가져 오는 방법
- 9. 유니 코드 문자를 NSString으로 변환
- 10. xhtmlrenderer를 사용하여 PDF에서 아시아 문자를 렌더링하는 방법
- 11. iText, 유니 코드 문자 및 Java
- 12. iOS에서 유니 코드 문자를 찾고 표시하는 방법
- 13. fslex의 패턴에서 유니 코드 문자를 지정하는 방법
- 14. httplib을 사용하여 유니 코드 문자를 게시하려면 어떻게합니까?
- 15. PHP에서 유니 코드 문자를 검색하는 방법?
- 16. 안드로이드에서 HttpPost에서 유니 코드 문자를 보내는 방법
- 17. QString/QDebug에서 유니 코드 문자를 사용하는 방법?
- 18. richtextbox에서 vb6의 유니 코드 형식으로 텍스트를 가져 오는 방법
- 19. PDf에서 문자열로
- 20. 유니 코드 문자를 표시하는 UILabel
- 21. Java 유니 코드 작업
- 22. .NET을 사용하여 디 센더가있는 유니 코드 문자를 검색하는 방법
- 23. URLStream 및 유니 코드
- 24. 유니 코드 문자를 생성, 할당 및 인쇄하는 방법
- 25. 자바, 유니 코드 및 글꼴
- 26. 알파벳순으로 다음에 오는 유니 코드 문자를 얻는 방법은 무엇입니까?
- 27. ';'뒤에 문자를 가져 오는 방법 정규 표현식?
- 28. Ada 문자로 입력 문자를 가져 오는 방법
- 29. IE에서 유니 코드 문자를 대체하는 XRegExp
- 30. pdf에서 숨겨진 텍스트를 찾는 방법
@ ED Staub 답변을 찾았습니다. 한번 봐주세요 – Neeraj