저는 유니 코드 인 PHP의 Ms Word Doc를 읽으려고합니다. 히브리어 나 아랍어와 같은 것들이 있습니다. 하지만 바이너리로 읽고 일부 비 장면 문자로 바뀝니다. 내가 몇 가지 샘플 코드를 봤지만 그 중 제대로 작동하지, 당신은 아랍어 및 히브리어 같은 유니 코드 문서에 어떤 경험이 있습니까? thanksPHP는 "유니 코드"MS 워드 문서를 읽습니다
0
A
답변
1
PHP의 단점 중 하나는 (적어도 최근까지는) 유니 코드를 모르는 것입니다. 일반적으로 읽는 문서가 유니 코드이고 문서가 웹 브라우저에서 끝나기를 바라는 사실을 무시함으로써 유니 코드를 처리하는 방법을 알게됩니다. PHP는 아무 것도 파괴하지 않으며 단지 신경 쓰지 않습니다.
당신이하려는 일에 따라 PHP에 유니 코드 처리를 향상시킬 수있는 몇 가지 추가 사항이 있습니다. 그 중 다중 바이트 문자열을 처리하는 mb_
문자열 함수가 있습니다.
또한 Word 문서에서 텍스트가 인코딩 된 방법을 알아야합니다. 유니 코드는 많은 형식을 지원하며 가장 널리 사용되는 가장 컴팩트 한 형식은 UTF-8
입니다. 그러나 UTF-16
및 UTF-32
도 있습니다.
관련 문제
- 1. PHP는 콘솔 출력을 읽습니다.
- 2. PHP는 링크를 읽습니다 rss
- 3. 워드 문서를 html로 캡쳐
- 4. , 나는 워드 문서를 생성하는 코드를 가지고
- 5. PHP는 zip 파일의 디렉토리에서 텍스트 파일을 읽습니다.
- 6. 워드 문서를 pdf 파일로 변경
- 7. 워드 2010을 자동화하여 문서를 생성합니다
- 8. ASP.NET을 사용하여 워드 문서를 파싱하십시오.
- 9. 줌라에서 MS 워드 문서를 작성
- 10. MFC는 파일에서 유니 코드 문자열을 문자열로 읽습니다.
- 11. vb.net에서 열린 워드 문서를 저장하는 방법
- 12. 워드 문서를 swf 뷰어로 변환하는 방법 programaticaly
- 13. 만들기 및 워드 문서를 서버에 저장
- 14. C# .NET을 사용하여 워드 문서를 저장하고 검색하려면
- 15. WCF 서비스에서 워드 문서를 만들 수 없습니다.
- 16. PHP는 대괄호로 유니 코드 문자열을 대문자로 만듭니다.
- 17. 네이티브 Win32를 사용하여 'C'에서 텍스트 파일 (유니 코드)을 읽습니다.
- 18. PHP는
- 19. PHP는
- 20. asp.net을 사용하여 워드 문서를 열고 편집하고 저장할 수 있습니까
- 21. 워드 문서를 만들고 .NET 응용 프로그램에서 이미지를 추가하십시오.
- 22. com 객체를 사용하지 않고 MS 워드 문서를 여는 경우
- 23. 2 ms 워드 문서를 org.eclipse.compare API와 java를 비교하는 방법
- 24. open-xml sdk 대신 워드 문서를 생성 할 수 있습니까?
- 25. pdf 생성 워드 문서를 생성하는 산업 표준으로 사용되는 API
- 26. 동일한 컴퓨터에서 워드 문서를 업데이트 할 때 .exe 파일을 실행하십시오.
- 27. 워드 문서를 .htm으로 변환 했으므로 적절하게 형식을 지정해야합니다. - C# .NET
- 28. 워드 문서를 열고 vbscript를 사용하여 다른 폴더에 저장
- 29. 워드 프레스 : "루프"의 게시물을 제거하여 필터 워드 프레스 문서를 읽고 나면
- 30. PHP는 : 유니 코드 텍스트의 단어 미만의 세 문자를 제거
Word 문서를 Word 문서로 구문 분석 했습니까? 아랍어 유니 코드 블록은 다음에서 설명합니다. http://en.wikipedia.org/wiki/Arabic_(Unicode_block) 괜찮은 유니 코드 구현을 사용하는 경우 아랍어 또는 히브리어를 처리하는 것이 다른 문자 범위와 다른 이유는 알 수 없습니다. . –
처음부터 자신 만의 MS Word 구현을 작성 했습니까 ?? –
@Y sangkok, 네, 저는 그것을 파싱했으나 저점에 갈 수 없었습니다. – ePezhman