일본어 문자를 유니 코드로 변환하는 도구를 가르쳐 주시겠습니까?Perl에서 일본어 문자를 유니 코드로 변환하려면 어떻게해야합니까?
0
A
답변
2
CPAN은 "Unicode::Japanese"입니다. 희망이 시작하는 데 도움이됩니다. 또한 자세한 내용은 Character Encodings in Perl 문서 및 unicode perl 문서를 참조하십시오.
1
http://p3rl.org/UNI을 참조하십시오.
use Encode qw(decode encode);
my $bytes_in_sjis_encoding = "\x88\xea\x93\xf1\x8e\x4f";
my $unicode_string = decode('Shift_JIS', $bytes_in_sjis_encoding); # returns 一二三
my $bytes_in_utf8_encoding = encode('UTF-8', $unicode_string); # returns "\xe4\xb8\x80\xe4\xba\x8c\xe4\xb8\x89"
명령 줄에서 배치 전환의 경우, piconv를 사용 : 당신이 이미 그것을 모르는 경우
piconv -f Shift_JIS -t UTF-8 <infile> outfile
0
첫째, 당신은 소스 텍스트의 인코딩을 찾아야합니다.
일본어의 가장 일반적인 인코딩
은 다음과 같습니다euc-jp
: (자주shift-jis
보다 큰 Kanji 범위와 유닉스 및 일부 웹 페이지 등 사용) 이
shift-jis
는 (마이크로 소프트는 또한 쉬프트 - 몇 가지 확장 기능을 추가 자주) 유니 코드를 지원하지 않는 Windows 프로그램에iso-2022-jp
을 사용cp932
라고 JIS는 먼 셋째
많은 언어에 대한 일반적인 인코딩 변환 라이브러리는 (http://en.wikipedia.org/wiki/Iconv 및 http://search.cpan.org/~mpiotr/Text-Iconv-1.7/Iconv.pm 참조)이며 many other encodings과 일본어를 지원합니다.
0
이 질문은 나에게 다소 모호하게 보입니다. 나는 당신이 무엇을 요구하고 있는지 확신하지 못합니다. 일반적으로 다음과 같이 사용합니다.
open my $file, "<:encoding(cp-932)", "JapaneseFile.txt"
일본어 문자로 파일을 여는 것이 좋습니다. 그러면 Perl은이를 자동으로 내부 유니 코드 형식으로 변환합니다.
관련 문제
- 1. 그리스 문자를 유니 코드로 변환
- 2. Perl에서 UDP 스트림을 변환하려면 어떻게해야합니까?
- 3. 문자열을 유니 코드 문자로 변환하려면 어떻게해야합니까?
- 4. 유니 코드로 파일에 쓰기
- 5. 아랍어 및 일본어 텍스트를 유니 코드로 알파벳순으로 나타냅니다?
- 6. 팩과 헥스가있는 정규식을 Perl에서 Python으로 변환하려면 어떻게해야합니까?
- 7. Perl에서 기수 시간을 정상 시간으로 변환하려면 어떻게해야합니까?
- 8. 유니 코드를 파이썬 수준의 문자열로 변환하려면 어떻게해야합니까?
- 9. 유니 코드 경로를 C 문자열로 변환하려면 어떻게해야합니까?
- 10. Perl에서 입력 파일을 UTF-8 인코딩으로 변환하려면 어떻게해야합니까?
- 11. Perl에서 파일 이름의 대소 문자를 변경하려면 어떻게해야합니까?
- 12. 파이썬에서 모든 일본어 히라가나를 카타카나 문자로 변환하려면 어떻게해야합니까?
- 13. C# 유니 코드 (일본어 문자)
- 14. 자바 애플릿의 유니 코드/일본어 문자
- 15. Antlr 문법에 유니 코드 문자를 삽입하려면 어떻게해야합니까?
- 16. 태그를 제외한 Python의 유니 코드 문자를 코드로 인코딩하십시오.
- 17. 이진 데이터를 유니 코드로
- 18. 유니 코드로 SQL 선택
- 19. ANSI에서 유니 코드로 변환
- 20. NSString을 NSData로 변환하려면 어떻게해야합니까?
- 21. 4 문자를 Perl에서 32 비트 IEEE-754 부동 소수점으로 변환하려면 어떻게해야합니까?
- 22. Perl에서 XML 문서를 Latin-1에서 UTF-8로 변환하려면 어떻게해야합니까?
- 23. Perl에서 ISO8601 타임 스탬프를 유닉스 시간으로 변환하려면 어떻게해야합니까?
- 24. 문자를 ASCII 코드로 변환
- 25. 유니 코드 자바 스크립트에서 문자열을 소수로 변환하려면 어떻게해야합니까?
- 26. 유니 코드 코드 포인트 (\ uXXXX)를 Perl의 문자로 변환하려면 어떻게해야합니까?
- 27. 파이썬을 사용하여 유니 코드 문자열의 악센트 부호가있는 문자를 유니 코드 문자 코드로 변환하는 방법은 무엇입니까?
- 28. iphone 일본어 키보드
- 29. 유니 코드로 데이터베이스에 값 입력
- 30. Python에서 안전한 유니 코드로 변환
아시아 문자 집합의 의미입니다. 일본어를하기 전에 어떤 문자 인코딩이 필요한지 알아야합니다. –