2010-05-18 6 views

답변

2

CPAN은 "Unicode::Japanese"입니다. 희망이 시작하는 데 도움이됩니다. 또한 자세한 내용은 Character Encodings in Perl 문서 및 unicode perl 문서를 참조하십시오.

+0

s/artical/article/ –

+0

브래드, 편집 권한이 있습니다. :) –

+0

왜? -ve? 그것은 철자 실수 만입니다 :). – Space

1

http://p3rl.org/UNI을 참조하십시오.

use Encode qw(decode encode); 
my $bytes_in_sjis_encoding = "\x88\xea\x93\xf1\x8e\x4f"; 
my $unicode_string = decode('Shift_JIS', $bytes_in_sjis_encoding); # returns 一二三 
my $bytes_in_utf8_encoding = encode('UTF-8', $unicode_string); # returns "\xe4\xb8\x80\xe4\xba\x8c\xe4\xb8\x89" 

명령 줄에서 배치 전환의 경우, piconv를 사용 : 당신이 이미 그것을 모르는 경우

piconv -f Shift_JIS -t UTF-8 <infile> outfile 
0

첫째, 당신은 소스 텍스트의 인코딩을 찾아야합니다.

일본어의 가장 일반적인 인코딩

은 다음과 같습니다

  1. euc-jp : (자주 shift-jis보다 큰 Kanji 범위와 유닉스 및 일부 웹 페이지 등 사용)
  2. shift-jis는 (마이크로 소프트는 또한 쉬프트 - 몇 가지 확장 기능을 추가 자주) 유니 코드를 지원하지 않는 Windows 프로그램에
  3. iso-2022-jp을 사용 cp932라고 JIS는 먼 셋째
입니다

많은 언어에 대한 일반적인 인코딩 변환 라이브러리는 (http://en.wikipedia.org/wiki/Iconvhttp://search.cpan.org/~mpiotr/Text-Iconv-1.7/Iconv.pm 참조)이며 many other encodings과 일본어를 지원합니다.

0

이 질문은 나에게 다소 모호하게 보입니다. 나는 당신이 무엇을 요구하고 있는지 확신하지 못합니다. 일반적으로 다음과 같이 사용합니다.

open my $file, "<:encoding(cp-932)", "JapaneseFile.txt" 

일본어 문자로 파일을 여는 것이 좋습니다. 그러면 Perl은이를 자동으로 내부 유니 코드 형식으로 변환합니다.

관련 문제