2

그래서 MeCab (http://mecab.sourceforge.net/#download)을 워드 세그먼트로 실행하고 일본어 문장의 형태소 분석을 수행합니다. 그러나 프로그램을 실행하면 Mac OS X Terminal의 인코딩 문제로 인해 abracadabra가 표시됩니다. 나는 Digg.encoding 옵션을 추가 한 주제를 봤는데 .inputrc에 다음 세 줄을 추가했습니다.Mac OS X Terminal에 일본어 문자를 표시하는 방법은 무엇입니까?

set convert-meta off 
set meta-flag on 
set output-meta on 

아무것도 작동하지 않습니다. Mac OS X Terminal에 일본어 문자를 표시하는 방법에 대한 아이디어가 있습니까? 여기에 프로그램 test.java의 실행의 출력입니다 :

env DYLD_LIBRARY_PATH=. /usr/bin/java -Dfile.encoding=utf-8 test 
0.98pre3 
å¤ ̾»ì,°ìÈÌ,*,*,*,*,* 
ª郎ã µ­¹æ,°ìÈÌ,*,*,*,*,* 
¯ä ̾»ì,¸Çͭ̾»ì,Áȿ¥,*,*,*,* 
º郎にこのæ µ­¹æ,°ìÈÌ,*,*,*,*,* 
¬ã ̾»ì,¥µÊÑÀܳ,*,*,*,*,* 
    µ­¹æ,°ìÈÌ,*,*,*,*,* 
æ¸ ̾»ì,°ìÈÌ,*,*,*,*,* 
¡ã µ­¹æ,³ç 
    BOS/EOS,*,*,*,*,*,*,*,* 
å ̾»ì,°ìÈÌ,*,*,*,* 
ª郎 µ­¹æ,°ìÈÌ,*,*,* 
¯ ̾»ì,¸Çͭ̾»ì,Áȿ¥,*,* 
º郎にこ µ­¹æ,°ìÈÌ,*,*,* 
¬ ̾»ì,¥µÊÑÀܳ,*,*,*, 
    µ­¹æ,°ìÈÌ,*,*,* 
æ ̾»ì,°ìÈÌ,*,*,*,* 
¡ µ­¹æ,³ç¸̳«,*,*,*,* 
    µ­¹æ,°ìÈÌ,*,*,* 
    BOS/EOS,*,*,*,*,*,*,*,* 
EOS 
+0

다음 명령을 실행할 때 출력은 무엇입니까? 'mecab -D' – buruzaemon

+0

놀랍습니다. 나는 일본어 텍스트와 함께 UTF-8 텍스트 파일 (TextEdit에서 저장 됨)을 가지고 있는데,'file myfile.txt'는'UTF-8 Unicode English text'를 반환합니다. (글쎄, 충분히 가깝습니다!) 그리고'cat myfile.txt 터미널에서 완벽 해 보인다. 'hexdump'에 파이프하면, UTF-8 바이트를 기대합니까? – Ken

+0

사실, 내가 Mac을 구입 한 이유 중 하나는 터미널에 일본어 문자를 인쇄 할 수 있었기 때문에 (대폭적인 변경 없이는 문자 그대로 불가능했던 Windows와 비교하여) 아무 것도하지 않고도 일본어 문자를 인쇄 할 수 있었기 때문이었습니다. 일본어가 위의 텍스트의 문자는이 측면이 기술적으로 작동하고 있음을 증명합니다. 그 과정에서 다른 것이 인쇄 된 것을 정확하게 망쳐 놓은 것 같습니다. – PandaWood

답변

1

나는이 기본 설정이라고 생각했을 것입니다,하지만 당신은 선택 시도해 볼 수도 있습니다 "유니 코드 (UTF-8)"에서 문자 인코딩 등 환경 설정 ..., 설정, 고급, 국제. 이것이 이미 설정되어있는 경우 프로그램 출력이 실제로 UTF-8로 인코딩되었는지 확인할 수 있습니다. Shift-JIS, EUC 또는 UTF-16 일 수도 있습니다. 이 경우 환경 설정에서 해당 인코딩을 활성화 해보십시오., 인코딩. 이

% cd mecab-ipadic-2.7.0-xxxx 
% ./configure --with-charset=utf8 
% sudo make 
% sudo make install 

'mecab -D'의 출력 후

0

여기

% cd mecab-java-0.98pre3 
% mecab -D 
filename: /usr/local/lib/mecab/dic/ipadic/sys.dic 
version: 102 
charset: utf8 
type: 0 
size: 392126 
left size: 1316 
right size: 1316 

되는 테스트 프로그램을 실행하는 출력이다.

bash-3.2$ env DYLD_LIBRARY_PATH=. /usr/bin/java test 
0.98pre3 
?? ??,????,??,?,*,*,??,???,??? 
? ??,???,*,*,*,*,?,?,? 
?? ??,????,??,?,*,*,??,???,??? 
? ??,???,??,*,*,*,?,?,? 
?? ???,*,*,*,*,*,??,??,?? 
? ??,??,*,*,*,*,?,??,?? 
? ??,???,??,*,*,*,?,?,? 
?? ??,??,*,*,?????,???,??,???,??? 
? ???,*,*,*,????,???,?,?,? 
? ??,??,*,*,*,*,?,?,? 
EOS 

    BOS/EOS,*,*,*,*,*,*,*,* 
?? ??,????,??,?,*,*,??,???,??? 
? ??,???,*,*,*,*,?,?,? 
?? ??,????,??,?,*,*,??,???,??? 
? ??,???,??,*,*,*,?,?,? 
?? ???,*,*,*,*,*,??,??,?? 
? ??,??,*,*,*,*,?,??,?? 
? ??,???,??,*,*,*,?,?,? 
?? ??,??,*,*,?????,???,??,???,??? 
? ???,*,*,*,????,???,?,?,? 
? ??,??,*,*,*,*,?,?,? 
    BOS/EOS,*,*,*,*,*,*,*,* 
EOS 

인코딩 작업을 위해 누락 된 부분이 있습니까?

P/S : 모든 일본어 인코딩은 터미널의 인코딩 - 인코딩, Mac OS X 터미널의 인코딩 (환경 설정 - 설정 - 고급 - 국제)에서 사용 가능합니다.

+0

OK, 마침내 일본어 문자를 봅니다. 얘들 아, 도와 줘서 고마워! 나는 이것을 스스로 알아 내지 못했을 것이다. – Arman

+0

질문에 대한 정답을 표시하기 시작할 수 있습니까? 많은 사람들이 당신을 도왔을 것 같습니다. – buruzaemon

+0

@buruzaemon : 가장 중요한 단계는 mecab-ipadic에서 './configure --with-charset = utf8'입니다. mecab-ipadic을 재구성 한 후에 터미널이 일본어 문자를 인쇄하지 않는 이유는 'env DYLD_LIBRARY_PATH =/usr/bin/java -Dfile.encoding = utf-8 test '나는하고 있었다'env DYLD_LIBRARY_PATH =./usr/bin/java test '명령을 사용하십시오. 다들 감사 해요! 이제 품사를 알아 냈으므로 프로젝트의 다음 단계로 넘어갈 시간입니다. P – Arman

관련 문제