2012-09-26 2 views
2

나는 '지능적으로'장소 이름 문자열을 ASCII로 변환하려고합니다. 나는 내가 바라는 것이 음역이라고 생각한다. 내가 사용할 수 있었던 'uconv가'고무적인 결과를 얻을 수 UTIL : uconv를 사용하여 장소 이름 목록을 ASCII로 변환하려면 어떻게해야합니까?

내 입력이 "Emberá"이었다 말 :

uconv -x Latin-ASCII input.dat > output.dat 

해당 출력은 "Embera"것 - 정확히 내가 원하는. 그러나 어떤 경우에는 예상되는 결과를 얻지 못합니다 (입력이 라틴어가 아닌 경우)? 예를 들어,이 장소를 확인하십시오 (이 텍스트 상자에 이름을 올바르게 복사하여 붙여 넣을 수 없음) http://maps.google.ca/maps?q=karpos+macedonia&hl=en&ie=UTF8&hnear=Karpo%C5%A1,+Macedonia+(FYROM)&t=m&z=12.

"Karpos"(필자는 생각합니다.)로 변환하는 것이 이상적이지만 위의 명령으로 uconv의 입력으로 사용하면 uconv가 전혀 수정하지 않습니다.

placenames의 목록이 주어졌습니다. (호기심이있는 사람이 있다면 - http://www.mediafire.com/file/gb0guu117yp1p26/test.dat입니다.) 어떻게 ASCII로 변환합니까?

답변

2

try -x 'Any-Latin;Latin-ASCII' 출력에 --to-callback escape-unicode -t ascii을 추가하여 ascii로 출력 할 수도 있습니다. 그렇지 않은 경우 {U+3045}과 같습니다.

여기서 '지능적으로'는 ... 상대적입니다. 당신은 많은 정보를 없애고 몇 가지 번역 단계를 거치고 있습니다. 이것은 많은 도움이되지는 않지만, 텍스트가 그리스어에서 영어로 (el-en이라고) 말하는 것을 알고 있다면 -x 'el-en;Any-Latin;Latin-ASCII'과 같은 것을 할 수 있습니다. 그런 다음 langauge 특정 음역을 사용하려고 시도 할 수 있습니다.

관련 문제