2012-08-01 2 views
3

Windows에서 Ruby 1.9.3을 사용하고 있는데, 한 줄에 하나씩 파일 이름을 쓰고 (파일 목록이라고 부름) 파일 목록을 읽고 나중에이 파일 목록을 읽고 실행을 위해 system()을 호출하는 작업을 수행하려고합니다. 다른 프로그램에서 파일 목록의 파일 이름을 전달합니다. system()으로 호출하는 프로그램은 전달한 파일 이름을 가져와 독점 시스템에서 사용하기 위해 이진 형식으로 변환합니다.Ruby 시스템()이 UTF-8을 허용하지 않습니까?

모든 것이 system() 호출 지점까지 작동합니다. UTF-8 파일 목록이 있고 파일 목록에서 파일 이름을 읽으면 올바른 결과를 얻을 수 있습니다. 내가 실행할 때

system("c:\foo.exe -arg #{bar}") 

전달되는 인수 "바"UTF-8 형식이 아닙니다. 일본어, 중국어 또는 기타 파일명을 사용하여 수동으로 프로그램을 실행하면 파일이 올바르게 작동하고 코드가 올바르게 코드화되지만, system()을 사용하면 파일이 올바르게 코딩되지 않습니다. 나는 바에서 변수가 문제없이 다른 곳에서 사용하기 때문에 적절히 저장된다는 것을 안다.

가 나는 또한 시도했다 :

system("c:\foo.exe -arg #{bar.encoding("UTF-8")}") 
system("c:\foo.exe -arg #{bar.force_encoding("UTF-8")}") 

와도 작동합니다. 여기서 문제는 유니 코드를 시스템에 전달하는 것으로 가정 할 수 있습니다.

시스템이 실제로 시스템을 지원하는지 여부를 다른 사람이 확인할 수 있습니까? ,

$fname.each do |file| 
    flist.write("#{file}\n") # This is written properly in UTF-8 
    system("ia.exe -r \"#{file}\" -q xbfadd") # The file being passed here is not encoding right! 
    end 
+2

이 문제는 루비 측에서 Windows와의 통합이 오래 지속 된 것으로 보입니다. 분명히 최근까지도 여전히 많은 것들을 위해 ANSI API를 사용했으며 '시스템'은 간과되었을 수 있습니다. – Joey

답변

3

루비의 system() 기능, 같은 대부분의 스크립트 언어에서 C 표준 라이브러리 system() 전화를 통해 베니어입니다 : 여기

코드의 블록입니다. MS C 런타임은 모든 바이트 지향 C stdlib 함수에 Win32 ANSI API를 사용합니다.

ANSI API는 Windows 시스템 로캘 (별칭 : ANSI 코드 페이지)을 사용하여 바이트 지향 문자열과 파일 이름 및 셸 명령에 사용되는 Windows의 기본 UTF16LE 문자열을 매핑합니다. 유감스럽게도, 시스템 로케일을 UTF-8로 설정하는 것은 불가능합니다. 특정 콘솔에서 코드 페이지를 65001 (Windows의 UTF-8과 동일)로 설정할 수 있지만 MS CRT는 코드 페이지 65001을 처리 할 때 오랫동안 버그가있어 많은 응용 프로그램이 실패합니다.

표준 크로스 플랫폼 바이트 지향 C 인터페이스를 사용한다는 것은 유니 코드 파일 이름이나 셸 명령을 지원할 수 없다는 것을 의미합니다. 이는 오히려 슬픈 일입니다. 일부 스크립트 언어는 C stdlib 인터페이스 대신 명시 적으로 Win32 'W'(유니 코드) API를 호출하여 유니 코드 파일 이름에 대한 지원을 추가했습니다. Ruby 1.9.x가이 분야에서 발전하고 있지만, system() 님은 아직 보지 못했습니다.

당신은 예를 CreateProcessW를 들어, calling the Win32 API yourself하여 문제를 해결할 수 있지만, 특히 꽤 아니다.

0

나는 bobince의 답변을 upvoted; 나는 그것이 정확하다고 믿는다.

내가 추가 할 수있는 유일한 방법은 Windows 문제인 추가 해결 방법은 배치 파일에 명령 줄을 작성한 다음 system()을 사용하여 배치 파일을 호출하는 것입니다.

제목에 UTF-8/영어 이외의 문자가있는 책에 대해 Caliber의 ebook-convert 명령 줄 도구를 실행하는 동안 문제를 성공적으로 해결하기 위해이 방법을 사용했습니다.

0

나는 bobince 대답이 정확하다고 생각합니다.나를 위해 일한 솔루션은 다음과 같습니다.

system("c:\foo.exe -arg #{bar.encoding("ISO-8859-1")}") 
관련 문제