2011-09-06 4 views

답변

1

적절한 인코딩을 추측하기 위해 추론을 사용하는 WinAPI 함수 IsTextUnicode을 사용할 수 있습니다. 이 경우 hilariously wrong이 될 수 있습니다.

가장 좋은 방법은 해당 인코딩에 대한 외부 정보가없는 스트림을 허용하지 않고 내부 정보 (인코딩 정보가 포함 된 BOM 또는 HTML 메타 태그)를 사용하지 않는 것입니다.

+0

좋아,하지만 내가 스트림이 utf-8이 아니라는 것을 감지하면 utf-8로 변환합니다. – marko

+0

@marko 사실, 위의 함수는 아마도 꽤 잘 작동 할 것입니다. 지금까지 보았 듯이 대부분의 모호성은 UTF-16LE입니다. –

+0

+1. [IsTextUnicode 주제에 대한 Raymond Chen (http://blogs.msdn.com/b/oldnewthing/archive/2007/04/17/2158334.aspx) 및 [이 중복 질문] (http : // howover-collection-questions/90838/how-can-i-detect-the-encoding-codepage-of-a-text-file) – MarkJ

관련 문제