2010-06-23 3 views
0

줄 바꿈은 내가 가지고있는 잘못된 문자 인코딩을 가진 많은 파일 중 하나의 예입니다.이 변환과 일치 할 수있는 문자 인코딩은 무엇입니까? "§"부터 "Ç"까지?

REAPRESENTA§AO VIA DTENTRY 

올바른 표현이 있어야한다 : 잘못된 인코딩 이상의 문자있다

REAPRESENTAÇAO VIA DTENTRY 

. 이 문제를 어떻게 해결합니까? 당신은 당신이 그들을 디코딩 잘못된 인코딩을 사용하여 파일을 읽을 때

alt text http://nerull.webs.com/screen.JPG

+1

당신은 당신이 사용하고있는 글꼴이 원인이 아닌가? – Will

+0

아니요. utf-8 호환 글꼴이있는 일반 텍스트 파일입니다! –

+0

더 많은 정보를 입력하십시오. – kennytm

답변

3

자체가 잘못된 인코딩이없는 파일은, 그것입니다.

수정하는 것은 동일한 인코딩을 사용하여 인코딩하는 데 사용 된 파일을 디코딩하는 것입니다.

인코딩이 무엇인지 모르는 경우 디코딩하기 전에 문제가있는 문자의 바이트 코드를 찾아야하며 문자 코드가 원하는 문자와 일치하는 문자 집합이 포함 된 인코딩을 찾아야합니다 .

예를 들어 파일 "Ç"이 바이트 코드 74로 인코딩되도록 IBM905를 사용하여 파일을 인코딩 할 수 있습니다. IBM278을 사용하여 파일을 디코딩하면 바이트 코드 74는 "§"문자로 해석됩니다. . 여기

내가 발견 가능한 조합의 목록입니다 인코딩 내장 :

from cp875 to IBM290 
from cp875 to IBM420 
from cp875 to x-EBCDIC-KoreanExtended 
from cp875 to IBM-Thai 
from cp875 to IBM880 
from IBM290 to IBM290 
from IBM290 to IBM420 
from IBM290 to x-EBCDIC-KoreanExtended 
from IBM290 to IBM-Thai 
from IBM290 to IBM880 
from IBM420 to IBM290 
from IBM420 to IBM420 
from IBM420 to x-EBCDIC-KoreanExtended 
from IBM420 to IBM-Thai 
from IBM420 to IBM880 
from IBM424 to IBM290 
from IBM424 to IBM420 
from IBM424 to x-EBCDIC-KoreanExtended 
from IBM424 to IBM-Thai 
from IBM424 to IBM880 
from x-EBCDIC-KoreanExtended to IBM290 
from x-EBCDIC-KoreanExtended to IBM420 
from x-EBCDIC-KoreanExtended to x-EBCDIC-KoreanExtended 
from x-EBCDIC-KoreanExtended to IBM-Thai 
from x-EBCDIC-KoreanExtended to IBM880 
from IBM-Thai to IBM290 
from IBM-Thai to IBM420 
from IBM-Thai to x-EBCDIC-KoreanExtended 
from IBM-Thai to IBM-Thai 
from IBM-Thai to IBM880 
from IBM880 to IBM290 
from IBM880 to IBM420 
from IBM880 to x-EBCDIC-KoreanExtended 
from IBM880 to IBM-Thai 
from IBM880 to IBM880 
from cp1025 to IBM290 
from cp1025 to IBM420 
from cp1025 to x-EBCDIC-KoreanExtended 
from cp1025 to IBM-Thai 
from cp1025 to IBM880 
from IBM1026 to IBM01143 
from IBM1026 to IBM278 
from IBM905 to IBM01143 
from IBM905 to IBM278 
+1

@Guffa : SO의 Mechanical Turk 구현을 사용하여 문제가 무엇인지 (즉, 마지막 단락에서 설명 된 프로세스)라고 생각합니다. –

+0

@ Guffa, 해당 이미지가 인코딩을 식별하는 데 도움이되는지 확인하십시오. –

+0

@ Guffa, PHP를 사용하여이 변환을 수행 할 수 있는지 알고 있습니까? –

관련 문제