이 같은 UTF-8 문자 시퀀스를 포함하는 일반 텍스트 파일 (.yml)가 :변환 UTF-8 문자 시퀀스
foo는 "\ \ XC3 엔 Dette 어 XB8 \ X C 3 \ X B (8)
: 그들은 8 개 실제 문자로 텍스트 파일에 저장되기 때문에, "UTF-8 바이트 실제 -"이 그렇지 않은
문제는 XB8 \ \ XC3에있다 " 이들을 실제 2 바이트 UTF-8 시퀀스로 변환하는 방법이 있습니까?
모든 OS/언어/쉘 도구는 파일을 변환 :-)/카슨
이 '시퀀스'만 있습니까? – Serge
이것은 단지 예입니다. 많은 다른 언어에서 모든 종류의 비 ASCII 문자가 있습니다. 그래서 간단한 정규 표현식 대체는 의문의 여지가 없습니다. –
텍스트에 '의도'(이스케이프 된 시퀀스가 실제로 포함되어 있음)가 포함될 수 있습니까? – Serge