우리는 CMS를 사용합니다. CMS는 인코딩과 관련하여 사용하기에 정말 고통 스럽지만 여전히 구조를 생성해야합니다. 내가 그들을 제거하는 경우,Ruby는 유효한 UTF-8을 파일에 쓰지 않습니까?
DOMDocument::loadXML() [domdocument.loadxml]: Input is not proper UTF-8, indicate encoding ! Bytes: 0xF6 0x6A 0xE4 0x6B in Entity, line: 7DOMDocument::loadXML() [domdocument.loadxml]: Empty string supplied as input
파일이 포함 öäü
및 :
내가 설정 : Encoding.default_internal
UTF-8로, 나는 # Encoding: UTF-8
으로 시도하고 나는 File.open("filename", "w:UTF-8")
로 파일을 작성하지만, 난 항상 이런 식으로 뭔가있어 예상대로 작동합니다.
메모장 + + 함수 "BOM없이 UTF-8로 변환"을 사용하고 "Umlaute (öäü)"를 수동으로 작성하면 작동합니다.
값을 ö
과 같은 HTML 엔터티로 변경하는 것은 백엔드에서 이러한 방식으로 나타나므로 선택 사항이 아닙니다.
추 신 : JRuby로 작성되었습니다.
XML 파일의 헤더 행에 적절한 인코딩이 있었습니까? : xml version = "1.0"encoding = "UTF-8"?> –
네, 그 사실을 잊지 마십시오. 나는 심지어 XML을 생성하지 않는다. 나는 단지 작동하는 기본 "템플릿"을 복사하고 제목을 바꾼다. – b1nary
어떻게 제목을 대체합니까? 바꾸기 후에 XML이 엉망이 될 수 있습니까? [xmllint] (http://xmlsoft.org/xmllint.html) 같은 것을 통해 XML을 실행하여 프로세스와 XML 데이터를 개별적으로 검증 해 보았습니까? 텍스트가 CDATA 블록 안에 삽입되고 값이 인코딩 된 형식으로 변환되었거나 여전히 원시입니까? –