내가 XML 파일을 통해 반복려고을 구문 분석 할 때 lxml이와 (UTF-8 인코딩은 시작),하지만 문자 丂에 다음과 같은 오류 얻을 :lxml이 인코딩 오류 UTF8의 XML을
UnicodeEncodeError을 'cp932를 '코덱이 0 위치의 문자'u4e02 '을 인코딩 할 수 없습니다. 올바르지 않은 멀티 바이트 시퀀스
다른 문자는 올바르게 인쇄됩니다. 코드는 다음과 같습니다
parser = etree.XMLParser(encoding='utf-8')
tree = etree.parse("filename.xml", parser)
root = tree.getroot()
for elem in root:
print elem[0].text
오류는 UTF-8 대신 변화 JIS에서 파일을 구문 분석하지 않았 음을 의미 하는가?
아, 그래서 stdouts 인코딩이었습니다. 테스트 용으로 만 사용 했으므로 결국 문제가 없었습니다. D 감사합니다! – usagidon