자주 파이썬에서 lxml
모듈을 사용하여 일부 웹 사이트의 데이터를 긁어 내고 일반적으로 모듈에 익숙합니다. 그러나 긁어 모으려고하면 etree.fromstring()
전화에서 lxml.etree.XMLSyntaxError: AttValue: " or ' expected
오류가 발생하지만 대개는 그렇지 않습니다. 나는 그 오류를 얼마나 자주 볼 수 있는지 명확히 할 수는 없지만, 수천 번 또는 수천 번 중 하나라고 생각합니다. 오류가 발생합니다. 오류가 발생하고 스크립트가 중지 된 후 바로 똑같은 스크립트를 실행하면 오류가 표시되지 않고 스크립트가 예상대로 올바르게 실행됩니다. 왜 그것이 오발 적 오류를 내뱉습니까? 문제를 해결할 방법이 있습니까? urllib2.urlopen() 함수를 인스턴스화 할 때 유사한 문제가 있지만 최근에 urllib2
에서 오류를 보지 못했기 때문에 지금부터 정확한 오류 메시지를 작성할 수 없습니다.왜 lxml은 파이썬에서 (보통은 아니지만) 오류를 내뱉습니까?
감사합니다.
아마 * invalid * XML입니까? 오류가 발생한 데이터를 캡처하고 [XML/XHTML validator] (http://validator.w3.org)로 유효성을 검사하십시오. (아마도 동일한 데이터에 대해 오류가 결정적으로 발생하지 않을 가능성이 있습니다. 서버가 다른 것을 반환했을 가능성이 있습니까?) – user2246674