lxml

    3

    3답변

    배포 한 버전의 장고 응용 프로그램을 사용할 때 lxml에 이상한 문제가 있습니다. lxml을 사용하여 서버에서 가져 오는 다른 HTML 페이지를 구문 분석합니다. 이것은 내 자신의 컴퓨터에있는 개발 서버에서 완벽하게 작동하지만, 어떤 이유인지 그것은 UnicodeDecodeError을 서버에 제공합니다. ('utf8', "\x85why hello ther

    4

    1답변

    xml 문서를 생성하기 위해 (단지 etree.tostring (root)를 사용하여) xml 문서를 생성하고 있지만 그 결과 xml은 숫자 값 (& #)이 아닌 명명 된 엔티티 (& lt; 60; 결과에서 이름 대신 숫자 값을 사용하도록 정확히 변경하려면 어떻게해야합니까? 감사

    14

    2답변

    구문 분석 된 HTML 문서의 DOM 트리를 찾아야합니다. 내가 lxml이와 함께 문자열을 구문 분석하기 전에 uTidyLib을 사용하고 는 는 = tidy.parseString (html_code, 옵션) DOM = etree.fromstring (STR의 (a)) 때때로 오류가 발생합니다 tidylib가 잘못된 형식의 html을 고칠 수없는 것 같습니다

    4

    1답변

    프로그래밍 방식으로 HTML을 작성하는 데 lxml을 사용하고 출력에 사용자 정의 주석을 포함해야합니다. 주석을 처리하는 코드는 lxml에 있지만 (기존 HTML 코드를 파싱 할 때 인스턴스화 될 수 있음) 프로그래밍 방식으로 인스턴스화 할 수있는 방법을 찾을 수 없습니다. 아무도 도와 줄 수 있습니까?

    6

    2답변

    CPython 응용 프로그램에서 IronPython으로의 lxml에 많이 의존하는 코드를 포팅해야합니다. lxml은 매우 Python이며 IronPython에서 계속 사용하고 싶지만 C 확장 인 libxslt 및 libxml2에 따라 달라집니다. IronPython에서 lxml을 허용하는 해결 방법이나 그 C- 확장 종속성이없는 lxml 버전을 아는 사람이

    1

    2답변

    일부 기존 XML 문서를 조작하기 위해 lxml을 사용하고 있으며 가능한 한 적은 diff 노이즈를 도입하려고합니다. 불행하게도 기본 lxml.etree.XMLParser하여 문서의 루트 요소의 앞 또는 뒤에 공백을 보존하지 않습니다 >>> xml = '\n <etaoin>shrdlu</etaoin>\n' >>> lxml.etree.tostring(lxm

    7

    3답변

    lxml을 사용하여 XML 문서를 구문 분석 할 때 외부 카탈로그 파일을 사용하여 해당 DTD에 대해 해당 문서를 확인하는 방법이 있습니까? 문서의 DTD에 정의 된 고정 속성을 사용할 수 있어야합니다.

    1

    5답변

    파이썬으로 HTML 구문 분석을해야합니다. 몇 가지 연구가 끝난 후 lxml이 최선의 선택 인 것처럼 보이지만 내가하는 일에 도움이되는 예제를 찾는 데 어려움을 겪고 있습니다. 이것이 내가 듣는 이유입니다. 내가 볼 수있는 모든 텍스트에 대한 페이지를 고칠 필요가 .. 모든 태그와 자바 스크립트 밖으로 스트립. 나는 그것을 텍스트가 볼 수있는 날 떠나 줘야

    2

    1답변

    텍스트 문자열을 가져 와서 단락/문서의 나머지 텍스트를 html에서 "추출"하려고합니다. 현재 나의 접근 방식은 html에서 lxml로 구문 분석 된 문자열의 "상위 태그"를 찾으려고합니다. (이 문제를 해결할 더 좋은 방법을 알고 있다면 나는 모두 귀이다!) 예를 들어 트리에서 "TEXT STRING HERE"을 검색하고 "p"태그를 반환하십시오. (내가

    6

    1답변

    나는이 예제와 유사 LXML를 사용하여 네임 스페이스를 지정하기 위해 노력하고있어에서 네임 스페이스를 추가 (here에서 가져온) : <TreeInventory xsi:noNamespaceSchemaLocation="Trees.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> </TreeInvent