거대한 XML 파일이 있습니다. 그러나 나는이 거대한 나무의 작은 하위 트리에만 관심이있다. 이 하위 트리를 구문 분석하고 싶지만 작은 부분 만 사용하려고 할 때 전체 대규모 트리를 파싱하는 데 시간을 낭비하고 싶지 않습니다.은 XML 파일의 특정 하위 트리 만 구문 분석합니다.
이상적으로,이 하위 트리의 시작 부분을 찾을 때까지 파일을 스캔하고 끝에 도달 할 때까지 하위 트리를 구문 분석 한 다음 파일의 나머지 부분을 읽지 않아도됩니다. 어쩌면 XPath 표현식에 관심이있는 하위 트리를 설명 할 수도 있습니다. lxml을 사용하여이를 수행 할 수 있습니까? iterparse()
메서드를 사용하여 이와 같은 작업을 수행 할 수있는 것처럼 보이지만 문서를 기반으로하면 사용하려는 구문 분석 된 객체가 생성되지 않은 것처럼 보입니다. 어떤 제안?