내 목표는 25GB의 XML 데이터를 구문 분석하는 것입니다. 이러한 데이터의 예는 아래와 같습니다 :25GB 데이터에 대한 효율적인 XML 구문 분석
<Document>
<Data Id='12' category='1' Body="abc"/>
<Data Id='13' category='1' Body="zwq"/>
.
.
<Data Id='82018030' category='2' CorrespondingCategory1Id='13' Body="pqr"/>
내가 "25기가바이트"의이 데이터를 However..considering ... 내 접근 방식은 매우 비효율적이다. 제 코드를 개선하거나 다른 방법을 제안하십시오. 또한 사물을 더 명확하게 만들기 위해 작은 예제 코드를 포함하십시오.
가능한 [Python sax에서 80x1GB XML 용 lxml]의 복제본 (http://stackoverflow.com/questions/9809469/python-sax-to-lxml-for-80gb-xml) –