2013-04-02 3 views
9

dblp XML 파일을 사용하고 있습니다. 실제로 dblp.xml 파일을 구문 분석하고 일부 프로젝트에서 추가 처리를 위해 유용한 정보를 추출하려고합니다. 그리고 그 XML 파일은 매우 거대합니다. (1.1 GB) 나는이 파일을 열지도 못합니다.C#에서 매우 큰 XML 파일을 구문 분석하는 방법은 무엇입니까?

dblp.xml에 대한 C# 파서가 있으면 안내를 받거나 이와 관련하여 나를 안내하거나 거대한 xml 파일을 구문 분석 할 수있는 방법을 안내해 줄 수 있습니다.

+3

XML 파싱은 SO에 nauseam_ _as 논의되고있다. 여기에 여러분을 계몽 할 수있는 토론이 있습니다 : http://stackoverflow.com/questions/55828/how-does-one-parse-xml-files – joce

+1

XStreamingElement (http://msdn.microsoft.com/en-us/)를 참조하십시오. library/system.xml.linq.xstreamingelement.aspx도 있습니다. –

+0

Ryan Gates -> XML 형식의 OSM 파일 이것은 이유 일 수 있습니다. – Kostadin

답변

6

: XML의 DOM이 완전히 쓸모가 메모리에 전체 파일을 저장합니다. 큰 데이터 집합과 함께 사용되는 것으로 가정 된 모든 데이터를 메모리에로드하지 않습니다. .NET에 내장 된 다른 솔루션은 전체 생성 된 개체 그래프를 유지합니다.

XmlReader in action (by Jon Skeet)

관련 문제