2012-08-07 2 views
1

대형 XML 파일을 검색하기 위해 Google과 다양한 포럼을 검색했으나 1.0GB이고 DBLP가 너무 커서 내 요구 사항을 충족하지 못했지만 아무 것도 발견하지 못했습니다. 30-50 MB, 100-300 MB 및 500 MB와 같은 세트가 필요합니다. 아무도 몰라?테스트 용 XML 데이터

p.s. 의미있는 쿼리로 테스트 할 때 실제 데이터가 필요하므로 데이터 생성기를 제안하지 마십시오.

+2

http://en.wikipedia.org/wiki/Wikipedia:Database_download? – porges

+1

정확히 무엇이 필요합니까? 비즈니스 애플리케이션을 작성하는 경우 인터넷의 어딘가에있는 임의의 데이터 대신 애플리케이션 별 데이터가 필요합니다. 따라서 그물에있는 XML 파일을 가져 가면 사용자가 자신의 데이터 생성기를 구현하지 못하게하는 이유가 표시되지 않습니다 ...? –

답변

2

마지막으로 좋은 데이터 세트를 발견했습니다. 그들은 위에 있습니다 : http://dumps.wikimedia.org/mirrors.html 위키 피 디아를 포함한 다양한 위키의 데이터 세트입니다. 10MB에서 500-600MB의 다양한 크기의 데이터 세트를 찾을 수 있습니다.

1

openstreetmap database 전체를 250GB xml로 다운로드 할 수 있습니다. 테스트를 위해 충분히 커야합니다.

+0

질문에서 언급 한 크기가 필요합니다. 주의 깊게 읽으십시오. –

+0

질문의 제목은 왜 * Large * XML 데이터 집합입니까? – hroptatyr

+1

그 크기는 실제로 크지 않습니다. 그러나 더 작은 영역에 대한 openstreetmap 파일을 다운로드 할 수도 있습니다. (예 : 17M 압축 룩셈부르크, 215M 압축 오스트레일리아 ...) – BeniBela

0

XSLT를 사용하여 언제든지 모든 크기의 XML 문서를 생성 할 수 있습니다.

잘 알려진 XML 문서 인스턴스 (44GB, 3.8GB 압축) - CityGml file입니다.

+0

큰 파일이 필요하지 않습니다. 그냥 작은 것들. –

+1

질문의 제목은 왜 ** 큰 ** XML 데이터 집합입니까? – hroptatyr

+0

500MB는 작지 않기 때문입니다. –