2012-06-11 2 views
3

요즘 XML 문서에서 일부 데이터 마이닝을해야합니다. 즉, 대부분 사전에 스키마의 스키마가 없기 때문에 쿼리를 두 번 실행합니다. 몇 가지 예제 쿼리는 "이 하위 요소 값이 0보다 큰 요소 수"또는 "일종의 요소 별, 하위 요소의 일부 값 합계"입니다.ad-hoc XML 쿼리를위한 최신 언어?

Java에서 이러한 쿼리를 실행하는 것은 어색합니다. (a) Java DOM 처리가 실제로 번거롭고 (b) 애플리케이션의 일부가 아닌 몇 번만 실행하면됩니다.

이 시나리오에서 권장되고 현재 지원되는 쿼리 언어 및 도구는 무엇입니까? 대화 형, 무료/오픈 소스가 바람직하며 사전에 데이터베이스에 문서를 저장할 필요가 없습니다 (옵션 임에도 불구하고).

+0

LINQ, 나에 따르면, 아주 잘 할 수있어! http://en.wikipedia.org/wiki/Linq –

+0

부적절한 태그 데이터 마이닝을 삭제했습니다. 질문에 데이터 마이닝이 없습니다. 이는 XML 쿼리에 관한 것입니다. 고급 분석은 여기서 일어나지 않습니다. –

답변

2

XQuery가 필요합니다. XQuery homepage에 견적에서 읽을 수 있습니다 그것은 쉽게 XML을 쿼리 만든 목적이다 :

는 XQuery는 몇 줄의 코드로 복잡한 Java 또는 C++ [XML 처리] 프로그램을 대체하고있다.

오픈 소스 프로그램 BaseX을 사용하여 (많은 수의) XML 파일을 쉽게 쿼리 할 수 ​​있습니다. 또한 XML 구조의 대화식 시각화 기능을 제공합니다.

+0

BaseX가 좋습니다! 추천 주셔서 감사합니다. – Vijay

1

XQuery에 대한 설명처럼 들립니다.

예는 실제로

count(//element[sub-element gt 0]) 

//some-element/sum(sub-element) 

사람들의 두 쿼리는 XQuery를 1.0의 하위 집합입니다 XPath는 2.0,하지만 당신은 아마 조만간 XQuery를 1.0 원할 것입니다, 그것은 더 광범위하게 XPath를보다 구현 2.0, 그렇게해라. Java 환경에서 작동하는 XQuery 프로세서가 많으며 XML 데이터베이스가 있든 없든 상관 없습니다. 내 자신의 색슨 제품은 하나의 예입니다.