2009-10-26 3 views
1

큰 XML 파일을 구문 분석하고 싶습니다. 두 가지 옵션이 있습니다 : Perl 또는 PHP. 두 언어 모두에 익숙하지 않아서 큰 XML 파일을 구문 분석하기 위해 선택한 언어에 대한 귀하의 제안은 무엇입니까?큰 XML 파일을 구문 분석하기 위해 Perl이나 PHP를 사용해야합니까?

그리고 어떤 모듈이 현재의 작업에 더 적합합니까?

+0

크기는 큽니다. – danieltalsky

+0

약 15 ~ 25 mb – Rachel

+2

"> 15 GB"는 어떻게 되었습니까? 사장님이 그 말이 나쁜 생각이라고 납득하셨습니까? – innaM

답변

7
+1

이것은 유일한 정답입니다. 두 언어 모두 고도로 발전된 XML 구문 분석 유틸리티를 사용하므로 다른 요소에 따라 "최상"입니다. – Ether

1

PHP에는 simplexml이라는 내장 함수가있어서 XML 파일을 매우 쉽게 처리 할 수 ​​있습니다.

+5

"크고"단순한 XML은 메모리에 전체 구조를로드합니다. – danieltalsky

+5

패트릭은 1Gig 파일을 해석 된 언어로 DOM에로드했습니다. 나는 그랬다. 예쁘지 않은. – DVK

0

그냥 팔목에서 - 특정 XML 구문 분석 기능에 대한 지식이 없습니다. 구문 분석 중이라면 Perl로 이동하십시오. Perl의 정규 표현식 지원은 우수하며 수행 할 구문 분석이있을 때 선택 언어로 사용됩니다. 귀하의 마일리지가 다를 수 있습니다.

+4

정규 표현식은 비정규 언어를 파싱하는 것과 거의 관련이 없습니다. – Svante

+0

XML을 정규식으로 구문 분석 하시겠습니까? – innaM

+3

그리고 지금 Alcon은 2 가지 문제가 있습니다 ... – DVK

4

XML은 일반적으로 스트림 또는 DOM의 두 가지 모드 중 하나로 구문 분석됩니다. DOM은 편리하지만 대용량 파일에는 적합하지 않습니다. XML::Twig from CPAN에는 혼합 모드가 있으며 두 모드의 장점이 있습니다.

관련 문제