이 XML 파일에는 작년 한 해 동안 보관 된 뉴스 기사가 포함되어 있습니다. 스토리 카테고리별로 이러한 스토리를 새로운 XML 파일로 정렬하라는 요청을 받았습니다.나는 100 MB XML 파일 (sans-DTD/Schema)을 가지고있다. XSLT는 그것을 가지지 않습니다. 변형/분석을위한 전략?
big_story_export.xml
등등
lifestyles.xml
food.xml
nascar.xml
로 변신 ... 그리고.
내가 일회성 파이썬 스크립트, 그러나를 사용하여 일을 가지고, 나는 원래이 사용 XSLT을 시도했다. 내 XPATH 선택이 침대를 골라 먹으면서 좌절감을 느끼게되었습니다. 테스트 파일은 완벽하게 변형되었지만 큰 파일을 내 스타일 시트에 붙여 넣으면 결과는 ... nothing.이와 같은 파일이 XSLT를 통과하도록하려면 어떤 전략을 권장합니까? 이것은 벤더에 의해 나에게 건네졌다. 그래서이 파일의 구조를 정의 할 때 많은 영향력이 없다고 상상해 보라.
여러분이 코드 샘플을 원한다면, 함께 사용하겠습니다.
XML + XSLT가 원활하게 작동하도록하기위한 몇 가지 팁에 만족합니다.
내가 이것을 처리하기 위해 파이썬의 libxml2를 & libxslt를 사용하던
@Sklivvz
. 지금 xsltproc을 조사하고 있습니다.이러한 일회성 상황에서는 좋은 도구 인 것 같습니다. 감사! diomidis-spinellis (언급 한 바와 같이) 내가 능력이없는하지만 그것은 잘 형성되어있어
그것이 유효성의 발견 @
.
스키마 작성과 관련하여 저는이 아이디어를 좋아합니다.
이 파일을 검증하는 데 드는 시간은 일회성 인 경우 실용적이지 않지만 필자의 공급 업체로부터 더 많은 파일을 처리해야 할 것으로 예상됩니다.
스키마를 작성하고 (공급 업체에 제출하는 것) XML 펑크를 관리하기위한 훌륭한 장기 전략이 될 것입니다. 감사!
xsltproc에 대한 권장 사항은 두 번째입니다. 파이썬 XSLT가 그것을 처리하지 않기 때문에 시도해 볼 가치가있다. – DGentry