2012-10-05 5 views
7

하스켈에서 유니 코드 XML을 처리하는 공식 솔루션이 무엇인지 알고 싶습니다. HXT는 텍스트에 대해 간단한 String 표현 (유니 코드 문자 목록 !!!)을 사용합니다. 구문 분석 할 때하스켈의 XML 유니 코드에 대한 태도는 무엇입니까?

http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode

Constructors 
XText String ordinary text (leaf) 
XBlob Blob   text represented more space efficient as bytestring (leaf) 

어떻게 두 표현 사이에서 선택합니까? 사용자가 문자 목록을 사용하도록 강요하는 것은 특히 XML 문서에 많은 텍스트 콘텐츠가있는 경우 특히 매력적인 기능처럼 들리지 않습니다.

또한 Google에서 http://hackage.haskell.org/package/hxt-unicode을 찾았지만 구문 분석과 함께 사용하는 방법이 확실하지 않습니다. 유니 코드에 대한 지원은 훨씬 더 명백 했었습니다 : http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html 이 모듈은 명백한 이유없이 최신 버전 (작성 당시 9.3.1.0)에서 제거되었습니다. 그 뒤에있는 동기는 무엇 이었습니까?

누군가 HXT를 사용하는 방법에 대한 예제 코드도 제공 할 수 있습니까? 이 점에서 위키 페이지는 심각하게 부족합니다. 고맙습니다.

+0

"하스켈에서 유니 코드 XML을 처리하는 공식 솔루션"을 발표하는 사무실은 무엇입니까? 권장할만한 것이 아닌 HXT에 관해서는 https://github.com/UweSchmidt/hxt에 예제 파일이 있습니다. – applicative

답변

3

패키지는 텍스트 데이터를 저장하는 데 Text 데이터 유형을 사용합니다. 지난 몇 년 동안 표준 텍스트 데이터 표현이되었습니다. xml-conduit은 잘 관리 된 패키지이며 개인적으로 엄청난 양의 오픈 소스와 상용 코드에 사용했습니다.

관련 문제