2011-08-23 3 views
3

XML 데이터를 파싱하기 위해 ConstructingParser를 사용하고 있습니다. 나는 XML 조각 같은 것을 발견했다.scala.xml.parsing.Parser 파싱 텍스트 컨텐츠 분할하기

<foo> bar & lt; 바즈 </foo를 포함 >

Elem 모델은 하나의 텍스트 아이가 "바 < 바즈을"containg 대신 별도의 세 가지 텍스트 자식 노드 하나 포함 "바"가없는 루트, 하나는 "<"를 포함하는 하나의 "바즈 ". 이렇게하면 문서의 후속 처리가 중단됩니다. 물론 Text 요소를 직접 병합 할 수는 있지만, ConstructingParser가 나를 위해이 작업을 수행 할 수있는 방법이 있는지 궁금합니다.

Gr. 실비오

답변

0

스칼라는 아직 내 것이 아니지만 대답은 "아니오"입니다. 단일 텍스트 노드로 구문 분석 한 후에 요소의 텍스트 내용이 나타날 것이라는 보장은 전혀 없습니다. 이 경우에는 텍스트, 엔티티 참조 및 기타 텍스트가 있으므로 결과가 텍스트 노드 세 개라는 것은 그리 놀라운 일이 아니지만 어쨌든 보장은 없습니다.

관련 문제