2009-09-06 6 views
0

SAX 파서를 작성했습니다. attibute 값이 큰 따옴표 안에 중첩되어 있으면 잘 작동합니다. 하지만 인용문을 사용하지 않으면 예외가 발생합니다. 파서가 특성 값이 따옴표 안에 들어 있지 않은 XML 파일을 구문 분석하기를 원합니다. 값 1은 내부되지 않습니다자바에서 XML 파일 구문 분석

난 내 파서 위의 파일을 구문 분석 할 수있는 인용 것을

<root> 
    <tag1 attribute1=value1 > my data </tag1> 
</root> 

참고 : 나는 파일의 다음과 같은 유형을 분석하려면? 그렇다면 어떻게?

답변

6

well-formed XML이 아니기 때문에 SAX 파서가 읽을 수 없습니다. 모든 속성 값은 작은 따 H 표 또는 큰 따 H 표로 -어야합니다.

파서가 그것을 읽게하려면 관련 라이브러리와 함께 정돈/정화/수정해야합니다.

+0

실제로 XML은 올바른 형식이 아닙니다. 유효성이란 DTD, XSD 또는 XML에 적용되는 다른 종류의 구문 제약 조건에 대한 유효성 검사를 말합니다. –

+0

나는 '추가 제약 조건'을 의미했다 ... 죄송합니다. –

0

시도의 NekoHTML (http://nekohtml.sourceforge.net/usage.html)

예컨대

package sample; 

import org.apache.xerces.parsers.AbstractSAXParser; 
import org.cyberneko.html.HTMLConfiguration; 

public class HTMLSAXParser extends AbstractSAXParser { 
    public HTMLSAXParser() { 
     super(new HTMLConfiguration()); 
    } 
}