2011-11-14 3 views
3

tripplestore (AllegroGraph)로 가져 오려는 일부 RDF 파일이 있지만 첫 번째 파일에 인식 할 수없는 문자가 있다는 SAX 파서 오류가 발생합니다. 문제의 라인을 제거한 후에 모든 것이 훌륭합니다. 그렇다면 W3C RDF 유효성 검사기와 Jena를 RDF에서 오류 줄과 함께 사용하려했지만 정의되지 않은 언어에 대해서는 일부 경고가있었습니다 (오류 줄에 대해서는 전혀 없습니다). RDF 파일의 오류를 찾는 방법 (가능한 경우 java)을 제안 해 주시겠습니까?RDF 읽기/파싱 오류

편집 : 문제의 라인은 다음과 같습니다 당신은 유효성 검사를 할 참깨의 Rio parser을 사용할 수 있습니다

<gn:alternateName xml:lang="got">&#66352;&#66374;&#66354;&#66352;&#66365;&#66361;&#66371;&#66372;&#66352;&#66365;</gn:alternateName> 
+0

출력에 대해 더 자세히 설명해 주시겠습니까? 정확한 오류 메시지는 무엇이며 또한 오류를 생성하는 선은 어떻게 생깁니 까? –

답변

1

. 리오와 함께 일하는 방법에 대한 일반적인 지침은 this blogpost입니다. 특히 유효성 검사를 위해 세부적인 경고 및 오류를 파서에서받은 을 만들고 첨부하는 것이 트릭입니다.

그러나 문제는 SAX/XML 레벨에서 발생한다는 것을 언급 했으므로 일반 XML 유효성 검사기를 사용하여 잘못된 것을 확인할 수도 있습니다. 가장 가능성있는 원인 (하지만 세부 정보 없이는 말하기 어렵습니다)은 어딘가에 잘못 인코딩 된 문자가 있다는 것입니다.