2012-03-12 3 views
3

I 오전 초보자 .. RDF, RDFa를하고 몇 일 이후에 관련 거즈에 대해 배우려고 노력PHP 또는 Java를 사용하여 HTML에서 RDFa를 추출하려면 어떻게해야합니까?

..이 별도로 RDF 부분을 추출 할 수 있으며, HTML + RDFa를 코드 다음 사항을 고려한다 내 질문? 그렇다면 간단한 코드 스 니펫 (PHP 또는 Java)을 보여줄 수 있습니까?

Jena를 사용할 수 있다고 들었지만이를 설명하는 자습서를 찾을 수 없습니다. 그래서 누군가가 RDF는 HTML의 것들에 대한 추가 정보를 제공로서 당신은 HTML에서 RDF를 분리 할 수 ​​

<html xmlns="http://www.w3.org/1999/xhtml" 
xmlns:foaf="http://xmlns.com/foaf/0.1/" 
xmlns:dc="http://purl.org/dc/elements/1.1/" 
version="XHTML+RDFa 1.0" xml:lang="en"> 
    <head> 
    <title>John's Home Page</title> 
    <base href="http://example.org/john-d/" /> 
    <meta property="dc:creator" content="Jonathan Doe" /> 
    <link rel="foaf:primaryTopic" href="http://example.org/john-d/#me" /> 
    </head> 
    <body about="http://example.org/john-d/#me"> 
    <h1>John's Home Page</h1> 
    <p>My name is <span property="foaf:nick">John D</span> and I like 
     <a href="http://www.neubauten.org/" rel="foaf:interest" 
     xml:lang="de">Einstürzende Neubauten</a>. 
    </p> 
    <p> 
     My <span rel="foaf:interest" resource="urn:ISBN:0752820907">favorite 
     book is the inspiring <span about="urn:ISBN:0752820907"><cite 
     property="dc:title">Weaving the Web</cite> by 
     <span property="dc:creator">Tim Berners-Lee</span></span> 
    </span> 
    </p> 
    </body> 
</html> 

답변

3

예, RDFa 마크 업이 포함 된 페이지에서 RDF를 추출 할 수 있습니다. 추출한 후에는 데이터를 단독으로 사용하거나 RDFa를 삽입 할 수있는 로컬 RDF triplestore에 넣을 수 있습니다. 글로벌 triplestore 및 기존 RDF 데이터와 함께 쿼리 할 수 ​​있습니다.

Here은 Java RDFa 파서에 대한 관련 토론입니다.

+0

고마워 마이클 .. 링크는 매우 도움이되었다 .. – Robert

-5

.. 일부 코드를하시기 바랍니다 게시 할 수 예나 가능한 경우.

책에서 각주와 참고 문헌을 가져 와서 책을 버리는 것과 같습니다. 대체로 의미가 없습니다.

+0

안녕하세요 덕분에 ...하지만 내 질문이다 : https://github.com/njh/easyrdf/ 자바

구문 분석 RDFa를 사용합니다 (RDFa를 파서을 가지고 0.8/마스터 분기를 사용) RDFa를 추출하여 다른 처리에 사용할 수 있습니까? 10 개의 관련 HTML + RDFa 페이지가 있다고 가정 해 봅시다.이 모든 페이지에서 RDFa (별도/삭제가 아닌) 사본을 추출하고 결합하여 사용하고 싶습니다. 서버 측에서 추가 처리 (예 : DB에 삽입하거나 RDFa 등의 쿼리를 실행하려고합니다.) 가능합니까? – Robert

+0

RDF를 페이지 밖으로 가져 와서 데이터베이스에 저장하는 것이 RDF를 설명하는 데이터와 분리하지 않는다는 것을 이해하지 못합니다. 당연히 원래 HTML + RDFa 문서는 손상되지 않았지만 데이터베이스에 연결되어 있지 않습니다. – Quentin

+0

좋아요. 그렇다면 HTML + RDFa 문서의 묶음에있는 모든 트리플의 순수한 목록을 가져올 수 없습니까? 예나는 무엇을 위해 사용 되었습니까? 당신이 잠시만 기다려 주시겠습니까 ... – Robert

2

Damian의 java-rdfa을 살펴보십시오.

Class.forName("net.rootdev.javardfa.RDFaReader"); 
Model model = ... 
model.read(url, "XHTML"); // xml parsing 
model.read(other, "HTML"); // html parsing 

자바의 또 다른 옵션은 Apache Any23입니다 : 당신은 Apache Jena로 사용할 수 있습니다, 여기에 코드의 잘린입니다. PHP에서

+0

고마워 castagna .. 이것은 정확히 내가 무엇을 찾고 있었는지 .. 또한 거기에 더 많은 대안이 있습니다 당신이 말한 것과 함께 선물, Michael이 제공 한 토론 링크에 .. – Robert

+0

안녕하세요, 다음 코드를 보았습니다 Class.forName ("net.rootdev.javardfa.RDFaReader"); 모델 model = ModelFactory.createDefaultModel(); model.read ("file : /// C :/sample.HTML ","GRDDL "); model.write (System.out에,"RDF/XML "); 하지만 오류가 있습니다 : 당신이 도와 주실 수있는 처리되지 않은 예외 타입의 ClassNotFoundException \t HelloRdfWorld.java 을 .. PLZ. . – Robert

+0

GRDDL이 내 대답 인 것을 보았습니까? – castagna

관련 문제