2011-01-25 6 views
2

나는 제목과 H.I.M.Y.M 및 TBBT의 사용 가능한 마지막 에피소드의 방송일을 표시하는 개인 TV 가이드 같은 것을 만들려고 노력하고 있습니다.위키 백과에서 특정 콘텐츠를 가져 오는 방법은 무엇입니까?

이 정보를위한 자원으로 나는 위키 백과를 사용하기로 결정했다. 나는 Wikipedia가 자신의 API를 가지고 있으며 꽤 많은 시간 동안 문서를 조사 해왔다. 그러나 그것은 매우 광범위하며 어디서부터 시작해야할지 모른다.

http://en.wikipedia.org/w/api.php?action=query&title=List_of_How_I_Met_Your_Mother_episodes&prop=info&format=dbg 

다음과 같은 배열 수신 :

array (
    'query' => 
    array (
    'pages' => 
    array (
     6048517 => 
     array (
     'pageid' => 6048517, 
     'ns' => 0, 
     'title' => 'List of How I Met Your Mother episodes', 
     'touched' => '2011-01-25T15:33:45Z', 
     'lastrevid' => 409077359, 
     'counter' => 0, 
     'length' => 4417, 
    ), 
    ), 
), 
) 

문제는 내가 어떻게 실제에 도착하는 아무 생각입니다 지금까지 나는이 URL을 조회하고있어 점에있어 데이터 내가 찾고있는 :/ 어쩌면 누군가가 위키 피 디아 API를 좀 더 exprerience 가지고 있고 어떻게 든이 문제를 도와 줄 수 있습니다. 덕분에 미디어 위키 API는 정보의 미디어 위키의 종류에 대한 액세스를 허용하는

+2

는 RDF에 익숙하지 않은 경우, 당신은 DBPedia http://dbpedia.org/page/The_Big_Bang_Theory에 관심이있을 수 있습니다 – KingCrunch

답변

3

참고. 위키는 텍스트 페이지의 모음입니다. MediaWiki 소프트웨어가 Wikipedia에 정보를 저장하는 방식에는 상속 의미가 없습니다. 모든 것은 특별한 텍스트 기반 형식을 통해 이루어집니다.

그래서 당신이 위키 백과에 뭔가에 대한 일반적이고 일관성있는 정보를 찾을 경우에도이 소프트웨어가 그것을했기 때문에 아니라, 저자가 공통의 표준을 결정하기 때문에 데이터를 표시 할 수 있습니다. 따라서 실제 의미를 위키에서 가져 오려면 정보를 직접 파싱해야합니다. MediaWiki API를 사용하여 정확한 텍스트 표현을 얻을 수 있으며, 텍스트에 대해 찾고있는 정보를 구문 분석 할 수 있습니다. 물론 이것은 특정 정보가 은 일반적으로가 표시되는 방법 당신이 알고 있어야합니다. 그리고 물론, 항상 작동하거나 테스트하는 모든 페이지에 대해 보장 할 수는 없습니다.

관련 문제