2017-12-23 1 views
0

위키 피 디아 페이지의 내용을 구문 분석하고 싶습니다. 그러나 이해가 안되는 부분이 있습니다. 누군가 나를 도울 수 있습니까?파싱 위키 피 디아 Json

: 중국 정치가이 mentoined되는이 페이지에서

https://it.wikipedia.org/wiki/Anni_690_a.C.

: 나는 위키 피 디아 페이지가 "진 원 총리 공"

가 나는를 얻기 위해 다음과 같은 웹 서비스를 사용하려고 콘텐츠에 있지만 json에는 "Jin Wen Gong"에 대한 데이터가 없습니다.

https://it.wikipedia.org/w/api.php?action=query&prop=revisions&rvlimit=1&titles=Anni_690_a.C.&rvprop=content&format=json

어떻게 제대로 위키 피 디아를 구문 분석합니까?

당신이 찾고있는 부분은 페이지를 편집을 시작하면 당신이 볼 수있는 페이지의 내용에 직접하지
+3

웹 페이지에는 Jin Wen Gong에 대한 내용이 포함되어 있지 않으므로 구문 분석 문제가 아닙니다. – Mureinik

+0

공정하게하려면 _code_에 없지만 페이지에 생성 된 것 같습니다. – Nanne

+0

wikitext를 파싱하는 것이 항상 최후의 수단이어야합니다. 일반적으로 [더 나은 옵션] (https://stackoverflow.com/questions/33862336/how-to-extract-information-from-a-wikipedia-infobox)을 사용할 수 있습니다. 당신이하려는 일을 말하지 않았기 때문에 그것이 사실인지 여부를 말하기는 어렵습니다. – Tgr

답변

0

: 당신은 또한 jin wen gong

당신이 그것을 볼 부분의 메모를 볼 수 없습니다 이 위키 코드에서 생성됩니다 :

{{Bio decennio a.C.|Morti|69}} 

이 코드는 JSON에 있습니다.

위키피디아에서는 사람 목록 (아마도이 ​​해에 사망 한 사람들, 내가 이탈리아 인이라고 생각한다면?)으로 번역됩니다.

+0

감사합니다. 나는 올바른지 이해하고 있습니까? 작성자가 텍스트를 올바른 구조로 추가하지 않았으므로 해당 텍스트를 구문 분석 할 수 없습니까? –

+0

이'bio decennio'가 어떻게 작동하는지에 대한 어떤 언급도 찾을 수 없지만, 편집 페이지에 있다면'json'에서 볼 수있는 것과 같은 코드를 볼 수 있습니다 -> 내가 붙여 놓은 것은 일종의 것입니다 다른 페이지 나 부품에 대한 참조 (기본적으로, 그것은이 decennium (ac 69)와 죽음에 대해 뭔가를 말하고있는 것처럼 보입니다) 그래서 어딘가에 링크되어 있습니까? 그러나 확실하지 않은 곳. – Nanne

+0

템플릿에는 [Nati nel 697 a.C.] (https://it.wikipedia.org/wiki/Nati_nel_697_a.C.) 페이지가 포함되어 있습니다. (글쎄, 당신이 인용 한 것은 [Morti nel 690 a.C.] (https://it.wikipedia.org/wiki/Morti_nel_690_a.C.)이지만 Jin Wen Gong의 출처가 아닙니다.) – Tgr

관련 문제