2016-10-28 2 views
1

편집 전후에 위키피디아 페이지에서 편집 한 텍스트를 가져오고 싶습니다. 이 URL을 가지고 있습니다 :위키 백과에서 편집하기위한 API

https://en.wikipedia.org/w/index.php?diff=328391582&oldid=328391343 

그러나 나는 프로그램에서 직접 사용할 수 있도록 json 형식의 텍스트를 원합니다. MediaWiki에서 제공 한 API가 편집 후 이전 텍스트와 새 텍스트를 제공합니까? 아니면 파서를 사용하여 HTML 페이지를 구문 분석해야합니까?

+0

음, JSON 형식 출력 옵션이 있습니다 ... https://en.wikipedia.org/w/api.php?action=help&modules=json –

+0

시도했지만 작동하지 않았습니다. – Hellboy

+0

어떻게 시도 했습니까? 비교 API 사용? https://en.wikipedia.org/w/api.php?action=help&modules=compare –

답변

1

이 시도 : https://www.mediawiki.org/wiki/API:Revisions

등의 사용이 될 수있는 몇 가지 옵션이 있습니다 :

  1. rvparse : 구문 분석 개정 내용. 성능상의 이유로이 옵션을 사용하면 rvlimit가 1로 적용됩니다.

  2. rvdifftotext : 각 리비 전을 diff 할 텍스트입니다.

사람들은 여전히 ​​거기에 실패하면

  1. rvprop/IDS : 당신은 일단 다음, 이후 1.16에서의 parentid

을 revid을 얻고 부모 ID, 당신은 둘의 텍스트를 비교할 수 있습니다.

관련 문제