저는 파이썬에서 위키 피 디아 페이지를 구문 분석하려고 시도 해왔고 API를 사용하여 꽤 성공적이었습니다.파이썬에서 위키 백과 페이지를 구문 분석하는 방법은 무엇입니까?
그러나 API 설명서는 모든 데이터를 얻기에 너무 골격 인 것처럼 보입니다. 지금, 나는이
http://en.wikipedia.org/w/api.php?action=query&prop=extracts&titles=China&format=json&exintro=1
그러나에 requests.get() 호출을하고있어이는 나에게 첫 번째 단락을 반환합니다. 전체 페이지가 아닙니다. 나는 allpages와 검색을 사용하려고했지만 아무 소용이 없다. 위키 페이지에서 데이터를 얻는 방법에 대한 더 나은 설명은 실질적인 도움이 될 것입니다. 이전 쿼리에서 반환 된 모든 데이터 및 소개뿐 아니라
나는 철자법 실수를 알아 냈다. urllib은 내가 편집 한 내용에서 고쳤다. –
Thanks @JakobBowyer 그것을 깨닫지 못했다. –