파이썬과 MySQL을 사용하여 mediawiki 데이터베이스를 쿼리하여 기사의 현재 상태 (즉, 기사가 FA, GA, GAN 등)를 가져올 수 있지만 그렇게 할 수 없었습니다.위키피디아 기사의 현재 상태를 얻으시겠습니까?
현재 상태가 텍스트 테이블의 old_text
필드에 저장되어 있다는 것을 알고 있습니다. 내가 좋아하는 뭔가를 시도했다 :
loc = select (locate('currentstatus', old_text))
query = ('select substring(old_text, '%s', 20) from wikidb where page_id = 1234' % (loc))
하지만 불행히도 LOC는 currentstatus
의 첫 번째 항목 및 최신/최신 상태가 바닥에 있기 때문에 매우 '현재'하지 않은 마지막하지를 제공합니다.
해결 방법이나 올바른 접근 방법을 사용하고 있는지 확실하지 않습니다.
어떤 SQL API를 사용하고 있습니까? 데이터의 출처는 어디입니까? 'currentstatus' 필드의 형식 만 지정해도 누군가가 여러분을 도울 수 있다고 확신합니다. –
데이터베이스 필드'old_text'의 형식은 무엇입니까? –
필자는 기사를 다운로드하기 위해 특별한 내보내기를 사용했다. 그런 다음 나는 mediawiki 데이터베이스로 가져왔다. 나는 mysqldb (mysql 용 파이썬 모듈)를 사용하여 mediawiki를 쿼리한다. old_text는 blob이며 currentstatus 형식은 http://en.wikipedia.org/wiki/Template:ArticleHistory에서 볼 수 있습니다. – hopeful