How to export text from all pages of a MediaWiki?과 관련이 있지만 출력물을 페이지 제목을 사용하여 이름이 지정된 개별 텍스트 파일로 지정합니다.mediawiki에서 모든 페이지를 개별 페이지 파일로 내보내는 방법은 무엇입니까?
SELECT page_title, page_touched, old_text
FROM revision,page,text
WHERE revision.rev_id=page.page_latest
AND text.old_id=revision.rev_text_id;
은 stdout과 모든 페이지를 한 번에 덤프합니다.
개별 파일로 분할하고 덤프하는 방법은 무엇입니까?
는 해결
하나 개의 파일로먼저 덤프 : 당신은 어떤 파이썬 지식을 가질 경우
with open('wikipages.csv', 'rb') as f:
alltxt = f.read().split('\[email protected]@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@\n')
for row in alltxt:
one = row.split('\n')
name = one[0].replace('/','-')
try:
del one[0]
del one[0]
except:
continue
txt = '\n'.join(one)
of = open('/tmp/wikipages/' + name + '.txt', 'w')
of.write(txt)
of.close()
히스토리가없는 dumpgenerator.py도 있습니다. – Nemo