2013-06-14 1 views
0

위키피디아의 데이터 만 으로 가져와 터키어 용 MySQL 데이터베이스로 가져와야합니다. 이미 http://dumps.wikimedia.org/trwiki/20130606/에 덤프 파일이 있습니다. 하지만 정확한 infoxboxdata는 어디에 존재합니까? 그게 내가 생각하는 많은 다른 정보를 포함하기 때문에Wikipedia infobox 데이터 만 찾아서 MySQL 데이터베이스로 가져 오는 방법은 무엇입니까?

인포 박스 데이터가 trwiki-20130606-페이지 - 기사 - multistream.xml.bz2에있는 경우는, 어떻게, 거기에서 단지 정보 상자의 데이터를 얻을 수 있을까?

+0

당신은 infoboxes 찾고 기사의 텍스트를 구문 분석해야합니다. 그 주위에 방법이 없습니다. – svick

답변

0

이 라이브러리를 사용하지 않았지만 infobox2rdf을 (를) 찾을 수 있습니다.

관련 문제