위키피디아 (enwiki)의 영어 버전을 위해 특별히 말하고 있습니다. 나는 SQL 덤프 (categorylinks, page, page_prop)를 다운로드하여 위키피디아의 다른 가벼운 버전을 시도했지만 영어 버전을 사용하면이 작업이 쉽지 않습니다. 나는 데이터베이스에 순간에 SQL 파일에서 데이터를 쓰고 있지만, 시간이 많이 걸릴 것이므로 다른 일을 쉽게하고 싶습니다. 실제로 데이터 작성에 성공하면 쿼리에 영원히 걸릴 수 있습니다. 그렇다면 영어 Wikipedia에서 기사 목록과 카테고리를 어떻게 컴파일 할 수 있습니까?위키 피 디아에서 기사 - 카테고리 관계 목록을 얻는 가장 쉬운 방법은 무엇입니까
0
A
답변
0
음, 쉬운 대답은 없습니다. 다운로드 및 덤프를 사용하여 기존의 컴퓨터와 매우 친숙하지 않습니다. 고맙게도 제가 사용했던 Quarry이라는 서비스가 있습니다. 위키 백과 데이터베이스를 쿼리 해 봅시다. 그러나 제한이 있으므로 위의 목록을 얻으려면 내 검색어를 limit clause
을 사용하여 작은 조각으로 잘라야하고 같은 쿼리에 +50 번 부여해야했습니다. 이 데이터를 원하는 모든 사람에게 내 quarry profile을 방문하여 Article - Categories
개의 쿼리에서 데이터를 가져올 수 있습니다.
관련 문제
- 1. 위키 피 디아에서 데이터 추출
- 2. PHP 가속기 위키 피 디아에서
- 3. 위키 피 디아에서 모든 역사적 사건을 얻는 방법?
- 4. 음악 카테고리 및 취급 업데이트로 위키 피 디아에서 이미지 다운로드
- 5. 위키 피 디아에서 통계 정보를 추출합니다.
- 6. 위키 피 디아에서 데이터를 추출하는 Python 라이브러리?
- 7. 위키 피 디아에서 가져온 텍스트 바꾸기
- 8. 위키 피 디아에서 HTML을 파싱하는 모범 사례?
- 9. 아이폰에서 위키 피 디아에서 데이터를 읽는 방법?
- 10. 위키 피 디아에서 정보 상자 정보 얻기
- 11. Htmlagilitypack을 사용하여 위키 피 디아에서 데이터 스크랩하기
- 12. 위키 피 디아에서 단어 목록 만들기
- 13. 위키 피 디아에서 30000 개의 문서를로드 중입니다.
- 14. 이해 경쟁 조건 위키 피 디아에서
- 15. 위키 피 디아에서 기사의 첫 번째 단락을 얻으십시오
- 16. 위키 피 디아 기사의 상위 카테고리 가져 오기
- 17. API를 통해 위키 피 디아 기사 길이를 얻는 방법?
- 18. 위키 피 디아에서의 빈번한 언어 기사
- 19. 위키 피 디아에서 모든 속성 가져 오기 infobox (java)
- 20. 위키 피 디아에서 사각형 크기의 이미지를 검색 할 수 있습니까?
- 21. 위키 피 디아에서 MySQL과 Perl로 무작위로 페이지를 만들 수 있습니까?
- 22. SOAP과 다른 다른 프로토콜을위한 WSDL? 위키 피 디아에서
- 23. 위키 피 디아에서 각각의 텍스트 뒤에 표제 제목을 추출하는 방법
- 24. 위키 피 디아에서 텍스트 및 수정본 diffs에 사용하는 것
- 25. 위키 피 디아에서 특정 상자에서 모든 dbpprops 받기
- 26. 위키 피 디아에서 Ajax 요청을 수행 할 수 없습니다.
- 27. 위키 피 디아에서 텍스트 콘텐츠 가져 오기 - iframe?
- 28. 위키 피 디아 페이지의 하위 카테고리
- 29. 위키 백과에서 페이지 제목이 주어진 카테고리 목록을 얻는 SQL 쿼리
- 30. MODx에서 가장 인기있는 기사 목록을 얻는 방법은 무엇입니까?
예를 들어 위키 백과에서 페이지를 검색하고 싶습니다. '앨버트 아인슈타인 ', 그리고 페이지 카테고리 등을 얻으시겠습니까? Wikipedia API를 사용하고 싶을 수도 있습니다 : https://en.wikipedia.org/wiki/Special:ApiSandbox#action=query&prop=categories&titles=Albert%20Einstein – neoDev
ApiSandBox를 사용해 보았습니다.하지만 Api가 수집 한 것에서는 한계가 있습니다. 500 레코드 중, 맞죠? 기사의 수는 4 - 5.000.000입니다. – dmarkos