DBpedia는 관계형 데이터베이스로 가져 오기에 적합한 테이블로 데이터를 방금 발표했습니다. SQL을 사용하여이 데이터를 온라인으로 쿼리하려면 어떻게합니까?SQL을 사용하여 DBpedia를 온라인으로 쿼리하는 방법은 무엇입니까?
데이터 집합 : http://wiki.dbpedia.org/DBpediaAsTables
DBpedia는 관계형 데이터베이스로 가져 오기에 적합한 테이블로 데이터를 방금 발표했습니다. SQL을 사용하여이 데이터를 온라인으로 쿼리하려면 어떻게합니까?SQL을 사용하여 DBpedia를 온라인으로 쿼리하는 방법은 무엇입니까?
데이터 집합 : http://wiki.dbpedia.org/DBpediaAsTables
나는, 원시 데이터를했다 BigQuery에에 업로드하고 공개. 지금까지 나는 '사람'과 '장소'테이블을 가지고 그것을했습니다. 확인 : https://bigquery.cloud.google.com/table/fh-bigquery:dbpedia.person.
이제 예를 들어, 가장 인기있는 모교가 무엇인지하기 쉽습니다 :
SELECT COUNT(*), almaMater_label
FROM [fh-bigquery:dbpedia.person]
WHERE almaMater_label != 'NULL'
GROUP BY 2
ORDER BY 1 DESC
어떤 사람들은 하나 이상의 모교를 가지고 그것은 조금 더 복잡한 것보다 - 그리고 특정 방법 DBpedia 인코딩합니다. 나는 http://www.reddit.com/r/bigquery/comments/1rjee7/query_wikipedia_in_bigquery_the_dbpedia_dataset/에 완전한 질의를 남겼다.
, BTW 상단 모교은 다음과 같습니다 당신도 할 수
494 Harvard University
320 University of Cambridge
314 University of Michigan
267 Yale University
216 Trinity College Cambridge
테이블 간의 조인.
예를 들어, 건축가가있는 각 건물 (장소 테이블에서) : 건축가는 몇 년 태어 났습니까? 그 해에 태어난 건축가가 몇 명이나되는 건물이 DBpedia에 등록되어 있습니까?
SELECT COUNT(*), LEFT(b.birthDate, 4) birthYear
FROM [fh-bigquery:dbpedia.place] a
JOIN EACH [fh-bigquery:dbpedia.person] b
ON a.architect = b.URI
WHERE a.architect != 'NULL'
AND birthDate != 'NULL'
GROUP BY 2
ORDER BY 2
결과 :
...
8 1934
13 1935
9 1937
7 1938
17 1939
7 1941
1 1943
15 1944
10 1945
12 1946
7 1947
9 1950
20 1951
1 1952
...
의 규정에 따라 허가에 버전 3.4에서 (DBpedia 데이터를 (구글 BigQuery를 매월 100GB의 최대 쿼리 무료 월간 할당량이) 크리에이티브 커먼즈 저작자 표시 - ShareAlike 3.0 라이센스 및 GNU 무료 문서 라이센스 http://dbpedia.org/Datasets#h338-24)