2013-11-27 3 views

답변

2

나는, 원시 데이터를했다 BigQuery에에 업로드하고 공개. 지금까지 나는 '사람'과 '장소'테이블을 가지고 그것을했습니다. 확인 : https://bigquery.cloud.google.com/table/fh-bigquery:dbpedia.person.

이제 예를 들어, 가장 인기있는 모교가 무엇인지하기 쉽습니다 :

SELECT COUNT(*), almaMater_label 
FROM [fh-bigquery:dbpedia.person] 
WHERE almaMater_label != 'NULL' 
GROUP BY 2 
ORDER BY 1 DESC 

어떤 사람들은 하나 이상의 모교를 가지고 그것은 조금 더 복잡한 것보다 - 그리고 특정 방법 DBpedia 인코딩합니다. 나는 http://www.reddit.com/r/bigquery/comments/1rjee7/query_wikipedia_in_bigquery_the_dbpedia_dataset/에 완전한 질의를 남겼다.

, BTW 상단 모교은 다음과 같습니다 당신도 할 수

494  Harvard University 
    320  University of Cambridge 
    314  University of Michigan 
    267  Yale University 
    216  Trinity College Cambridge 

테이블 간의 조인.

예를 들어, 건축가가있는 각 건물 (장소 테이블에서) : 건축가는 몇 년 태어 났습니까? 그 해에 태어난 건축가가 몇 명이나되는 건물이 DBpedia에 등록되어 있습니까?

SELECT COUNT(*), LEFT(b.birthDate, 4) birthYear 
FROM [fh-bigquery:dbpedia.place] a 
JOIN EACH [fh-bigquery:dbpedia.person] b 
ON a.architect = b.URI 
WHERE a.architect != 'NULL' 
AND birthDate != 'NULL' 
GROUP BY 2 
ORDER BY 2 

결과 :

... 
8 1934 
13 1935 
9 1937 
7 1938 
17 1939 
7 1941 
1 1943 
15 1944 
10 1945 
12 1946 
7 1947 
9 1950 
20 1951 
1 1952 
... 

의 규정에 따라 허가에 버전 3.4에서 (DBpedia 데이터를 (구글 BigQuery를 매월 100GB의 최대 쿼리 무료 월간 할당량이) 크리에이티브 커먼즈 저작자 표시 - ShareAlike 3.0 라이센스 및 GNU 무료 문서 라이센스 http://dbpedia.org/Datasets#h338-24)

관련 문제