2017-02-09 4 views
0

reddit comment bigquery 2015에서 특정 문구의 발생을 찾으려고합니다. 문구도 쿼리를 실행하여 얻은 것입니다.bigquery에서 항목의 출현을 계산하는 방법

SELECT c 
FROM (
SELECT title 
FROM [lucid-bond-156818:bquijob_658cefdf_15a212b8aaf] #the phrases I want to search within reddit comment bigquery 
SELECT COUNT(title) as c in [fh-bigquery:reddit_comments.all_2015] 
) 

나는 마지막 줄에 기본적으로 내가 말하고 싶은, 그래서 그것을 해결하는 데 문제가 SQL에서 초보자를 해요 : 문구에 액세스 할 수 있음 (열 저장) 그래서 테이블 결과를 저장 reddit 주석 2015 데이터의 제목을 계산하는 쿼리입니다.

답변

2

시작합니다 -이 제목이 등장 코멘트 수와 함께 당신에게 제목의 목록을 제공합니다
이 쿼리 아래 시도 (내가이 당신을 위해 무엇을 요구 생각 - 내가 제대로 이해 경우).

#legacySQL 
SELECT title, COUNT(1) AS occurrences 
FROM [fh-bigquery:reddit_comments.2005] AS c 
CROSS JOIN YourTableWithTitles 
WHERE body CONTAINS title 
GROUP BY title 
ORDER BY occurrences DESC 
당신이 여기에서 볼 수 있듯이, 나는 [fh-bigquery:reddit_comments.2005] 테이블 대신 [fh-bigquery:reddit_comments.all_2015]보기를 사용하고

위는 당신이 당신의 제목 title 열에 YourTableWithTitles 테이블에 저장되어 있다고 가정

. 이것은 테스트하는 동안 쿼리를 저렴하게 만드는 것입니다 (2005 테이블에는 1075 개의 행이 있지만 all_2015 뷰에는 6 억 8,800 만 개의 행이 있습니다). 최종 버전을 만들 때 해당보기로 다시 전환 할 수 있습니다.

또한이보기는 레거시 SQL로 작성되었으므로이보기를 사용하는 쿼리도 레거시 SQL에 있어야하므로 그대로 두어야합니다.

당신이 초보자로서 - 훨씬 차이되지 않습니다 -하지만 이상적으로 당신이 그것으로 조금 얻을 때 - 당신이 일

+0

BigQuery에 표준 SQL을 확인해야합니다! 정말 고맙습니다!! 한 부분을 해결할 수 있습니다 - YourTableWithTitles 부분에 대해 "표 ID"테이블 ID가 "작업 ID"인 – song0089

+0

@ song0089를 삽입해야했습니다. 실제로 답변을 수락하지 않은 곳에 많은 질문이 있습니다. 어쩌면 당신은 그 (것)들을 통해서 갈 수 있고 받아 들여진대로 제일 그들을 표를 할 수 있었다 (당연히 그들이 진짜로 당신의 문제를 해결 한 경우에)?! – Cleb

관련 문제