수백만 행 (5TB + 테이블)의 중첩 JSON에서 값을 가져 오려고합니다. 가장 효율적인 방법은 무엇입니까?하이브 : JSON 구문 분석
{"country":"US","page":227,"data":{"ad":{"impressions":{"s":10,"o":10}}}}
나는 위의 JSON에서이 값이 필요합니다 :
Country Page impressions_s impressions_o
--------- ----- ------------- --------------
US 2 10 10
이 하이브의 json_tuple 기능입니다, 나는 이것이 최고의 기능입니다 확실하지 않다 여기
은 예입니다. https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-getjsonobject