2013-07-09 3 views
0

돼지 스크립트를 쓸데없는 소리로 실행하면 출력이 좋아 보인다. 아래는 내가 FULL_NAME, 이메일, birth_year, 성별을 볼 수 있지만 내가 실행할 때 같은 자바에게자바 스크립트를 통한 PIG 출력 차이

package com.chegg.hwh.tracking.dao; 

import org.apache.pig.ExecType; 
import org.apache.pig.PigServer; 

public class HWHDataPigMapReduce { 

    public static void main(String args[]) throws Exception { 
     PigServer pigServer = new PigServer(ExecType.LOCAL); 

     pigServer.registerQuery("rows = LOAD 'cassandra://hwh_tracking/users' USING org.apache.cassandra.hadoop.pig.CassandraStorage();"); 
     pigServer.registerQuery("emailgroup = group rows by email;"); 
     pigServer.dumpSchema("emailgroup"); 

    } 

} 

출력 사용 할 수

2013-07-08 16:58:40,640 [main] INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - Success! 
2013-07-08 16:58:40,647 [main] INFO org.apache.hadoop.mapreduce.lib.input.FileInputFormat - Total input paths to process : 1 
2013-07-08 16:58:40,647 [main] INFO org.apache.pig.backend.hadoop.executionengine.util.MapRedUtil - Total input paths to process : 1 
((email,[email protected]),{(rrr24,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr10,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr20,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr23,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr9,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr8,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr22,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr21,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{})}) 
((email,[email protected]),{(rrr0,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr6,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr7,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr3,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr1,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr5,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr4,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{}),(rrr2,(full_name,rachana),email,(state,ca),(birth_year,2013),(gender,female),{})}) 
grunt> 

의 예입니다 : 내가 같이 사용하여 시도

emailgroup: {group: (name: chararray,value: chararray),rows: {(key: chararray,full_name: (name: chararray,value: chararray),email: (name: chararray,value: chararray),state: (name: chararray,value: chararray),birth_year: (name: chararray,value: long),gender: (name: chararray,value: chararray),columns: {(name: chararray,value: bytearray)})}} 

은 (full_name : chararray)하지만 차이는 없습니다. 내가 여기서 무엇을 놓치고 있는지. 애니스톤이 도와 줄 수 있니?

+0

당신은 당신이 꿀꿀에서 실행중인 코드를 첨부 할 수 있을까? – Frederic

+0

rows = LOAD 'cassandra : // hwh_tracking/users'사용 org.apache.cassandra.hadoop.pig.CassandraStorage(); emailgroup = 이메일을 행별로 그룹화하고 이메일 그룹을 덤프합니다. – plzdontkillme

답변

1

Java 코드에서 dumpSchema(String alias)을 호출합니다. 이는 grunt에서 DESCRIBE을 호출하는 것과 유사합니다. 이것이 출력이 다른 이유입니다.

다음과 같이 쿼리의 결과를 저장할 수는 :

도 시도 getExamples()pigServer.store("emailgroup", "out");, 그래도 난 그것을 사용한 적이있다.

http://pig.apache.org/docs/r0.11.1/api/org/apache/pig/PigServer.html

+0

콘텐츠를 표시하려면 무엇을 사용해야합니까? – plzdontkillme

+0

답변을 수정했습니다. – Frederic

관련 문제