2013-07-23 4 views
4

그래서 내 데이터가 난 돼지의 데이터가 사용하는 것을 읽을 때이CSV는 CSV 파일은

asdf, asdf, "adsf,qwef", asdf 

같이 보입니다 쉼표 인용 포함

PigStorage(',') 

그것은 "adsf, qwef을"저장 두 개의 데이터로 저장하고 비슷하게 저장합니다.

{ "adsf } { qwef" } 

견적을 단일 데이터로 취급하고 싶습니다.

어떻게해야합니까?

임씨는이를 위해 돼지 스크립트를 작성하려고합니다. (가) ... 식별자입니다

data = LOAD 'my.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage() 
    AS (...); 

:

답변

5

당신은 CSVLoader를 사용해야합니다.

참고 : Piggybank를 먼저 등록해야합니다. 여기 세부 정보 : https://cwiki.apache.org/confluence/display/PIG/PiggyBank

+0

이것은 돼지 외에 별도의 기능입니까? – JaemyeongEo

+0

왜냐하면 저에게 오류가 발생합니다. ** 2013-07-23 10 : 06 : 17,190 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1070 : org.apache.pig.piggybank.storage를 해결할 수 없습니다. 가져 오기를 사용하는 CSVExcelStorage : [, org.apache.pig.builtin., org.apache.pig.impl.builtin.] ** – JaemyeongEo

+2

ok. 해결 됐어. piggybank를 등록해야했다. – JaemyeongEo