2012-02-03 2 views
1

PIG를 사용하여 CSV 파일을 읽고 싶습니다. 어떻게해야합니까?. load n pigstorage (',')를 사용했지만 CSV 파일을 제대로 읽지 못하는 이유는 데이터에서 쉼표 (,)가 나뉘어져 있기 때문입니다. 데이터에 쉼표가 있으면 delimeter를 제공해야합니까?데이터가 들어오는 PIG에서 파일을 읽는 중

답변

2

당신이 PiggyBank에서 CSVLoader 로더 살펴 경험이 당신이 포함 된 CSV 파일을 읽으려면? (물론 파일 형식이 유효해야합니다)

+0

내가 시도 고맙습니다과 작업 .. –

+0

에 맞는 구분 무엇을 내가 CSV..i가 CSVExcelStorage을 가지고 있지만 거기 piggybank.jar과 내가 만들 수 없습니다 오전으로 파일을 저장하려면 그것 .. 어떤 제안? –

-1

먼저 올바른 CSV 파일이 있는지 확인하십시오. 이 경우 원본 파일을 Excel (파일이 작 으면) 또는 다른 도구로 변경하지 말고 데이터에 적합한 구분 기호 (예 : \ t 탭,; 등)로 새 CSV를 내 보냅니다. "좋은"구분 기호가있는 다른 추출을 더 잘 수행 할 수도 있습니다. 부하의

예 사항은 다음과 같이 할 수있다 : (';')

TABLE = LOAD 'input.csv'PigStorage을 사용 (사이트 ID AS : INT, 이름 : chararray, ...); 덤프의

예 : 'clean.csv'PigStorage를 사용하여 ('') INTO

STORE 테이블; < - 당신에게 가장

관련 문제