2013-03-12 5 views
0

필드의 변수 번호가 돼지에서 파일을로드하는 방법 :나는 다음과 같은 기록을 포함하는 입력 파일이

Movie1  Actor 1, Actor 2, Actor 3, ......, Actor n 
Movie2  Actor 1, Actor 2,.......Actor n 

내가

movies = LOAD 'movies.imdb' AS (......); 
돼지

의 가방에이 데이터를로드 할을

입력 파일의 레코드에 가변 개수의 필드가있을 수 있으므로 "AS"필드를 채우는 방법을 모르겠습니다.

답변

2

당신은이 작업을 수행 할 수 있습니다 :

movies = LOAD 'movies.imdb' USING PigStorage(','); 

을 기록 필드를 고정하지 않는 경우, 답장을 보내

+0

감사 할 수 없습니다 AS을 사용. 필자는 입력 파일에서 영화 이름과 배우 목록이 탭으로 구분되어 있지만 액터 목록은 ","로 구분되어 있으므로이로드 명령을 사용하여 데이터를 올바르게로드 할 수 있습니까? – Chaos

+2

그럴 경우 탭을 사용합니다. movies = LOAD 'movies.imdb'USING PigStorage ('\ t'); 그런 다음 STRSPLIT 함수를 사용하여 배우의 튜플을 만듭니다. – seedhead

+0

감사합니다. – Chaos

관련 문제