PIG에서 스키마 &을 언급하지 않고 LOAD 문을 사용하여 CSV 파일을로드 할 때 기본 PIGSTORAGE (\ t)를 사용하면 어떻게됩니까? 로드가 제대로 작동하고 데이터를 덤프 할 수 있습니까? 그렇지 않으면 파일에 ','가 있고 pigstorage가 '/ t'이므로 오류가 발생합니다. 조언을 부탁하십시오PIG에서 CSV 파일로드
0
A
답변
2
PigStorage ('\ t')를 사용하여 스키마를 정의하지 않고 csv 파일을로드하면 입력 파일의 각 행에 탭이 없기 때문에 전체 행이 하나의 튜플로 취급됩니다. 줄에있는 개별 단어에 액세스 할 수 없습니다.
예 : 입력 파일 :
john,smith,nyu,NY
jim,young,osu,OH
robert,cernera,mu,NJ
a = LOAD 'input' USING PigStorage('\t');
dump a;
OUTPUT:
(john,smith,nyu,NY)
(jim,young,osu,OH)
(robert,cernera,mu,NJ)
b = foreach a generate $0, $1, $2;
dump b;
(john,smith,nyu,NY,,)
(jim,young,osu,OH,,)
(robert,cernera,mu,NJ,,)
이상적 B 했어야 : 구분 쉼표 이었다면
(john,smith,nyu)
(jim,young,osu)
(robert,cernera,mu)
. 그러나 구분 기호가 탭이고 입력 레코드에 탭이 없으므로 전체 줄은 하나의 필드로 취급됩니다. 돼지가 무언가가 null이면 돼지 코뿔소가 불평합니다. null이있을 때 아무 것도 출력하지 않습니다. 따라서 b
을 덤프 할 때 쉼표 만 볼 수 있습니다.
희망이 유용했습니다.
관련 문제
- 1. csv 파일로드
- 2. PIG에서 .csv 파일을 가져 오거나로드하는 방법은 무엇입니까?
- 3. PIG에서 XLSX 파일을 CSV 파일로 변환하는 방법?
- 4. 데이터베이스에 CSV 파일로드
- 5. 폴더에서 .csv 파일로드
- 6. 커서가없는 CSV 파일로드
- 7. SQLite로 여러 CSV 파일로드
- 8. ssis의 CSV 확장자가있는 파일로드
- 9. MySQL에 CSV 파일로드 오류
- 10. 수행 방법 Apache Pig에서 매개 변수화 된 이름의 파일로드
- 11. PHP로 CSV 파일로드 및 읽기
- 12. 자바 스크립트 파일에 CSV 파일로드
- 13. sqlloader를 사용하여 테이블에 CSV 파일로드
- 14. F # Deedle의 csv 파일로드 시간
- 15. 데이터베이스 테이블 Wordpress에 CSV 파일로드
- 16. Python 오라클 테이블에 csv 파일로드
- 17. sqlldr을 사용하여 1500 CSV 파일로드
- 18. 선택 사항을 기반으로 CSV 파일로드
- 19. 스레드 또는 커서 CSV 파일로드 중
- 20. H2 데이터베이스의 클래스 경로에있는 CSV 파일로드
- 21. dataloader를 사용하여 디렉토리에서 여러 csv 파일로드
- 22. 쉼표 뒤에 공백이 섞인 CSV 파일로드
- 23. 그래서 내가 몇 CSV 파일로드 "변수"
- 24. MapReduce를 사용하여 Hbase 테이블에 CSV 파일로드
- 25. Python EC2 스크립트의 Google 드라이브에 CSV 파일로드
- 26. 데이터가 들어오는 PIG에서 파일을 읽는 중
- 27. Apache Pig에서 UDF 실행
- 28. Apache Pig에서 JOIN
- 29. PIG에서 패턴이있는 파일 읽기
- 30. PIG에서 다른 json 스키마로드
1)로드 선언문을 표시하고 2) 직접 시도해보십시오. – Andrew