그 경우 파일의 크기가 일정하다는 것을 알았습니다 (압축 옵션을 선택한 경우 128 바이트). 파일에 내용이 없는지 확인하는 API 또는 방법이 있습니까?hadoop 시퀀스 파일이 비어 있는지 확인하는 방법
0
A
답변
2
파일을 열고 첫 번째 키/값 쌍을 가져 오는 것 외에는없는 것입니다. 그 이유는 각 블록의 레코드 수를 자세히 설명하는 헤더가 없기 때문입니다 (주로 데이터가 스트리밍되기 때문에 헤더가 쓰여질 때 키 수에 대한 사전 지식이 없습니다).
이러한 '빈'파일을 만드는 것을 피하는 방법에 대한 몇 가지 이전 스레드가 있었지만 출력하는 값의 수를 추적하는 자체 OutputFormat 및 OutputComitter를 만드는 것이 유일한 방법이었습니다. 데이터가 기록되지 않으면 파일을 커밋하지 않습니다.
0
한 HDFS 이러한 빈 파일을 커밋 피하기 위해 내가 SequenceFileOutputFormat 확장에 쓴 블로그를 열고 HDFS 또는 S3
하둡 FS -text path_of_sequence_file
관련 문제
- 1. 비어 있는지 확인하는 방법
- 2. hadoop- 파일이 쓰여지고 있는지 확인하십시오.
- 3. NSString이 비어 있는지 확인하는 방법
- 4. ImageField가 비어 있는지 확인하는 방법
- 5. sqlParameter가 비어 있는지 확인하는 방법?
- 6. plist가 비어 있는지 확인하는 방법
- 7. UITableViewCells가 비어 있는지 확인하는 방법
- 8. 변수가 비어 있는지 확인하는 방법
- 9. 개체가 비어 있는지 확인하는 방법?
- 10. 폴더가 비어 있는지 확인하는 방법
- 11. 파일이 비어 있는지 확인하십시오.
- 12. Symfony2 : 파일 입력이 비어 있는지 확인하는 방법
- 13. 파일이 열려 있는지 확인하는 방법
- 14. xml 파일이 비어 있는지 확인
- 15. 레코드 집합 행이 비어 있는지 확인하는 방법?
- 16. TCL에서 stdin 버퍼가 비어 있는지 확인하는 방법?
- 17. 루아에서 값이 비어 있는지 확인하는 방법?
- 18. Flex에서 XMLList가 비어 있는지 확인하는 방법
- 19. 날짜 위젯이 비어 있는지 확인하는 방법?
- 20. 동적 요소가 비어 있는지 확인하는 방법.
- 21. ABNewPersonViewController에서 모든 필드가 비어 있는지 확인하는 방법
- 22. ASP.NET [SqlDataSource1이 비어 있는지 확인하는 방법]
- 23. 2 차원 배열이 비어 있는지 확인하는 방법
- 24. Emacs Lisp에서 문자열이 비어 있는지 확인하는 방법?
- 25. SimpleList 또는 SimpleRecord가 비어 있는지 확인하는 방법
- 26. 내 데이터 테이블이 비어 있는지 확인하는 방법
- 27. jquery sortable list가 비어 있는지 확인하는 방법
- 28. Excel : VBA로 셀이 비어 있는지 확인하는 방법?
- 29. Hadoop 시퀀스 파일의 압축
- 30. 파일이 이미 COBOL에서 열려 있는지 확인하는 방법?
에 시퀀스 파일을 확인하고 여기에 간단한 솔루션 - HTTP : //whiteycode.blogspot.com/2012/06/hadoop-removing-empty-output-files.html –
Chris, 블로그가 매우 유용했습니다. 고마워요! – kee
최근 출시 된 Hadoop (1.0.0+)에서는 비슷한 일을하는 org.apache.hadoop.mapreduce.lib.output.LazyOutputFormat을 소개했습니다. –