각 dir에 N 개의 파일이있는 여러 폴더가있는 dir이 있습니다. 단일 파일 크기는 15GB입니다. 로컬에서 HDFS로 파일을 복사/이동하는 가장 좋은 방법은 무엇인지 모르겠습니다.로컬에서 hdfs로 거대한 크기의 파일을로드하는 가장 좋은 방법은 무엇입니까
0
A
답변
0
는 hdfs dfs -put /path/to/localdir/ hdfs://path/to/hdfsdir
hdfs dfs -copyFromLocal /path/to/localdir/ hdfs://path/to/hdfsdir
hdfs dfs -moveFromLocal /path/to/localdir/ hdfs://path/to/hdfsdir
hadoop distcp file:///path/to/localdir/ hdfs://namenode:port/path/to/hdfsdir
옵션 1 & 2는 동일
- 같은, (전통적인 방법을 사용)이 작업을 수행하는 방법에는 여러 가지가 있습니다 당신의 경우. 복사 시간에는 차이가 없습니다.
옵션 3은 데이터를 HDFS 파일 시스템 (
-put
과 동일)에 복사하고 로컬 파일 시스템에서 파일을 삭제할 때 시간이 더 걸릴 수 있습니다.옵션 4는 까다로운 도구입니다. 대규모 inter/intra-cluster 복사를 위해 설계되었습니다. 그러나 "file : //"접두사가있는 로컬 파일 URL을 제공하여 로컬 파일에도 동일한 명령을 사용할 수 있습니다. 도구가 MapReduce를 사용하여 병렬로 작동하도록 설계되었으며 파일이 로컬에 있으므로 최적의 솔루션 인 distcp가 아니라 해당 기능을 사용할 수 없습니다. (클러스터 노드에 마운트를 만들어서 distcp의 성능을 향상시킬 수 있습니다)
관련 문제
- 1. JS 파일을로드하는 가장 좋은 방법은 무엇입니까?
- 2. Cs에서 .sys 파일을로드하는 가장 좋은 방법은 무엇입니까?
- 3. 거대한 모양을 타일로 자르는 가장 좋은 방법은?
- 4. 자바 코드에 jrxml 파일을로드하는 가장 좋은 방법은
- 5. 화상 채팅 응용 프로그램을 로컬에서 테스트하는 가장 좋은 방법은 무엇입니까?
- 6. XML 피드를 로컬에서 캐시하는 가장 좋은 방법은 무엇입니까?
- 7. Python 웹 응용 프로그램을 로컬에서 실행하는 가장 좋은 방법은 무엇입니까?
- 8. DataGridView + DataTable, 거대한 목록을 처리하는 가장 좋은 방법은 무엇입니까?
- 9. Perl을 사용하여 거대한 CSV 파일을 읽는 가장 좋은 방법은 무엇입니까?
- 10. 웹 서버에서 거대한 파일을 가져 오는 가장 좋은 방법은 무엇입니까? #
- 11. 거대한 프로젝트에서 이름으로 함수를 찾는 가장 좋은 방법은 무엇입니까?
- 12. 거대한 SQL 파일을 구문 분석하는 가장 좋은 방법은 무엇입니까
- 13. 거대한 mysql 쿼리를 캐시하는 가장 좋은 방법은 무엇입니까?
- 14. 거대한 json을 node.js 스크립트에 포함시키는 가장 좋은 방법은 무엇입니까?
- 15. 글꼴 크기의 변화를 감지하거나 잡는 가장 좋은 방법은 무엇입니까?
- 16. 여러 화면 크기의 비트 맵을로드하는 가장 좋은 방법은 무엇입니까
- 17. 목록을 임의의 크기의 청크로 분할하는 가장 좋은 방법은 무엇입니까?
- 18. 격리 된 저장소에서 파일을로드하는 가장 좋은 방법
- 19. Python CGI를 로컬에서 테스트하는 가장 빠르고 가장 빠른 방법은 무엇입니까?
- 20. 콘텐츠를로드하는 가장 좋은 방법은 무엇입니까?
- 21. "거대한 클래스 파일이 좋지 않습니다"- 실제로 가장 좋은 해결책은 무엇입니까?
- 22. 거대한 문자열을 입력하는 가장 빠른 방법은 무엇입니까?
- 23. 거대한 벡터를 주문하는 가장 빠른 방법은 무엇입니까?
- 24. 거대한 단어 파일을 검색하는 가장 좋은 방법
- 25. 거대한 데이터를 가져 오는 가장 좋은 방법
- 26. 거대한 데이터를 저장하는 데 가장 좋은 컬렉션
- 27. 거대한 테이블에 인덱스를 사용하는 가장 좋은 방법
- 28. Perl에서 구성을로드하는 가장 좋은 방법은 무엇입니까?
- 29. 암호화 키를 저장하는 가장 좋은 방법은 무엇입니까?
- 30. SSIS에서 가장 빠르게 2000 개의 파일을로드하는 가장 좋은 방법