DistCp를 사용하여 특정 패턴과 일치하는 파일 만 복사 할 수 있습니까? 예를 들면./foo의 경우 * .log 파일 만 필요합니다.와일드 카드를 사용하는 Hadoop DistCp?
14
A
답변
2
DistCp는 실제로 일반적인 map-reduce 작업입니다. 일반적인 map-reduce 작업의 입력에 사용할 때와 동일한 globbing 구문을 사용할 수 있습니다. 일반적으로 foo/*.log
을 사용하면 충분합니다. 여기서 hadoop fs -ls
문으로 실험 할 수 있습니다. globbing이 fs -ls
으로 작동하면 DistCp와 함께 작동한다면 (거의 비슷하지만 차이점은 상당히 미묘합니다).
12
나는 이것이 오래된 스레드라는 것을 알고 있습니다. 그러나 나는이 질문에 대한 답에 직접 관심이 있었고 dk89도 2013 년에 다시 물었다. 그래서 여기에 우리가 간다.
distcp는 와일드 카드를 지원하지 않는다. 당신이 할 수있는 가장 가까운에 있습니다 :
하면, 필터는 다음 "입력 파일"을 그렙, AWK 사용하여 HDFS에 대한 형식 및 출력 결과를 사용하여 당신이 (소스) 복사 할 파일을 찾기 목록 :
hadoop dfs -lsr hdfs://localhost:9000/path/to/source/dir/
| grep -e webapp.log.3. | awk '{print "hdfs\://localhost\:9000/" $8'} > input-files.txt
HDFS로 입력 파일 목록을 넣어
hadoop dfs -put input-files.txt .
대상 디렉토리
hadoop dfs -mkdir hdfs://localhost:9000/path/to/target/
실행 만들기 distcp는 입력 파일 목록을 사용하고 대상 hdfs 디렉토리를 지정합니다.
hadoop distcp -i -f input-files.txt hdfs://localhost:9000/path/to/target/
관련 문제
- 1. 와일드 카드를 사용하는 Oracle 정규식
- 2. YQL XPath에서 와일드 카드를 사용하는 방법
- 3. 와일드 카드를 사용하여 파일을 검색하십시오.
- 4. 와일드 카드를 사용하여 파일 열기
- 5. 검색 문자열 자체에 와일드 카드를 지정하지 않고 와일드 카드를 표시하는 방법은 무엇입니까?
- 6. 유닉스에서 case 문에 와일드 카드를 사용하는 데 문제가 있습니까?
- 7. 엔티티 프레임 워크에 LINQ에서 SQL 와일드 카드를 사용하는 방법
- 8. 동적 SQL과 함께 WHERE 절에서 와일드 카드를 사용하는 TSQL
- 9. 와일드 카드를 사용하는 검색 매크로에서 그룹 일치를 액세스하는 방법?
- 10. MySQL의 "where"구문에 와일드 카드를 사용하는 방법이 있습니까?
- 11. 와일드 카드를 사용하는 ftp 여러 개의 새 파일
- 12. 스프링 MVC 서블릿 매핑 URL에 와일드 카드를 사용하는 방법은 무엇입니까?
- 13. NSFileManager : 와일드 카드를 사용하여 디렉토리 탐색
- 14. LIKE 및 와일드 카드를 사용하여 데이터베이스 검색
- 15. Sharepoint : 와일드 카드를 지원하는 webpart 필터가 있습니까?
- 16. 와일드 카드를 사용하여 테이블 접두어 이름 바꾸기
- 17. 와일드 카드를 평가하지 않는 MSBuild 변형
- 18. 파이썬은 매개 변수가 아닌 와일드 카드를 라우팅합니다
- 19. 계산 와일드 카드를 너무 일찍 만드시겠습니까?
- 20. J2EE 내에서 와일드 카드를 사용할 수 있습니까?
- 21. 파이썬 + sqlite : 와일드 카드를 사용한 LIKE 쿼리
- 22. ADO.NET은 문자열 SqlParameters에서 와일드 카드를 삭제합니까?
- 23. 파이썬의 glob 함수는 다양한 깊이의 와일드 카드를 지원합니까?
- 24. 두 개 이상의 와일드 카드를 사용할 때의 문제
- 25. 일괄 파일 검색 및 와일드 카드를 사용하여 바꿉니 까?
- 26. "IN"MySQL 문에서 와일드 카드를 사용할 수 있습니까?
- 27. 대량 이동을 위해 .htaccess 파일에서 와일드 카드를 사용할 수 있습니까?
- 28. 변수에서 bash 확장 와일드 카드를 만드는 방법은 무엇입니까?
- 29. 어떻게 사용자 정의 vim 매핑에 와일드 카드를 설정합니까?
- 30. 테이블 와일드 카드를 사용하여 SQL 쿼리를 만들 수 있습니까?
s3n : // 경로에서 작동하지 않는 것 같습니다. Hadoop -ls는 s3n : // 와일드 카드로 작동하지만, 이상한. –
이 질문은 2011 년부터이며 와일드 카드로 distcp를 사용하도록 변경 되었습니까? – Dimitry
버전 2는 와일드 카드를 지원합니다. doc : https://hadoop.apache.org/docs/r1.2.1/distcp2.html –