Hadoop을 사용하면서 Hadoop 파일 시스템에서 특정 문자열을 포함하는 ~ 100 개의 파일을 찾아야합니다. 다음과 같은 몇 가지 항목을 반환 요식Hadoop 파일 시스템의 여러 파일에 걸친 grep
bash-3.00$ hadoop fs -ls /apps/mdhi-technology/b_dps/real-time
:
나는이 같은 검색하고자하는 파일을 볼 수 있습니다
-rw-r--r-- 3 b_dps mdhi-technology 1073741824 2012-07-18 22:50 /apps/mdhi-technology/b_dps/HADOOP_consolidated_RT_v1x0_20120716_aa
-rw-r--r-- 3 b_dps mdhi-technology 1073741824 2012-07-18 22:50 /apps/mdhi-technology/b_dps/HADOOP_consolidated_RT_v1x0_20120716_ab
가 어떻게 문자열을 포함 이들 중 어느 찾을 수 있습니까 bcd4bc3e1380a56108f486a4fffbc8dc
? 일단 내가 알게되면 수동으로 편집 할 수 있습니다.
Grep 또는 Sed? 아니요? – plast1K
이 파일은'bash-3 '처럼하려고 할 때마다 UNIX 파일 시스템이 아니라 Hadoop 파일 시스템입니다.00 cd/apps/hdmi-technology/b_dps/실시간 bash : cd :/apps/hdmi-technology/b_dps/real-time : 해당 파일이나 디렉토리가 없습니다. 그래서이 문제를 해결하기 위해 다른 방법이 필요합니다. – ferhan