InfoChimps에서 제공되는 백만 곡 데이터 세트 전체를 다운로드하고 싶습니다. AWS를 사용하지 않고 데이터를 다운로드하려는 대학에서 제공하는 클러스터를 사용하고 있습니다. 나는 현재 wget을 사용하고 있지만 다운로드가 오래 걸릴 것입니다. 데이터를 다운로드하는 더 좋은 방법이 있습니까?280GB의 백만 곡 데이터 세트 다운로드
또한 먼저 로컬 파일 시스템으로 다운로드 한 다음 -copyFromLocal을 사용하여 HDFS로 복사하는 대신 Hadoop File System으로 직접 데이터를 다운로드 할 수 있습니까?
도와주세요.
감사합니다.
감사! 나는 Flume과 Chukwa를 살펴볼 것입니다. – Shobit
당신은 오신 것을 환영합니다. – Tariq