2014-11-05 2 views
0

에 분산 캐시에 런타임 변수로 URI를 전달하고 나는이 맵리 듀스 프로그램 input file, output dirconfig file에 세 개의 변수를 전달하고있다.내가 내 맵리 듀스 프로그램에서 분산 캐시를 사용하고 맵리 듀스 하둡

셋째 인수, 즉 config 파일을 분산 캐시에 추가하려고합니다.

맵리 듀스 드라이버의 run() 방법으로 다음과 같이 내가 매개 변수를 설정하고있다 : - 동일한 방법으로 분산 캐시에이 파일을 추가하는 방법

conf.set("CONF_XML", args[2]); 

. 어떻게해야합니까? 보통 우리가 URI(new (file path));

DistributedCache.addCacheFile(new URI(file_path), conf); << here how to pass the argument parameter? 
+0

'DistributedCache.addCacheFile'의 사용은이 [질문]을 참고하십시오 (http://stackoverflow.com/questions/21239722/hadoop-distributedcache-is-deprecated-what-is-the-preferred-api).) 새로운 API'job.addCacheFile()'에서 사용하기 위해. – Ashrith

답변

2

이 (URI

DistributedCache.addCacheFile로 DistributedCache의 API에 새로운 경로 (인수 [2]) .toUri()을 파일 경로 인수를 전달하여 추가 할

, job.getConfiguration());

관련 문제