분산 캐시는 실제로 무엇을 의미합니까? 분산 캐시에 파일을 저장하면 모든 데이터 노드에서 사용할 수 있으므로 해당 데이터에 대한 노드 간 통신이 없거나 파일이 모든 노드의 메모리에 있음을 의미합니까? 그렇지 않다면 어떤 수단으로 전체 작업에 대한 메모리에 파일을 저장할 수 있습니까? UDF뿐만 아니라 map-reduce에도이 작업을 수행 할 수 있습니까?하둡의 분산 캐시에 대한 혼동
(특히 일부 구성 데이터가 있습니다. ?)
감사합니다. Dhruv Kapur.
안녕 답장을 보내 주셔서 감사합니다 ... 그래서 우리가 메모리에 분산 캐시에서 뭔가를 넣어 않는 경우 및 방법에 대한 자세한 걱정? Hive의 경우 UDF 내의 분산 캐시에서이 파일에 액세스해야합니다. 나는 어떻게 그것을 얻습니까? UDF 권한 내부에서 HDFS 파일을 읽지 않아야합니까? –
게시물을 수정했습니다. 언급 된 URL을 참조하기 만하면됩니다. – Ashish
그게 내가 정확히 찾고있는거야. 감사! UDF 내부의 맵이 한 번만 채워지는지 여부는 아직 조금 걱정됩니다. 이것을 지원하는 하이브 문서 또는이 동작을 확인할 수있는 방법이 있습니까? –