나는 당신은 당신의 노트북에 스파크가 제출 실행할 수 있습니다 (클라이언트 모드에서) What conditions should cluster deploy mode be used instead of client?에서 답변,드라이버 프로세스를 Spark 클러스터 외부에서 실행할 수 있습니까?
을 읽고, 드라이버 프로그램은 노트북에서 실행됩니다.
또한, 스파크 박사는 말한다, 클라이언트 모드에서
는 드라이버가 응용 프로그램을 제출하는 클라이언트와 동일한 프로세스에서 실행됩니다.
마스터에서 도달 할 수 있고 스파크 환경이있는 한 모든 컴퓨터에서 스파크 작업을 제출할 수 있다는 의미입니까?
다른 말로하면 드라이버 프로세스를 Spark 클러스터 외부에서 실행할 수 있습니까?
YARN 및 HDFS 이상인 경우 드라이버는 작업자와 동일한 유형의 파일 시스템을 공유해야합니다. 'dataframe.write (path)'를 실행하려면 드라이버와 작업자 모두에게'path'가 있어야합니다. 예를 들어 리눅스에 작업자가 있고 윈도우 랩톱에 드라이버가 있다면 문제가 될 수 있습니다 ... –
'path' would 일반적으로'hdfs : // ...'가됩니다. 그것은 Windows vs Linux의 문제가 아닙니다. –