스파크 작업의 출력을 hdfs에 쓰고 거기에서 다운로드해야합니까? 또는 로컬 파일 시스템에 직접 기록 될 수 있습니다.스파크 작업에서 하드 디스크를 직접 읽고 쓸 수 있습니까?
1
A
답변
1
기본적으로 아니요, 로컬 파일 시스템 파일에 쓰기 위해 spark의 네이티브 작성 API (예 : df.write.parquet
)를 사용할 수 없습니다. 스파크 로컬 모드 (클러스터가 아닌 자신의 컴퓨터)에서 실행하면 로컬 파일 시스템을 읽고 쓰게됩니다. 그러나 클러스터 설정 (독립 실행 형/YARN/etc)에서는 파티션이 일반적으로 별도의 노드에 포함되어 있기 때문에 HDFS에 쓰기가 유일한 논리적 인 방법입니다. HDFS에 쓰기
1) 노드의 로컬 파일 시스템에 쓰기는 1 개 노드에서 모든 다른 노드에서 파일 (5 개 파일을 의미 다른 7 개 파일 등)
2) 당신은 기존의 I를 사용하여 드라이버 로컬 파일 시스템에 쓸 수 collect
을 실행에 가깝다 드라이버로 모든 실행 '결과를 보낼 필요 드라이버의 파일 시스템에 쓰기/O Python이나 Scala와 같은 언어로 작성된 작업.
관련 SO의 :
Save a spark RDD to the local file system using Java
Spark (Scala) Writing (and reading) to local file system from driver
관련 문제
- 1. 스파크 사용하기 디스크를 만지지 않고 s3에서 읽고 s3에서 쓸 수 있습니까?
- 2. phpmyadmin 데이터베이스를 읽고 쓸 수 있습니까?
- 3. 스파크 작업에서 액터를 사용할 수 있습니까?
- 4. 예약 된 하드 드라이브 섹터는 어떻게 쓸 수 있습니까?
- 5. EOF 문자를 직접 쓸 수 있습니까?
- 6. DDK를 사용하여 어떻게 하드 디스크를 다시 스캔 할 수 있습니까?
- 7. Malbolge에서 파일을 읽고 쓸 수 있습니까?
- 8. java.net.Socket과 동시에 읽고 쓸 수 있습니까?
- 9. CFStream을 통해 장치에서 읽고 쓸 수 있습니까?
- 10. YAML을 사용하여 어떻게 읽고 쓸 수 있습니까?
- 11. 어떻게 Properties.Settings.Default.UpgradeRequired 속성을 읽고 쓸 수 있습니까?
- 12. 어떻게 파일을 읽고 쓸 수 있습니까?/O
- 13. Groovy와 POI : 동시에 읽고 쓸 수 있습니까?
- 14. AGAL 작업에서 숫자를 하드 코드 할 수 있습니까?
- 15. PowerCenter에서 JSON 대상에 직접 쓸 수 있습니까?
- 16. 키보드에서 직접 키보드를 쓸 수 있습니까?
- 17. 사전을 인코딩없이 pList에 직접 쓸 수 있습니까?
- 18. Ruby에서 직접 오디오 파일을 쓸 수 있습니까?
- 19. OpenStack이 물리적 디스크를 직접 부착 할 수 있습니까?
- 20. 어떻게 파이썬에서 램 디스크를 만들 수 있습니까?
- 21. 메모리를 비우기 위해 하드 디스크를 다시 시작해야합니까?
- 22. Python - 하드 드라이브에서 직접 읽기
- 23. 비밀번호 배치 파일로 외장 하드 디스크를 보호하십시오.
- 24. rdd.checkpoint가 스파크 작업에서 건너 뛰었습니다.
- 25. Pyspark는 스파크 셸의 팬더 df에 스파크 df를 쓸 수 없습니다.
- 26. 스파크 SPARK_LOCAL_DIRS 위치에서 디스크를 채우는 작업
- 27. 스파크 작업에서 멀티 테넌시 지원
- 28. 안드로이드에서 파일을 읽고 쓸 수 있는지 어떻게 알 수 있습니까?
- 29. 스파크 작업에서 자바 힙 사용
- 30. 랩톱의 충돌 하드 디스크를 외부 HD로 변환 할 수 있습니까 ?? 데이터를 복구 할 수 있습니까?