각 스파크 작업자가 반복간에 변수를 보유해야한다는 요구 사항이 있습니다. 변수는 모든 RDD에 포함하기에는 너무 큰 구조입니다. foreachpartition을 사용할 수는 있지만 파티션 당 한 번 변수를 전달하는 메커니즘은 없습니다 (나중에 다시 전달할 수도 있습니다). 같은 id를 가진 파티션에 대한 호출 간에는 연속성이 없습니다. 반복되는 방송은 너무 비싸다. 어느 누구도이 문제를 해결할 방법을 알고 있습니까?pyspark foreachpartition을 사용하지만 파티션 별 변수는 그대로 유지하십시오.
0
A
답변
1
관련 문제
- 1. Pyspark 파티션
- 2. 페이지를 루트로 리디렉션하지만 URL의 매개 변수는 그대로 유지하십시오.
- 3. URL은 소문자이지만 경로의 {id} 매개 변수는 대소 문자 그대로 유지하십시오.
- 4. 하이브 - 연도 별 파티션
- 5. 분기 별 파티션
- 6. 해시 별 파티션 - 목록 별 하위 분할
- 7. 나이 별 MySQL 수평 파티션
- 8. Spark 2.0 csv 파티션 수 읽기 (PySpark)
- 9. 목록에서 값/항목을 제거하지만 색인을 그대로 유지하십시오.
- 10. div를 투명하게 만들지 만 테두리는 그대로 유지하십시오.
- 11. 스크롤보기를 사용할 때 개체를 그대로 유지하십시오.
- 12. Visual Studio 2010에서 명령을 추가하고 그대로 유지하십시오
- 13. 숫자를 정사각형으로 표시하지만 부호는 그대로 유지하십시오. (0126)
- 14. Vue.js 값을 값으로 표시하지만 값은 그대로 유지하십시오.
- 15. Sharepoint iFrame의 QueryString 매개 변수를 그대로 유지하십시오.
- 16. 문자 그대로 항상 비트 맵을 유지하십시오.
- 17. Ghostscript에 글꼴을 포함 시키되 그대로 유지하십시오
- 18. openERP의 승인 계층 구조를 그대로 유지하십시오.
- 19. spark : foreachPartition을 사용하여 데이터베이스에 전화하는 방법
- 20. pyspark 브로드 캐스트 변수는 어떻게 작동합니까?
- 21. MySQL - 파티션 별 데이터로드 및 인덱스
- 22. 날짜 별 최적화로 PostgreSQL 파티션 쿼리
- 23. 사용자 정의 날짜 별 파티션 sql
- 24. 그대로
- 25. 열 값의 변경을 기반으로하는 파티션 pyspark 데이터 프레임
- 26. 공백과 마침표로 파이썬 re.split()을 사용하지만 마지막 숫자는 그대로 유지합니다
- 27. ASP.NET 웹 양식에서 AJAX를 사용하지만 URL은 그대로 두십시오.
- 28. 현재 괄호의 강조 표시는 제거하지만 일치하는 쌍의 문자는 그대로 유지하십시오.
- 29. XML 노드를 업데이트하지만 XML 파일 형식과 주석 정보는 그대로 유지하십시오.
- 30. 줄 텍스트는 바꾸지 만 줄 바꿈 문자는 그대로 유지하십시오.
Apache Ignite가 이에 대한 대답입니까? – bhomass