수백 개의 작업자 노드가있는 Dask.distributed 배포의 일화 적 사례가 있습니까? 이 크기의 클러스터에 맞게 배포됩니까?Dask.distributed의 배율 제한은 무엇입니까?
6
A
답변
8
예
내가 본 가장 큰 Dask.distributed 클러스터
은 약 천 노드입니다. 우리는 이론적으로 더 크게 갈 수 있지만 엄청난 양은 아닙니다.현재 한계는 스케줄러가 작업 당 200 마이크로 초의 오버 헤드를 발생 시킨다는 것입니다. 이것은 초당 약 5000 개의 작업으로 변환됩니다. 각 작업에 약 1 초가 걸린다면 스케줄러는 약 5000 코어를 포화 상태로 만들 수 있습니다.
이전에는 열린 파일 핸들 제한과 같은 다른 제한 사항이있었습니다. 이것들은 모두 우리가 본 규모 (1000 노드)까지 정리되었고 일반적으로 Linux 나 OSX에서는 괜찮습니다. Windows의 Dask 스케줄러는 수백 개의 노드에서 스케일링을 중지합니다 (Windows 작업자와 함께 Linux 스케줄러 사용 가능). 10k 노드까지 확장 할 때 다른 문제가 나타남을보고 놀라지 않을 것입니다.
즉, 백만 코어 Big Iron SuperComputer 또는 Google Scale에서 MPI 작업 부하를 대체하기 위해 Dask를 사용하지 않을 것입니다. 그렇지 않으면 당신은 아마 괜찮을거야.
관련 문제
- 1. 제한은
- 2. IBAction의 시간 제한은 무엇입니까?
- 3. OData의 쿼리 제한은 무엇입니까?
- 4. MVC에서 컨트롤러의 제한은 무엇입니까?
- 5. github.com의 저장소 제한은 무엇입니까
- 6. WCF의 내부 제한은 무엇입니까
- 7. rfc5322 : 회선 제한은 무엇입니까?
- 8. SmsManager의 문자의 제한은 무엇입니까?
- 9. Windows의 리소스 제한은 무엇입니까?
- 10. mmap의 크기 제한은 무엇입니까
- 11. SQL에서 문자 제한은 무엇입니까
- 12. GMSGroundOverlay의 제한은 무엇입니까?
- 13. 응답 크기의 제한은 무엇입니까?
- 14. 수퍼 뷰 할 배율 및 중앙 배율
- 15. CGPDFDocument 배율
- 16. System.Runtime.Caching의 키 길이 제한은 무엇입니까?
- 17. Android 프로그램의 크기 제한은 무엇입니까?
- 18. codepad.org의 펄 러너 제한은 무엇입니까?
- 19. 메모리 사용 제한은 무엇입니까 8
- 20. Qualtrics에서 필드 이름의 제한은 무엇입니까?
- 21. SharePoint 필드 값의 제한은 무엇입니까?
- 22. json의 ajax 응답 제한은 무엇입니까?
- 23. 데모 장면 크기 제한은 무엇입니까?
- 24. 가상 트리보기의 스크롤 제한은 무엇입니까?
- 25. Chrome Webdriver 인스턴스 제한은 무엇입니까?
- 26. Fogbugz에서 토큰 수의 제한은 무엇입니까?
- 27. JavaMail에서 수신자의 제한은 무엇입니까? 얼마나?
- 28. 최대 파일 수 제한은 무엇입니까?
- 29. 구독 생성 속도 제한은 무엇입니까?
- 30. ElasticSearch의 배율
"Windows *의 Dask *는 수백 개의 노드에서 확장을 중지합니다.": ( – user2864740
Windows 작업자와 함께 Linux 스케줄러를 사용할 수 있습니다. Windows 컴퓨터 중 하나에서 가상 컴퓨터를 시작할 수 있으면 괜찮을 것입니다. 수 천명에 이른다. – MRocklin