여러 데이터 센터에서 데이터 노드의 성능을 테스트하려는 사람이 있습니까? 특히 작은 파이프가있는 네트워크에서. 너무 많은 정보를 찾지 못하고 내가 찾은 정보가 오래된 것 (2010 년경)이거나 독점적 인 것 (DataStax가 뭔가있는 것으로 보입니다)입니다. Hadoop이 랙 인식을 지원한다는 것을 알고 있지만 여러 데이터 센터의 시스템을 튜닝하기위한 문서를 보지 못했다고 말한 것 같습니다.여러 데이터 센터에서 데이터 노드 분산
6
A
답변
5
대략 120 마일 떨어진 2 개의 데이터 센터간에 2 : 1 비율의 비율로 배열 된 12 x DataNode 클러스터를 사용해 보았습니다. 데이터 센터 간의 대기 시간은 2 x 1GbE 파이프에서 ~ 4ms입니다.
사이트 A에 2 개의 랙이 구성되었고 사이트 B에 1 개의 랙이 구성되었습니다. 각 "랙"에는 4 개의 기계가 있습니다. 기본적으로 사이트 B를 'DR'사이트로 테스트했습니다. 복제 인수가 3으로 설정되었습니다.
짧은 이야기지만, 작동하지만 성능은 정말 나빴습니다. 쓰기 I/O를 줄이기 위해 소스에서 압축을 사용하고 출력을 매핑 및 축소해야하며 사이트 간의 링크가 다른 용도로 사용되는 경우 데이터를 전송하는 동안 시간 초과가 발생합니다. TCP 윈도우 잉은 효과적으로 1GbE 회선에서 100MBps + 대신 약 4MBps 로의 전송을 제한 할 것입니다.
두통을 피하고 distcp 작업을 사용하여 데이터를 복제하십시오!
관련 문제
- 1. 여러 데이터 센터에서 etcd를 사용하는 것이 안전합니까?
- 2. 게임 센터에서 데이터 다운로드
- 3. 게임 센터에서 데이터 송수신
- 4. 분산 트리 데이터 구조
- 5. Java의 분산 데이터 구조
- 6. 분산 객체, 대용량 데이터
- 7. 분산 데이터 모델
- 8. ILNumerics에서 분산 데이터 보간
- 9. 분산 시스템에서 데이터 액세스
- 10. 분산 데이터 저장소
- 11. hadoop에 분산 된 데이터 할당
- 12. Prometheus : 여러 데이터 센터에서 Consul 노드를 얻는 방법
- 13. 통계 데이터 분석에서 분산 데이터 세트
- 14. 클라우드 또는 데이터 센터에서 Docker를 사용하는 방법
- 15. Couchbase는 특정 순서로 데이터 센터에서 키를 복제합니까?
- 16. 내 데이터 센터에서 CloudFoudry를 설정하는 방법
- 17. DynamicSnitch 빈 새 데이터 센터에서 읽음
- 18. windows azure 데이터 센터에서 VM 마이그레이션
- 19. 데이터 가져 오기는 여러 단계의 노드
- 20. 분산 노드 모니터링
- 21. hdfs가 데이터 노드에 데이터를 분산 저장합니다
- 22. 분산 시스템에서 데이터 구조 잠그기
- 23. 분산 데이터 시스템을위한 최신보고 솔루션
- 24. Matlab 보간 1D 분산 데이터
- 25. 데이터 노드 용량은 0kb입니다.
- 26. hadoop에서 데이터 노드 시운전
- 27. 데이터 노드 간의 연결
- 28. 분산 된 Windows 응용 프로그램의 데이터 업데이트
- 29. 데이터 크기에 기반한 Hadoop 데이터 노드
- 30. MATLAB - 분산 형 플롯에 여러 데이터 세트 플롯