여러 스트림에서 작동하는 Apache Spark 응용 프로그램을 빌드하고 있습니다. http://spark.apache.org/docs/latest/streaming-programming-guide.html#performance-tuning스파크 스트리밍 및 고 가용성
내가하지 않았다 것은 :
1) 스트리밍 수신기는 여러 작업자 노드에 위치하거나 운전자 기계는 있습니까
나는 문서의 성능 조정 섹션을 읽어습니까?
2) 데이터를 수신 노드 중 하나가 실패하면 어떻게됩니까 (전원 끄기/재시작)
수신기가있는 작업자가 사망하면 드라이버가 수신기를 다시 인스턴스화하고 새 작업자가 데이터 수신을 다시 시작합니다. 합리적인 것 같지만 어딘가에 문서화되어 있습니까? –
@PiotrR 당신이 [이걸 찾으러 온 것 같아] (http://spark.apache.org/docs/latest/streaming-programming-guide.html#fault-tolerance-semantics) –