2013-05-29 7 views
0

Akka 클러스터의Akka 클러스터 제거 하트 비트 연결 메시지

FailureDetector(akka://MyCluster) - Remove heartbeat connection [akka://[email protected]:35250] 

의 정보 메시지는 무엇을 의미합니까? 나는 문서에서 아무것도 찾을 수없는 것 같습니다. 테스트 머신에서 배우들과 함께 많은 JVM을 실행할 때 이걸 보게 될 것이지만, Akka 또는 Linux 튜닝을 요구하는 나쁜 신호인지 확실하지 않습니다. 오라클 JDK 1.7

업데이트에

Akka 2.1.4 : 나는 튜닝 하트 비트에 대한 옵션을 조사, cmbaxter의 조언 @ 다음 가졌어요. 하트 비트와 관련된 타이밍을 늘리거나 줄이는 것이 '하트 하트 연결 제거 (Remove heartbest connection)'메시지의 존재에 영향을 미치지 않는 것으로 나타났습니다. 그러나 'nr-of-members'구성 설정에 주목했습니다. 이제는 특정 노드의 하트 비트 모니터링이 한 ActorSystem에서 다른 ActorSystem으로 전달된다는 메시지가 있음을 알 수 있습니다. 따라서 현재 시스템은 단순히 연결 경고를 표시하는 것이 아니라 더 이상 자체 책임이 아니라고 말합니다. 실제로 시스템을 시작하는 동안 첫 번째 노드는 '첫 번째 하트 비트'를 많이 수신하지만로드가 다른 노드로 전달됨에 따라 'nr-of-members'설정에 따라 대부분을 제거합니다. 노드.

답변

1

보고있는 메시지는 Akka의 AccrualFailureDetector 클래스에서 나옵니다. 워드 프로세서에 따르면 여기

The nodes in the cluster monitor each other by sending heartbeats to detect if a 
node is unreachable from the rest of the cluster. The heartbeat arrival times is 
interpreted by an implementation of The Phi Accrual Failure Detector. 

내 생각은 클러스터 노드 (포트 35250에 로컬로 실행) 더 이상 클러스터의 일부가 될 수없는 것으로 간주되어 있는지에 도달 할 충분한 시간이되었다 때문이다. 이 경우 노드에 대한 하트 비트 검사가 제거되고이 메시지가 표시됩니다. 이 노드에 도달 할 수 없어서 클러스터 하트 비트에서 제거되지 않아야한다고 생각되면 문제가 발생할 수 있습니다. 장애 확인을 조정하는 방법에 대한 자세한 내용은 Failure Detector 섹션의 클러스터 문서 here을 참조하십시오.

+0

꽤 많은 것들을 볼 수 있지만 실제로 클러스터에서 연결을 끊는 것은 없습니다. 잠시 후 다음 메시지는 동일한 주소에서 첫 번째 하트 비트가 수신되었다는 것입니다. 그것이 좋든 나쁘 든간에 당신이 제안한 간격을 조정 해 볼 것입니다. – Pengin

관련 문제