첫째, 여기서 언급 한 문제를 통해 독서와 사고에 대한 인내심을 고맙게 생각합니다.AWS EC2 Cloudwatch 모니터링
나는 AWS EC2 인스턴스 (Ubuntu 14.04) 중 하나에서 인스턴스가 http 또는 ping을 통해 도달 할 수없는 고유 한 문제가 발생했습니다. 그것은 또한 ssh 접속에서 나를 잠급니다. 매번 aws 콘솔에 로그인하고 인스턴스를 수동으로 재부팅해야했습니다. 해결책으로, 나는 자동으로 인스턴스를 재부팅하고 시스템 점검이 실패한 어떤 경우에 나에게 알림 이메일을 보내도록 클라우드 워치 모니터링을 구성했습니다.
지금까지 그렇게 좋았습니다.
이제 내가 원하는 것은 근본 원인/예를 들어 도달 할 수없는 이유입니다. 그게 메모리 문제라고 생각합니다. 나는 get-system-logs를 통해 약간 도움이되었다. 그러나, 어쨌든, 경고 로그 나 비슷한 메일을 보내도록 cloudwatch를 구성 할 수 있습니다. 아니면 어떤 식 으로든, 충분한 로그 정보 (예 : 메모리 사용률 80 %, 네트워크 응답 없음 등)에 자신에게 경고 할 수 있습니다. 인스턴스가 도달 할 수없는 경우. 스왑 도구에 대해 들어 봤지만 메모리 모니터링에만 국한되지 않는 좀 더 일반적인 것을 찾고 있습니다.
뭐라 구요? 누구든지 어떤 생각을 가지고 있습니까?
나중에 분석 할 수있는 S3에 저장됩니다. 나는 여러 모니터링 메트릭스 (메모리, CPU, 디스크 I/O 등)가있는 CloudWatch 대시 보드를 설정하여 장애 발생시 시스템 상태를 알 수 있습니다. 프로세스 수, 사용 가능한 디스크 공간 등 자신의 측정 항목을 CloudWatch에 보내려면 맞춤 소프트웨어 (Python 스크립트)를 작성할 수 있습니다. –
http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/mon -scripts.html # mon-scripts-systems ec2에서 메모리 사용량 메트릭을 수집하고이를 클라우드 워치에 보내어 모니터링을 유지할 수있는 방법에 대한 매우 유용한 데모입니다. 메모리 사용 문제입니다.이 솔루션을 구현 한 후 다시 같은 일이 발생하면 해당 시간의 cloudwatch에서 메모리 사용량을 확인하십시오 – Ashwini