0

첫째, 여기서 언급 한 문제를 통해 독서와 사고에 대한 인내심을 고맙게 생각합니다.AWS EC2 Cloudwatch 모니터링

나는 AWS EC2 인스턴스 (Ubuntu 14.04) 중 하나에서 인스턴스가 http 또는 ping을 통해 도달 할 수없는 고유 한 문제가 발생했습니다. 그것은 또한 ssh 접속에서 나를 잠급니다. 매번 aws 콘솔에 로그인하고 인스턴스를 수동으로 재부팅해야했습니다. 해결책으로, 나는 자동으로 인스턴스를 재부팅하고 시스템 점검이 실패한 어떤 경우에 나에게 알림 이메일을 보내도록 클라우드 워치 모니터링을 구성했습니다.

지금까지 그렇게 좋았습니다.

이제 내가 원하는 것은 근본 원인/예를 들어 도달 할 수없는 이유입니다. 그게 메모리 문제라고 생각합니다. 나는 get-system-logs를 통해 약간 도움이되었다. 그러나, 어쨌든, 경고 로그 나 비슷한 메일을 보내도록 cloudwatch를 구성 할 수 있습니다. 아니면 어떤 식 으로든, 충분한 로그 정보 (예 : 메모리 사용률 80 %, 네트워크 응답 없음 등)에 자신에게 경고 할 수 있습니다. 인스턴스가 도달 할 수없는 경우. 스왑 도구에 대해 들어 봤지만 메모리 모니터링에만 국한되지 않는 좀 더 일반적인 것을 찾고 있습니다.

뭐라 구요? 누구든지 어떤 생각을 가지고 있습니까?

+0

나중에 분석 할 수있는 S3에 저장됩니다. 나는 여러 모니터링 메트릭스 (메모리, CPU, 디스크 I/O 등)가있는 CloudWatch 대시 보드를 설정하여 장애 발생시 시스템 상태를 알 수 있습니다. 프로세스 수, 사용 가능한 디스크 공간 등 자신의 측정 항목을 CloudWatch에 보내려면 맞춤 소프트웨어 (Python 스크립트)를 작성할 수 있습니다. –

+0

http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/mon -scripts.html # mon-scripts-systems ec2에서 메모리 사용량 메트릭을 수집하고이를 클라우드 워치에 보내어 모니터링을 유지할 수있는 방법에 대한 매우 유용한 데모입니다. 메모리 사용 문제입니다.이 솔루션을 구현 한 후 다시 같은 일이 발생하면 해당 시간의 cloudwatch에서 메모리 사용량을 확인하십시오 – Ashwini

답변

0

나는주고 시스템에서 실행중인 특정 프로그램이있다 (위의이 상세하게 언급하지 않는) 오래된 skool 가서 파일 아마

에 로그인 할 때 서버에서 스크립트를 사용합니다 이 문제가 발생했습니다.

일반적으로 시스템 프로그램은 해당 PID를 파일에 저장합니다. 파일이 /var/run/nginx.pid라고 가정 해 봅시다. 당신은 PID를 읽고 메모리 사용을 기록, 예를 들어, "/ usr/지방/빈/내 메모리"

PID=`cat /var/run/crond.pid` 
# the 3 fields are %mem, VSZ and RSS 
DATA=`ps uhp $PID| awk '{print $4, $5, $6}'` 
NOW=`date --rfc-3339=sec` 
echo "$NOW $DATA" >> /var/log/memory.log  

추가로이 파일을 추가하는 스크립트를 작성하여 특정 시스템

이를 해결할 수 루트로 crontab에 대한 행

* * * * * /usr/local/bin/mymemory.log 

이렇게하면 분당 메모리 파일이 증가합니다. 하루에 한 번 로그인하여 확인하고 재미 있으면 다운로드하여 삭제하십시오. (실제 생산 상황에 맞는 로그 회전에서 사용할 수 있습니다)

파일이 메모리 사용 데이터를 포함해야 충돌이있을 때마다

CloudWatch는 당신에게 로그 파일을 보낼 수 없습니다,하지만 당신은 CloudWatch에서에 로그 파일을 보내 인스턴스를 구성 할 수 있습니다
관련 문제