6

웹 사이트를 호스팅하는 Windows Azure (Iaas)에 여러 VM이 있습니다. 로드 밸런싱 된 여러 프런트 엔드 VM이 SQL Express를 통해 단일 VM에 모두 연결됩니다. 잘 작동한다.Windows Azure VM (예기치 않은) 예기치 않은 다시 시작

그러나!

모든 VM에서 임의로 다시 시작됩니다. 프런트 엔드 VM (IIS 사용)은로드 균형 조정을 수행하므로 사이트가 영향을받지 않으므로로드 균형 조정기가 적절히 조정됩니다. 그러나 데이터베이스를 호스팅하는 VM이 ​​다시 시작되면 DB가 다시 가동 될 때까지 사이트가 다운됩니다. 부팅하는데는 < 3 분이 걸리지 만 자주 발생하는 경우에는 여전히 받아 들일 수 없습니다. 재시작은 비교적 드물기는하지만 (VM 당 한 달에 2 번) 때때로 VM 당 4 번의 재시작으로 1 주일이 걸릴 수 있습니다. 모든 VM이 자주 다시 시작되는 것은 아니며 패턴을 파악할 수 없습니다. 다시 시작은 예기치 않습니다 (전원 케이블 유형을 다시 시작하는 것이지 시스템을 종료하지 마십시오). Datacenter는 서유럽입니다.

Microsoft는 SLA가 가용성 VMVM (엔터프라이즈 SQL 버전은 팔과 3 개의 다리가 필요함)에 대해 가질 수없는 가용성 세트에만 2VM을 포함한다는 점을 강조합니다. 또한 응용 프로그램이 매우 복잡해지고 SQL Azure 데이터베이스가 사용량이 많은 시간에 스로틀되고 있음에도 불구하고 SQL Azure는 옵션이 아닙니다 (중간 VM에서 SQL Express와 매우 원활하게 작동 함에도 불구하고!).

내 질문 : 재시작이 자주 발생합니까? 다른 사람들이 같은 문제를 겪고 있습니까? Azure에서 그러한 환경에 대한 귀하의 경험은 무엇입니까? 이 가동 중지 시간을 최소화하려면 어떻게해야합니까?

감사합니다.

+0

나는이 질문이 주제에 있다고 믿습니다. Azure는 시스템 구성이 광범위한 의미의 "프로그래밍"유형이기 때문에 Azure는 조금 다릅니다. Azure가 모든 코드가 제대로 작동하도록 설정해야하기 때문에 광범위한 의미로 사용됩니다. – Jarvis

+0

확실히 대부분의 관련 프로그래밍은 코드의 적용을받습니다! –

답변

3

재시작이 자주 발생합니까?

예 특정 월에이 문제가 발생할 수 있습니다. SQL Server를 고 가용성 모드로 설정해야 실제로 작동합니다.

예 팔과 다리가 들어요. (

Azure에서의 이러한 환경에 대한 경험은 무엇입니까? 몇 개월은 실제로 좋지 않습니다. 몇 개월은 좋지 않습니다. 클러스터 및 데이터 센터에 달려 있습니다. MS는 데이터 센터에 하드웨어 범위를 혼합했습니다. 그렇다고해서 일부 데이터 센터의 오래된 랩톱에서 작동한다는 의미는 아니지만 새로운 데이터 센터는 내게 맞는 키트가있어서 재시작 횟수가 적다는 의미입니다. 즉, 미국 동부를 사용합니다.

어떻게 할 수 있습니까? 이 가동 중지 시간을 최소화 하시겠습니까?

증인이있는 고 가용성은 VM에서 가용성을 제공 할 수있는 유일한 방법이며 비용은 물론 팔과 다리입니다.

기타 심각한 옵션. 캐시 캐시 .. 컴퓨터 캐시, 하늘색 캐시를 사용해야하며 데이터베이스 호출을 최소화해야합니다. 이로 인해 수다스러운 응용 프로그램이 줄어들 수 있고 SQL Azure로 되돌아 갈 수는 있지만 장애 복구가 충분히 복구 될 수 있습니다.

대기열은 응용 프로그램을 복구하는 데 도움이되며 우리가 작업중인 메시지를 사용자에게 제공합니다.

장애 조치로 SQL Azure를 사용하십시오. Premise에서 SQL Azure Sync를 사용하여 데이터 동기화 (Express와 함께 작동하는지 확실하지 않음)를 SQL Azure로 연결하고 연결 오류 및 장애 조치를 선택하는 응용 프로그램 코드를 작성합니다.

응용 프로그램의 일부로 Azure의 다른 부분을 사용하여 SQL로 들어오는 호출량을 줄이십시오.e 테이블 스토리지로 물건을 옮길 수 있습니까?

HTHS 몇 가지 아이디어를 제공합니다.

+0

이것이 나의 이론을 확인했지만, 그것은 빤다. 다른 공급자의 VM은 훨씬 안정적입니다. 그러나 캐싱과 SQL Azure로 다시 전환하는 것이 유일한 방법 인 것 같습니다. 감사! –

1

Windows Azure 인프라 서비스 (IaaS)는 4 월 16 일 (발표 here 참조)부터 약 3 주간 일반 가용성 (GA 또는 생산)에서만 사용되었습니다. GA 이전에는 SLA가 없었기 때문에 다양한 패치가 여전히 호스트 OS에 적용됨에 따라 OS를 자주 다시 시작하는 경우가있었습니다. 이 패턴이 4 월 16 일 이후 같은 속도로 계속되었다고 말씀하시는 겁니까?

IaaS가 GA가되었으므로, 일주일에 4 번의 재시작이 필요하지 않습니다. 즉 말했다 :

  • 호스트 하드웨어 오류
  • 호스트 소프트웨어 업데이트 (이 해당 호스트에서 실행되는 모든 게스트 OS를 다운 소요) (만 다시 시작을 필요로하는 경우 : 당신이 다시 시작을 볼 것 몇 가지 이유가있다 호스트 OS). 호스트 OS 재부팅이 현재보고있는 주파수에서 일어나지 않아야합니다.
  • 게스트 OS 문제. 여기 PaaS (웹/작업자 역할 클라우드 서비스)에서 출발하는 것들이 있습니다. IaaS에는 Azure가 수행 한 게스트 OS 유지 관리가 없습니다. 이 모든 것이 당신의 손에 달려 있습니다. 자동으로 Windows 업데이트를 설치하면 재부팅 할 수 있습니다. 아마도 응용 프로그램 수준의 문제로 인해 상자가 오작동을 일으켜 오랫동안 반응하지 않아서 Azure 패브릭 컨트롤러가 비정상으로 판단되면 상자를 재부팅 할 수 있습니다. 그리고 ... 앱이 어떻게 든 상자를 손상시킬 수 있습니다.

응용 프로그램 오류를 배제하고 재부팅 할 때 VM의 상태가 양호한 경우 Microsoft에서 지원 티켓을 열어 문제를 자세히 진단해야 할 수 있습니다.

+1

MS에서 지원 티켓을 만들었으며 Azure에 장애가 발생한 노드가 있음을 확인했습니다. 불행히도, 그들은 단지 하나의 재시동을 조사했지만, 나는 그것이 모두에게 적용되는 것으로 의심합니다. –

+1

자동 창 업데이트가 비활성화됩니다. –