2011-12-04 1 views
2

많은 양의 데이터를 처리하는 프로젝트를 수행하고 있습니다. Ec2에서 그 프로젝트를 진행할 생각입니다. Hadoop을 사용하여 컴퓨팅을 수행하고 NoSql 시스템 (예 : Hbase/Cassandra)을 사용하여 데이터를 저장합니다. NoSql 시스템은 지속적이어야합니다 (데이터를 잃고 싶지 않습니다). 내가 아는 한, Hadoop과 NoSQL을 호스트하기 위해 VM을 생성해야합니다. 그러나 VM은 지속적이지 않습니다. 데이터 저장 시스템을 지속적으로 호스팅 할 수있는 다른 방법이 있습니까 (데이터뿐 아니라 데이터를 관리하는 시스템). Amazon에서 제공하는 계산을 활용할 수 있습니까?아마존에서 영구 데이터 스토리지 시스템을 호스팅하는 방법

제 시나리오는 데이터베이스를 지속적으로 호스트하는 사람들과 비슷합니다.

답변

1

"예약 인스턴스"와 "탄성 블록 저장소"(EBS)를 사용해야합니다. 내가 제대로 질문을 이해한다면 http://aws.amazon.com/ebs/

http://aws.amazon.com/ec2/reserved-instances/

, 당신은 항상 당신의 데이터 영구 저장을위한 EBS 볼륨에 연결된 실행 떠나 예약 된 인스턴스를 원하는 것입니다. EBS는 S3에도 백업 "스냅 샷"을 만들 수 있습니다.

+0

내가 원하는 것은 데이터를 저장할 수있는 지속적인 방법과 데이터를 얻을 수있는 실행중인 시스템을 유지하는 것입니다. 나의 이해에서 "예약 된 인스턴스"는 내가 잠시 동안 (최소한 1 년) 유지할 수있는 인스턴스입니다. 그렇다면 솔루션 일 수 있습니다. BTW, 사람들은 대개 클라우드에서 데이터베이스를 호스팅합니까? – user1080611

+0

EC2에서 시스템을 개발하고 장기간 동일한 인스턴스 유형을 사용하기로 결정할 때까지 예약 인스턴스를 구입할 필요가 없으며 조금만 지불하고 싶을 수도 있습니다. 예약 된 인스턴스를 구입하지 않고 EC2 인스턴스를 원하는만큼 사용할 수 있으므로 완료하기 전에 인스턴스 유형을 변경하려는 것이 좋습니다. –

+0

AWS는 예약되지 않은 인스턴스를 보장하지 않습니다. 당신의 온 디맨드 인스턴스가 "부팅"을하게 될 가능성은 매우 적지 만 ... 제 이해에서 그것은 문제가되지 않습니다. 내가 틀렸다면 나를 바로 잡아라. –

0

Amazon은 SimpleDB라는 서비스를 제공하여 데이터를 지속적이고 유연하게 저장할 수 있습니다. 데이터 요구 사항에 따라 Amazon S3를 사용할 수도 있습니다.