1

저는 Google 검색이나 Google지도와 같은 상업적 서비스에 대해 막대한 양의 정보를 처리하는 방법에 특히 관심이 있습니다. 우리는 그들이 일종의 리눅스 클러스터를 사용 (또는 "적어도")했음을 압니다. 어떤 종류의 하드웨어를 사용합니까, 어떤 파일 시스템, 네트워킹, 어떤 문제가 가장 빈번합니까?Google 검색 /지도 Linux 클러스터의 소프트웨어/하드웨어 구조는 무엇입니까?

+1

http://research.google.com/pubs/papers.html가 있습니다 : http://aws.amazon.com/ec2/

여기에 자신의 확장 데이터베이스 서비스의 설명입니다 :

여기에 아마존 엘라스틱 컴퓨팅 클라우드의 설명이다 시작할 장소. –

답변

1

답은 사용자가하려는 작업에 따라 다릅니다. Google은 자체 데이터베이스를 만들었지 만 자체 컴퓨팅 팜 및 기타 많은 것을 만들었습니다. 일단 같은 방법으로 결정했다면 단순한 aswer를 수행 할 필요가 없지만 인프라 및 개발에 수백만 개의 투자가 필요합니다. Matthew는 Google이 한 일에 관해 matherials에 대한 의견 링크를 제공했습니다.

그러나 웹 응용 프로그램을 만드는 것이 목표 인 경우 인프라 구축을 위해 시간을 투자하지 않고 이미 출시 된 제품을 사용하는 것이 좋습니다. 매시간 수백만 명의 고객에게 엄청난 양의 데이터를 처리 할 수있는 애플리케이션을 만들고 싶다면 Amazon Elastic Computing Cloud 및 Microsoft Azure와 같은 클라우드 인프라를 분명히 봐야합니다.

이점 이점은 구현 된 데이터베이스 응용 프로그램과 즉각적인 확장 성을 갖춘 합리적인 가격의 거대한 컴퓨팅 팜에서 얻을 수 있으며 IT 비용이 들지 않습니다. 수요가 급증했을 때 단 하나의 서버에서 백으로 확장 한 다음 다시 하나의 서버로 즉시 확장 할 수 있습니다. 이 http://aws.amazon.com/simpledb/ http://aws.amazon.com/rds/