2012-10-19 2 views
2

MongoDB는 몇 TB의 데이터를 처리합니까? 나는 Mongo가 < 1TB의 데이터를 잘 처리한다고 말하는 게시물을 읽었으며, 더 큰 세트의 경우 HBase와 함께 가야합니다. 그게 사실이야?MongoDB는 TB의 데이터를 처리 할 수 ​​있습니까?

몇 TB의 텍스트 데이터를 저장하고 나중에 처리해야합니다.

답변

5

이 당신에게 관심이있을 수 있습니다 데이터 10TB를 지원하도록 설계 샤드 클러스터 :

10gen의 웹 사이트에서는 데이터 세트 크기에 특정 번호를 제공하지는 않지만 일부 추가 정보는 case studies에 있습니다. 이 질문에 대한 스택 오버플로에 대한 몇 가지 논의가 있습니다 (2010 년 3 월의 12TB 데이터 사용자에 대한 소개는 see here). Speaker Deck 또는 Slideshare에 프레젠테이션 사이에 흩어져있는 사례 연구가 더 많습니다. 간단히 말해, MongoDB는 확실히 그 양의 데이터를 처리 할 수 ​​있지만 (사람들은 그 효과를 오늘날 사용하고 있습니다), 기존 프레젠테이션을 편리하게 사용할 수있는 베스트 프랙티스에주의하고 싶을 것입니다.

2

MongoDB를

수만 조직의 수천의 규모에 고성능 시스템을 구축하여 MongoDB를 사용합니다. Fortune 100 대 기업의 1/3 이상에서 가장 성공적이고 혁신적인 웹 기업은 MongoDB에 의존합니다. 단일 서버 배포에서 1,000 개 이상의 노드가있는 클러스터로 성장하여 1,000 억 개가 넘는 문서 및 페타 바이트 급 데이터에서 초당 수백만 건의 작업을 제공합니다.

확장 성은 속도와 관련이 없습니다. 약 3 가지 통계가 있는데, 이는 함께 작동하는 경우가 많습니다.

클러스터 규모. 100 개 이상의 노드 (종종 여러 데이터 센터)에 데이터베이스 배포

성능 척도. 엄격한 대기 시간을 유지하면서 초당 100,000 개 이상의 데이터베이스 읽기 및 쓰기 유지 SLA

데이터 크기. 10 억 + 문서를 데이터베이스에 저장 MongoDB 사용자가 확장성에 한계가있는 사례가 많이 있습니다. 다음은 각 스케일링 차원 주위에 구성된 몇 가지 예입니다.

당신은 MongoDB에 대한 참조를 찾을 수 있습니다 :이 article

+0

안녕에 비즈니스 인텔리전스 & 분석에 온라인 빅 데이터를 가져 오는, 당신이 언급 한 "여기에 각 스케일링 차원을 중심으로 구성, 몇 가지 있습니다." 그러나 이것은 어떤 링크도 포함하지 않습니다. 의사 결정에 도움이되는 최신 통계를 알려주십시오. 2 년 후에 최대 5TB까지 쉽게 확장 할 수있어 약 3.5TB의 데이터를 처리 할 수 ​​있기를 기대합니다. 현재 나는 ES 5.x와 MongoDB를 후보자로두고있다. 왜 다른 하나를 선택해야하는지에 대한 데이터 포인트가 기대됩니다. –

관련 문제