2013-08-05 2 views
-4

나는 hadoop의 진정한 본질을 이해할 수 없다. 페타 바이트 단위의 데이터를 처리 할 수있는 슈퍼 컴퓨터를 구입할 수있는 충분한 리소스가 있다면 그러한 거대한 데이터를 관리하기 위해 Hadoop 인프라가 필요한 이유는 무엇입니까?Hadoop 대 슈퍼 컴퓨터

+0

사람들에게 감사드립니다. 이 질문은 나에게 인터뷰를 요청 받았다. 나는이 모든 확실한 대답으로 면접 원에게 설득하려했지만 그는 확신하지 못했습니다. 그래서 나는 내가 알지 못하는 것에 관한 독특한 것이 있는지 알고 싶었습니다. – N2M

답변

2

hadoop의 요점은 상품 이종 기계에서 엄청난 양의 데이터를 처리 할 수 ​​있어야한다는 것입니다. 이것은 수퍼 컴퓨터의 사용을 배제 할 수 없습니다.

1

자원이 충분하면 종종 바보가됩니다. 내가 Hadoop과 관련된 예를 드리 자면, 분명히 알 수 있습니다. Cray의 가장 저렴한 수퍼 컴퓨터의 비용은 XC30-AC는 $ 500,000 (IIRC)입니다. 그리고 괜찮은 RAM, CPU 및 디스크와 함께 괜찮은 컴퓨터의 비용은 무엇입니까? 그리고 당신은 그들의 무리를 구입하고 공동으로 그들의 힘을 사용해야 할 것입니다 얼마나 많은 공간과 자원을 배치해야합니까? 이 기계를 취급하십시오? 당신을위한 MR 일을 쓸 수있다 그래야 알맞은 프로그램 기술을 가진 사람들을 찾아내는 것은 얼마나 어려운가 ???

다음은 몇 가지 예입니다. Hadoop은 오픈 소스입니다. 그것을 사용하고 원하는대로 조정할 수 있습니다. 메일 링리스트를 통해 무료로 멋진 지원을 받으십시오. 뿐만 아니라 지원뿐만 아니라 제안. 요점을 얻길 바랍니다.

리소스를 현명하게 활용하는 것보다 리소스를 현명하게 활용하는 것이 더 중요합니다.

+0

답장을 보내 주셔서 감사합니다. 나는 그 자체로 전에 이것을 알았습니다. 그러나 이것은 어떤 슈퍼 컴퓨터보다 (얼마나 비용이 더 들지 른지) 더 나은 방법에 대한 나의 질문에 대답하지 못합니다. – N2M

+0

@ N2M에 오신 것을 환영합니다. 더 나은 점은 나보다 더 나을 수 있습니다. – Tariq

+0

ok. 절대 신경 쓰지 마라. 나는 하드웨어 제품에 배치가 가능하고, 사업이 중요하다면 이익은 더 적은 비용을 목표로하므로 슈퍼 컴퓨터보다 분명히 옵션이 될 것이라는 사실을 오늘은 확신하고있다. 또한 오픈 소스와 사용하기 쉽기 때문에 누구나 누구나 자유롭게 사용할 수 있으며 사용 가능한 지원은 매우 훌륭합니다. 내가 틀렸다면 어디든지 고쳐주세요. – N2M

관련 문제