이 질문은 시스템을 설계하는 방법에 대한 실질적인 조언을 구하는 것입니다.거대한 데이터 세트의 정확성을 수집, 유지 및 보장하는 모범 사례는 무엇입니까?
amazon.com 및 pandora와 같은 사이트는 핵심 비즈니스를 운영하기 위해 거대한 데이터 세트를 보유하고 유지합니다. 예를 들어 amazon (및 기타 주요 전자 상거래 사이트)에는 수백만 개의 판매 제품, 해당 제품의 이미지, 가격, 사양 등이 있습니다.
타사 판매자로부터 오는 데이터는 무시됩니다. 사용자는 콘텐츠를 생성하여 "물건"을 어딘가에서 가져와 다른 사람이 관리해야합니다. 그것은 또한 매우 상세하고 정확합니다. 방법? 그들은 그걸 어떻게 햇어? 데이터 입국 사무원 군대가 있습니까? 아니면 불만 사항을 처리 할 수있는 시스템을 고안 했습니까?
우리 회사는 비슷한 상황에 있습니다. 우리는 엄청난 수의 자동차 부품 카탈로그와 자동차 부품 카탈로그를 보유하고 있습니다. 우리는 지금 당분간 그 일을 해왔으며 카탈로그를 계속 성장시키고 유지하기위한 많은 프로그램과 프로세스를 제안했습니다. 그러나 카탈로그를 x 카탈로그로 성장시켜 팀을 y으로 성장시켜야하는 것 같습니다.
데이터 팀의 효율성을 높이는 몇 가지 방법을 찾아야하며 다른 사람들의 작업에서 배울 수 있기를 바랍니다. 모든 제안은 만족 스럽습니다. 콘텐츠에 대한 링크 일지라도 더 심각한 시간을 읽을 수는 있습니다.
감사합니다. 지금 확인하고 있습니다. –