Reddit의 공동 창립자는 수백만 명의 사용자로 확장하면서 문제에 대한 프레젠테이션을했습니다. 요약은 here입니다."개방형 스키마"가있는 데이터베이스 - 좋든 나쁘지?
는 대신, 그들은 것 테이블 및 데이터 테이블을 유지 : 나를 놀라게 무엇
포인트 3입니다. Reddit의 모든 것은 사물입니다 : 사용자, 링크, 설명, 하위 참조, 수상 등. 것들은 상/하 투표, 유형 및 생성 날짜와 같은 공통 속성을 유지합니다. 데이터 테이블에는 thing id, key, value라는 세 개의 열이 있습니다. 모든 속성에 대한 행이 있습니다. 제목, URL, 저자, 스팸 투표 등에 대한 행이 있습니다. 새로운 기능을 추가 할 때 더 이상 데이터베이스에 대해 걱정할 필요가 없었습니다. 그들은 새로운 것에 대한 새로운 테이블을 추가하거나 업그레이드에 대해 걱정할 필요가 없었습니다.
이것은 나에게 끔찍한 생각처럼 보입니다.하지만 Reddit에서는 효과가있는 것 같습니다. 그래도 일반적으로 좋은 생각입니까? 또는 Reddit의 특이성이 그들을 위해 일 해낸 것입니까?
실제로 이야기 하프만은 보고서를 만드는 방법과 텍스트를 파일로 내보내고 분석하는 방법에 대해 이야기합니다. https://vimeo.com/10506751 m24 : 50 –
Reddit에는 보고서가 거의 없습니다 데이터 무결성 요구 사항. 특정 범위 사이에 있거나 복잡한 비즈니스 규칙이있는 날짜 또는 정수 값을 저장하는 것과는 다릅니다. 즉, reddit과 같은 사이트에서는 데이터의 정확성이 중요하지 않습니다. 그것은 단지 대부분 정확해야합니다. 그러나 LOB 앱은 부정확성에 그다지 관대하지 않습니다. Reddit의 디자인은 정확하지 않은 데이터를 포착하는 데 중점을 둡니다. 그러나 정확성에 대한 문제는 당신이 그것에 관심을 가질 때, 그것을 사전에 다루지 않는 것은 지나치게 비싸다는 것입니다. – Thomas