예를 들어 City 열이 있습니다. 도시 값의 95 %가 NULL입니다. city_names (Id PK, City)와 같은 표를 만들고 City를 City_id (FK는 city_names (id)를 참조)로 대체하는 것이 좋습니다. 여기에 대한 나의 생각이있다. 그것들은 계산에 대한 일반적인 생각을 기반으로합니다. 제발 그것을 수정하십시오 이것은 RDMS에 적용되지 않습니다.내 경우 공통 데이터 분리가 좋은가요?
첫번째 방법 : O (n)이 저장 O (n)이 일괄 작업 O (1) 랜덤 액세스
번째 방법 : O (n)이 저장 O (N * logn) 인해 인덱스 N 요청을 일괄 작업 구조 (예를 들어 B- 나무) O (lon n) 랜덤 액세스
다음은 전체 그림입니다. 나는 1M 행 테이블을 가지고있다. 그것은 자랍니다. 도시와 같은 80 개의 기둥이 있습니다. 그들은 모두 거의 NULL'ed. 그러나 커뮤니티 편집이 가능합니다. 따라서 전체 텍스트 검색, 빠른 편집 시간 및 복잡한 쿼리 (고급 사용자 또는 봇)를 제공해야합니다. 언젠가는 NULL이 전혀 없을 것입니다. 그래서 최종 모양의 테이블을 편집 단계와 마녀에 사용해야하는 윈치 체계는 무엇입니까?
중요한 경우 postgres \ mysql을 사용합니다.
이러한 솔루션 중 하나만 요구하지는 않습니다.어떤 기술을 조언 할 수 있습니다. – FirstTimePoster
그것은 정규화라고 불리고 있습니다. 그렇습니다. 좋은 생각입니다 ... –
@Mitch Wheat하지만 성능이 매우 크게 떨어집니다. 또한 조인이 너무 많습니다. 여기 뭔가 잘못 됐어, 과도하게 조작 된 것 같아. – FirstTimePoster