매일 가져 오는 대용량 데이터를 처리하기 위해 테이블을 설정하는 가장 좋은 방법에 대한 일반적인 질문이 있습니다. 매일 1000 개의 레코드가 포함 된 10 개의 csv 파일을 가져 오므로이 테이블이 빠르게 확장됩니다.대용량 데이터 가져 오기 용 테이블 구조
작은 또는 중간 int에서부터 30 자의 varchar에 이르는 15 개 열로 구성됩니다.
에는 ID 필드 없다 - 나는 기본 키를 형성하기 위해 6 열을 가입 할 수 있습니다 -이 내가 웹 전면을 통해이 데이터를보고해야 가져올 것 var에 숯 전체 길이 약 45
것 요약 수준에서 끝내기 때문에 가져온 후에 보고서 표를 만들어야합니다.
이 데이터에는 일별 가져 오기 - 날짜, 지역, 고객 등에서 반복되는 많은 필드가 있으며, 매일 열의 절반 만 레코드와 관련됩니다.
질문 :
- 나는 덤프 테이블로 즉시 하나 개의 테이블로 모두를 가져와야합니다.
- 나는 가져 오기
- 내가 사용해야 자동 INC 동안 고유 키를 얻기 위해 내가 할 수있는 가져 오기 프로세스를 통해 데이터를 변환하고
- 내가 열을 기반으로 id 필드를 형성해야 다른 테이블에서 가져 오기를 분할해야 id 필드.
- 이 이노 등 테이블의 어떤 종류를해야
내 두려움이 힘들어 그 빌드로 테이블을보고를 추출하는 것이 테이블에 데이터 과부하인가?
정말 도움이됩니다. 감사.
감사합니다. 좋은 점 - 가져 오기 중에 주요 문제 인 ID를 추가하는 것이 어렵다고 생각합니다. 논리적으로 csv 데이터를 분해 할 수있는 방법을 볼 수 없으며 테이블에서 외래 키로 생성 된 ID를 사용할 수 있습니다. 또한 변환 프로세스에 추가됩니다. 나는 당신이 확실히 아카이빙 물건이라고 생각한다. – user1479891