2008-08-19 4 views
22

테스트 데이터 생성기 중 일부는 알고 있지만 대부분은 이름과 주소 스타일 데이터베이스를 채우는 것으로 보입니다.데이터베이스에 테스트 데이터 생성

Google은 대규모 통합 및 정규화 된 애플리케이션을 보유하고 있습니다. 인보이스에는 재고 표와 연결된 부품 번호, 고객 테이블에 연결된 고객 번호, 감사 정보와 연결된 변경 로그 등이 있습니다. 이는 무작위로 채우기가 분명히 어렵습니다. 현재 우리는 실제 데이터를 난독 화하여 테스트 데이터를 얻습니다 (그다지 좋지는 않음).

테스트 할 대용량의 데이터를 생성하기 위해 어떤 tools \ methods를 사용합니까?

답변

7

내가 작동하는 곳에서는 RedGate Data Generator을 사용하여 테스트 데이터를 생성합니다.

우리는 은행 업무 영역에서 일하기 때문에. 우리가 명목상의 데이터 (신용 카드 번호, 개인 ID, 전화 번호)를 가지고 작업해야만 마스크의 데이터베이스 필드를 사용할 수있는 응용 프로그램을 개발하여 실제 데이터로 사용할 수 있습니다.

Redgate를 사용하면 BD의 모든 테이블의 모든 필드를 사용자 정의 할 수 있으므로 프로덕션 서버에서 실제 데이터가 어떻게 보이는지 확인할 수 있습니다.

1

레드 게이트 제품이 좋은에서 레드 게이트 언급 ...하지만 완벽하지.

나는 데이터를 생성하기위한 도구를 직접 작성했을 때 더 나은 결과를 얻었습니다. 고객을 생성하려고 할 때 사용하지만 ... 고객이 주문 생성과 같은 임의성을 시뮬레이트하고 싶다면 좋지 않습니다 ... 일부는 하나의 항목이 여러 항목으로 구성되어 있습니다.

내재 된 도구는 내 생각에 가장 현실적인 데이터를 제공합니다.

+0

우리의 테스트 데이터 생성 도구 인 "고급 데이터 생성기"는 회사 이름, 성/이름, 전자 메일 주소, 거리 이름, 도시 이름 등의 실제 데이터를 생성합니다. http://www.upscene.com/go/?go=adg를 참조하십시오. –

3

VSTS Database Edition (최신 2008 Power 도구 포함)으로 데이터 계획을 생성 할 수 있습니다.

그것은 당신이 현실적이지만 완전히 다른 데이터

2

난 그냥 3,500,000+ 건강 보험 청구 라인을 만드는 프로젝트를 완료가 들어 뭔가를 얻을 수 있도록 기존 데이터베이스를 지정하여 데이터 생성을 자동으로 허용하는 데이터 생성 마법사가 포함되어 있습니다. HIPPA 및 PHI 제한으로 인해 스크럽 된 실제 데이터를 사용하는 것은 PITA입니다. 나는 이것을 위해 Datatect라는 도구를 사용했다. (http://www.datatect.com/).

나는이 도구에 대한 좋아하는 것들 중 일부

:

  1. 는 ODBC 그래서 당신이 어떤 ODBC 데이터 소스에 데이터를 생성 할 수 있습니다 사용합니다. 필자는 Oracle, SQL 및 MS Access 데이터베이스, 플랫 파일 및 Excel 스프레드 시트에이 기능을 사용했습니다.
  2. VBScript를 통해 확장 가능. 데이터 생성 워크 플로의 여러 부분에서 후크를 작성하여 도구의 기능을 확장 할 수 있습니다. 이 기능을 사용하여 데이터베이스의 종속 열을 "동기화"하고 실제 관측 주파수와 일치하도록 값의 빈도 분포를 제어했습니다.
  3. 참고로 알고 있습니다. 외래 키 열을 채울 때 상위 테이블에서 유효한 키를 가져옵니다.
3

정규 표현식을 준수하는 임의의 데이터를 생성하는 자체 데이터 생성기를 롤백했습니다. 기본 개념은 유효성 검사 규칙을 두 번 사용하는 것입니다.먼저 이들을 사용하여 유효한 무작위 데이터를 생성 한 다음이를 사용하여 프로덕션에서 새로운 입력의 유효성을 검사합니다. 좋은 학습 프로젝트 인 것처럼 유틸리티의 재 작성을 언급했습니다. googlecode에 있습니다.

관련 문제