2011-08-15 3 views
2

중복 된 잘못된 데이터가있는 데이터베이스가 있습니다. 예를 들어 기사의 일부 이름은 대문자 소문자 차이, 기타 악센트 문제, 기타 문자 누락 등이 있습니다. 아이디어는 실제로 동일한 db 레코드를 병합하는 것입니다.데이터 정제 : 사용자가 입력 한 데이터베이스 데이터 도구

거기 밖으로 쉽게 청소 데이터베이스, 이상적이 자동으로 수행하지 될 수 있지만

답변

1

이 데이터 클렌징을 위해 거기에 꽤 몇 가지 도구가 있습니다 사용자 확인을 필요로하는이 멋진 도구입니다. 또한 데이터 클렌징을 서비스로 제공하는 많은 회사가 있습니다.

저는 여러 대기업을 대상으로 데이터 정리 작업을 수행 했으므로 쉬운 작업이 아니거나 데이터 복제가 문제가 될 수 있습니다. 예를 들어 운동을 시작하기 전까지는 분명하지 않습니다. .

IMHO, 레거시 데이터가 상대적으로 열악한 상태이며이 (전문화 된) 영역에 사내 전문 기술이없는 경우, 제 3자를 고용하여 조사 할 가능성이 높습니다. 처음부터 시작하는 것보다 더 빨리 그리고 적은 총 비용으로 수행 할 수 있습니다.

이렇게하려면 사내 기술을 구축하려면 몇 가지 빠른 Google 검색을 수행하고 제공되는 많은 소프트웨어 패키지를 보았습니다. 서로에 대한 상대적인 강점을 조사하고 싶을 수도 있습니다. 특정 유형의 데이터는 정화를 위해 찾고있는 일부 데이터는 다른 데이터보다 특정 영역에서 더 나을 것입니다.

희망, 도움이, Ollie.

관련 문제