일부 성능 테스트에 사용할 수 있도록 약 600k 레코드 (전자 메일 등 민감한 정보 제거)의 대용량 데이터 세트를 익명화하려고합니다.MongoDB - 600k 레코드를 익명으로 처리합니다.
저는 Mongo와 함께 Scala (Casbah)를 사용하고 있습니다. 실제 스크립트는 매우 간단하고 간단합니다. 스크립트를 실행하면 전체 프로세스가 매우 빨리 시작됩니다. 2-3 초마다 1000 개의 레코드가 파싱되지만 속도가 크게 느려지고 매우 느리게 크롤링되기 시작합니다.
나는 이것이 너무 상세하지 않고 매우 모호하다는 것을 알고 있지만, 왜 이런 일이 일어나고 있는지, 그리고 내가 이것을 빠르게 할 수있는 방법에 대한 어떤 힌트를 가지고 있습니까?
익명으로 처리하는 필드에 인덱스가 있습니까? –
'mongostat'의 출력물을 공유 할 수 있습니까? 쓰기 잠금과 페이지 폴트가 너무 많습니까? – DhruvPathak
당신은 64 비트 컴퓨터에 있습니까? – Matt