2010-10-26 3 views
5

나는 응용 프로그램을 상속 받았으며 그 결과는 1000 개의 청크로 된 (xml 파일이 포함 된) 4 개의보기에서 데이터를 가져 와서 xml 파일에 기록합니다 이 모든 것은 9 가지 가능성을 가진 유형 매개 변수로 나뉩니다. 이는 최악의 경우 해당 유형 /보기 조합의 각 1000 개에 대해 데이터베이스에 36 개의 연결이 있음을 의미합니다.하나의 큰 데이터베이스 쿼리가 여러 작은 것들보다 유리한 점

실제 데이터는 90.000 줄이며이 경우 데이터베이스에서 최대 1000 줄을 900 ~ 936 회 가져옵니다.

이제 모든 데이터를 앱으로 읽어서 앱이 900+ 파일을 작성하는 데 어떤 이점이 있는지 궁금합니다.

1000 줄은 약 800MB이고, 90.000 줄은 약 81GB의 데이터가 전송됩니다.

코드를 한 번에 모두 읽으면 코드를 다시 작성해야합니다.이 코드는 한 번만하는 것이 좋습니다. 90.000 줄 이후에는이 코드를 다시 사용하지 않습니다. 이 방법으로 연결량을 줄이기 위해 작동하는 코드를 다시 작성하는 데 2, 3 시간을 소비하는 것이 가치가 있습니까?

+7

일회성 일이라면 다시 쓸만한 가치가없는 것 같습니다. 이 문장을 타이핑 할 때 실제로 실행이 끝날 수도 있습니다. –

+1

테스트 된 단일 사용 코드를 다시 작성하면 언제든지 가치가 있습니까? 실제 문제가 없다면, 아마 당신이 더 나은 사용을 찾을 수 있다고 말하고 싶습니다 ... – Kendrick

+0

하나의 트랜잭션 내에서 여러 요청이 발생합니까? 데이터가 웹 서비스를 거치거나 상자에 직접 전달됩니까? 나는 이것이 질문에 대답하는 것이 중요하다고 말할 것이다. – PaulG

답변

6

일회성 일이면 모든 것을 최적화하는 데 왜 어떤 노력을해야합니까? 답변 : 아니오.

일반에 대한 답변으로 추가 하시겠습니까? 큰 쿼리에는 작은 쿼리가 많이 있습니다. 거대한 쿼리를 실행하여 미들웨어에 많은 마법을 남기고 있다면 제대로 작동하지 않을 수도 있습니다.

동시 연결이 36 개인 경우 최적이 아니지만 80 기가 바이트의 데이터를 반환 할 수있는 쿼리를 실행하는 것보다 낫습니다. 이상적인 솔루션 (이 코드를 두 번 이상 사용해야하는 경우)은 청크로 데이터를 가져 오기 위해 다시 작성하지만 동시에 많은 연결을 열어 두지 않는 것이 좋습니다.

+0

실제로는 한 번에 하나의 연결 만 있지만 실제로는 루프에서 936 번 반복됩니다. 귀하의 회신을 올바르게 받으면 이상적인 해결책은 제가 지금 가지고있는 것입니다. – Andy

+0

예, 그렇게 생각합니다! 청크로 데이터를 가져 오는 것은 대규모 데이터 블록을 처리하는 가장 좋은 방법입니다. 그렇지 않으면 당신과 서버간에주고받는 것의 흐름을 관리하기 위해 다른 중간 시스템 (SQL 서버, .NET, LINQ, 데이터 제공자 등)의 개수에 달려 있습니다. 최악의 경우, 애플리케이션은 전체 결과를 동 기적으로로드하려고 시도 할 수 있습니다. Asp.net은 아마도 이것을 어떻게 든 관리 할 것이고, 나는 기본 처리가 무엇인지 정확히 모르겠다. 그러나 애플리케이션이 한 번에 요청할 수있는 데이터의 양을 결정하게하는 것이 훨씬 좋다. –

+0

한 번 더 관찰 - 800 메가 바이트는 여전히 많은 양의 데이터를 동시에 메모리에로드합니다. 메모리 할당/할당 해제가 느려질 수 있으므로 청크 크기를 줄이는 것이 좋습니다. 모든 응용 프로그램이 행을 읽고 XML 파일로 구문 분석하고 작업을 수행하기 위해 각 행에있는 것 이외의 데이터가 필요하지 않은 경우 많은 양의 데이터가 주어진다면 한 번에 하나의 행을 가져 오는 것이 합당한 것처럼 보입니다 각 행에. –

4

코드가 이미 작동합니까? 만약 그렇다면, 나는 그것을 재 작성하는데 시간을 낭비하지 않을 것이다. 코드에 버그가 생길 위험이 있습니다. 이것을 한 번 사용하고 다시 사용하지 않으므로 노력할만한 가치가없는 것처럼 보입니다.

4

우리가 SQL 서버에 대해 이야기 할 경우 많은 작은 것들에 대해 가장 큰 단점 인 (하나의 배치)은 쿼리 계획이 하나만있을 수 있다는 것입니다 배치 당.

1

일회 일이라면 '아니오'라고 말하고 싶습니다. 여러 번 나는 평소에하지 않았던 (커서) 일을했지만 한 번만 일했기 때문에.

이미 작동하는 것으로 2 시간에서 3 시간을 보내고 다시 사용하지 않는 것이 좋습니다. 분명히 고려해야 할 다른 요소가 있습니다. 마찬가지로 이것은 2-3 시간 동안 프로덕션 데이터베이스를 잠근 것입니까?

비상 사태가 발생하지 않는다면 갖고있는 것을 사용하는 것이 좋습니다.

관련 문제