2010-04-26 4 views
7

MySQL Performance Blog에서 테이블이 큰 경우 인덱스 대신 전체 테이블을 스캔하는 것이 좋습니다.큰 데이터베이스의 경우 인덱스가 좋거나 나쁨입니까?

나는 수천만 개의 행을 가진 테이블을 가지고 있습니다. 쿼리를 수행 할 때 인덱스를 사용하지 않으면 쿼리가 인덱스보다 24 배 더 느립니다. 많은 일들이 원인이 될 수 있음을 알고 있습니다 (예 : 순차적으로 저장된 행). 그러나 어떤 일이 벌어 지는지 힌트를 주시겠습니까? 아니면이 문제를 어떻게 검토해야합니까? 나는 인덱스의 사용을 선호한다면 이해하고자하고

감사

+1

색인없이 숨을 쉰다! –

+0

자신의 데이터베이스에서 비교 테스트를 실행하는 것이 좋습니다. 성능에 올 때, 테스트는 항상 어느 쪽이 더 빠르다는 것을 알려줍니다. – phkahler

답변

8

매우 큰 데이터 세트를 처리 할 때 작업해야하는 행 수가 테이블에있는 행 수에 가까워지면 색인을 사용하면 성능이 저하 될 수 있습니다.

인덱스에있는 것보다 많은 데이터가 필요한 경우 인덱스를 통해 성능이 저하 될 수 있습니다.

인덱스를 통과하려면 데이터베이스 엔진이 먼저 인덱스 테이블의 큰 부분 (테이블 유형)을 읽은 다음이 결과의 각 행 (또는 행 집합)에 대해 실제 테이블을 읽고 벚꽃 구경하기 페이지를 읽으십시오.

반면 인덱스 테이블의 일부인 이미 열을 검색해야하는 경우 데이터베이스 엔진은 그 테이블에서 읽어야하며 더 많은 데이터를 얻기 위해 전체 테이블로 이동하지 않아야합니다.

실제 테이블의 대부분 또는 거의 끝까지 읽는다면 인덱스를 처리하는 데 필요한 모든 작업이 전체 테이블 스캔을 시작하는 것보다 더 많은 오버 헤드가 될 수 있습니다.

지금은 입니다. 모두입니다. 데이터베이스를 다루는 대부분의 작업에서 인덱스를 사용하는 것은 올바른 일입니다.

예를 들어 작은 행 집합을 추출해야하는 경우 전체 테이블 스캔 대신 색인을 통해 진행하는 것이 훨씬 빠른 순서가됩니다.

의심되는 경우 여러 가지 유형의 부하에서 응용 프로그램이 작동하는 방식을 확인하기 위해 성능 프로파일 링을 수행 한 다음 미세 조정을 시작하고 단일 기사를 은색 총알 뭐든지. 예를 들어

, 기사의 pad 열 수를 수행하는 예제 쿼리 속도를하는 한 가지 방법은 모두 valpad 덮여 하나의 인덱스를 생성하는 것, 이런 식으로 카운트 단순히 것 인덱스 스캔 및 인덱스 스캔 + 테이블 룩업이 아니며 전체 테이블 스캔보다 빠르게 실행됩니다.

가장 좋은 방법은 데이터를 알고 실험하고 사용하는 도구가 어떻게 작동 하는지를 알고 색인에 대해 자세히 알아 보는 것입니다. 결국 누가 가장 적합한 것인지 결정합니다. 귀하의 프로그램에 대한.

+1

기사에서 "1 % 또는 행 또는 그 이하의 전체 표 스캔을 보더라도 더 빨라질 수 있습니다." 절름발이가 아니기 때문에 대답은 "특정 상황에 달려있다"는 것 같습니다. –

+0

네, 그렇습니다. –

1

하지 때 그것은 당신이 절에 사용되는 각 컬럼에 인덱스를 넣어하는 것이 좋습니다.

2

항상 그렇습니다. 나는 지금까지 블로그 게시물에 설명 된대로 시나리오를 실행하지 못했습니다. 대규모 (5 천만 행)에 대한 내 쿼리에서 인덱스를 사용하는 것은 이러한 큰 테이블에서 전체 테이블을 검색하는 것보다 100-10000 배 정도 빠릅니다.

여기에는 별표가 없습니다. 특정 데이터와 특정 검색어를 테스트해야합니다.

관련 문제