다음을 통해 공유


클러스터형 인덱스의 크기 예측

적용 대상: SQL Server Azure SQL Database Azure SQL Managed Instance

다음 단계를 통해 클러스터형 인덱스에 데이터를 저장하는 데 필요한 공간을 추정할 수 있습니다.

  1. 클러스터형 인덱스의 리프 수준에서 데이터를 저장하는 데 사용되는 공간을 계산합니다.

  2. 클러스터형 인덱스에 대한 인덱스 정보를 저장하는 데 사용되는 공간을 계산합니다.

  3. 계산된 값을 합산합니다.

1단계. 리프 수준에 데이터를 저장하는 데 사용되는 공간 계산

  1. 테이블에 표시할 행 수를 지정합니다.

    Num_Rows = 테이블의 행 수

  2. 고정 길이 및 가변 길이 열 수를 지정하고 이러한 열을 스토리지하는 데 필요한 공간을 계산합니다.

    이러한 각 열 그룹이 데이터 행 내에서 차지하는 공간을 계산합니다. 열의 크기는 데이터 형식 및 길이 사양에 따라 달라집니다.

    Num_Cols = 열의 총 수(고정 길이 및 가변 길이)

    Fixed_Data_Size = 모든 고정 길이 열의 총 바이트 크기

    Num_Variable_Cols = 가변 길이 열의 수

    Max_Var_Size = 모든 가변 길이 열의 최대 바이트 크기

  3. 클러스터형 인덱스가 고유하지 않은 경우 uniqueifier 열을 계산합니다.

    uniqueifier는 nullable의 가변 길이 열입니다. 고유하지 않은 키 값이 있는 행에서 이 열은 Null이 아니며 크기는 4바이트입니다. 이 값은 인덱스 키의 일부이며 모든 행에 고유한 키 값이 있는지 확인해야 합니다.

    Num_Cols = Num_Cols + 1

    Num_Variable_Cols = Num_Variable_Cols + 1

    Max_Var_Size = Max_Var_Size + 4

    이러한 수정에서는 모든 값이 고유하지 않다고 가정합니다.

  4. 행의 Null 비트맵 부분은 열의 Null 허용 여부 관리를 위해 예약됩니다. 다음과 같이 이 부분의 크기를 계산합니다.

    Null_Bitmap = 2 + ((Num_Cols + 7) / 8)

    이전 식의 정수 부분만 사용하고 나머지는 모두 버려야 합니다.

  5. 가변 길이 데이터 크기를 계산합니다.

    테이블에 가변 길이 열이 있는 경우에는 해당 행 안에 열을 저장하는 데 사용되는 공간을 결정합니다.

    Variable_Data_Size = 2 + (Num_Variable_Cols x 2) + Max_Var_Size

    Max_Var_Size에 추가된 바이트는 각 변수 열을 추적하기 위한 것입니다. 이 수식에서는 모든 가변 길이 열이 100% 가득 찼다고 가정합니다. 사용할 가변 길이 열 스토리지 공간 비율이 더 적을 것으로 예상되는 경우 해당 비율로 Max_Var_Size 값을 조정하여 전체 테이블 크기를 보다 정확하게 예측할 수 있습니다.

    참고 항목

    정의된 총 테이블 너비가 8,060바이트를 초과하는 varchar, nvarchar, varbinary또는 sql_variant 열을 결합할 수 있습니다. 이 열 각각의 길이는 계속해서 varchar, varbinary 또는 sql_variant 열의 경우 8,000바이트, nvarchar 열의 경우 4,000바이트의 제한을 넘지 않아야 합니다. 그러나 결합된 너비는 테이블의 8,060 바이트 제한을 초과할 수 있습니다.

    가변 길이 열이 없는 경우에는 Variable_Data_Size를 0으로 설정합니다.

  6. 총 행 크기를 계산합니다.

    Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

    값 4는 데이터 행의 행 머리글 오버헤드입니다.

  7. 페이지당 행 수를 계산합니다(페이지당 8096바이트 사용 가능).

    Rows_Per_Page = 8096 / (Row_Size + 2)

    행이 여러 페이지에 걸쳐 배치되지는 않으므로 페이지당 행 수는 가장 근사한 정수 값으로 버림하여 계산해야 합니다. 수식에서 값 2는 페이지의 슬롯 배열에서 행의 입력을 위한 것입니다.

  8. 지정한 채우기 비율에 따라 페이지당 예약된 여유 행 수를 계산합니다.

    Free_Rows_Per_Page = 8096 x ((100 - Fill_Factor) / 100) / (Row_Size + 2)

    계산에 사용되는 채우기 비율은 백분율이 아닌 정수 값입니다. 행이 여러 페이지에 걸쳐 배치되지는 않으므로 페이지당 행 수는 가장 근사한 정수 값으로 버림하여 계산해야 합니다. 채우기 비율이 클수록 각 페이지에 더 많은 데이터가 저장되고 페이지 수는 줄어듭니다. 수식에서 값 2는 페이지의 슬롯 배열에서 행의 입력을 위한 것입니다.

  9. 모든 행을 저장하는 데 필요한 페이지 수를 계산합니다.

    Num_Leaf_Pages = Num_Rows / (Rows_Per_Page - Free_Rows_Per_Page)

    예상 페이지 수는 가장 가까운 전체 페이지로 반올림되어야 합니다.

  10. 리프 수준에서 데이터를 저장하는 데 필요한 공간의 양을 계산합니다(페이지당 총 바이트 수 8192바이트).

    Leaf_space_used = 8192 x Num_Leaf_Pages

2단계. 인덱스 정보를 저장하는 데 사용되는 공간 계산

다음 단계를 사용하여 인덱스의 상위 레벨을 저장하는 데 필요한 공간의 양을 추정할 수 있습니다.

  1. 인덱스 키의 고정 길이 및 가변 길이 열 수를 지정하고 이러한 열을 스토리지하는 데 필요한 공간을 계산합니다.

    인덱스의 키 열에는 고정 길이 및 가변 길이 열이 포함될 수 있습니다. 내부 수준 인덱스 행 크기를 예측하려면 이러한 각 열 그룹이 인덱스 행 내에서 차지하는 공간을 계산합니다. 열의 크기는 데이터 형식 및 길이 사양에 따라 달라집니다.

    Num_Key_Cols = 키 열의 총 수(고정 길이 및 가변 길이)

    Fixed_Key_Size = 모든 고정 길이 키 열의 총 바이트 크기

    Num_Variable_Key_Cols = 가변 길이 키 열의 수

    Max_Var_Key_Size = 모든 가변 길이 키 열의 최대 바이트 크기

  2. 인덱스가 고유하지 않은 경우 필요한 고유 식별자를 계산합니다.

    uniqueifier는 nullable의 가변 길이 열입니다. 고유하지 않은 인덱스 키 값이 있는 행에서 이 열은 Null이 아니며 크기는 4바이트입니다. 이 값은 인덱스 키의 일부이며 모든 행에 고유한 키 값이 있는지 확인해야 합니다.

    Num_Key_Cols = Num_Key_Cols + 1

    Num_Variable_Key_Cols = Num_Variable_Key_Cols + 1

    Max_Var_Key_Size = Max_Var_Key_Size + 4

    이러한 수정에서는 모든 값이 고유하지 않다고 가정합니다.

  3. Null 비트맵 크기를 계산합니다.

    인덱스 키에 null 허용 열이 있는 경우 인덱스 행의 일부가 null 비트맵에 대해 예약됩니다. 다음과 같이 이 부분의 크기를 계산합니다.

    Index_Null_Bitmap = 2 + ((인덱스 행의 열 수 + 7) / 8)

    위 식의 정수 부분만 사용하고 나머지를 삭제합니다.

    Null을 허용하는 키 열이 없으면 Index_Null_Bitmap을 0으로 설정합니다.

  4. 가변 길이 데이터 크기를 계산합니다.

    인덱스에 가변 길이 열이 있는 경우에는 해당 인덱스 행 안에 열을 저장하는 데 사용되는 공간을 결정합니다.

    Variable_Key_Size = 2 + (Num_Variable_Key_Cols x 2) + Max_Var_Key_Size

    Max_Var_Key_Size에 추가된 바이트는 각 가변 길이 열을 추적하기 위한 것입니다. 이 수식에서는 모든 가변 길이 열이 100% 가득 찼다고 가정합니다. 사용할 가변 길이 열 스토리지 공간 비율이 더 적을 것으로 예상되는 경우 해당 비율로 Max_Var_Key_Size 값을 조정하여 전체 테이블 크기를 보다 정확하게 예측할 수 있습니다.

    가변 길이 열이 없는 경우에는 Variable_Key_Size를 0으로 설정합니다.

  5. 인덱스 행 크기를 계산합니다.

    Index_Row_Size = Fixed_Key_Size + Variable_Key_Size + Index_Null_Bitmap + 1(인덱스 행의 행 머리글 오버헤드) + 6(자식 페이지 ID 포인터)

  6. 페이지당 인덱스 행 수를 계산합니다. 페이지당 사용 가능한 바이트 수는 8,096바이트입니다.

    Index_Rows_Per_Page = 8096 / (Index_Row_Size + 2)

    인덱스 행이 여러 페이지에 걸쳐 배치되지는 않으므로 페이지당 인덱스 행 수는 가장 근사한 정수 값으로 버림하여 계산해야 합니다. 수식에서 값 2는 페이지의 슬롯 배열에서 행의 입력을 위한 것입니다.

  7. 인덱스에서 수준의 수를 계산합니다.

    Non-leaf_Levels = 1 + log (Index_Rows_Per_Page) (Num_Leaf_Pages / Index_Rows_Per_Page)

    이 값을 가장 가까운 정수로 반올림합니다. 클러스터형 인덱스의 리프 수준은 이 값에 포함되지 않습니다.

  8. 인덱스의 리프가 아닌 페이지의 수를 계산합니다.

    Num_Index_Pages = ∑Level (Num_Leaf_Pages / (Index_Rows_Per_Page^Level))

    여기서 1 <= Level <= Non-leaf_Levels

    각 피가수를 가장 근사한 정수로 올립니다. 간단한 예로 Num_Leaf_Pages = 1000 및 Index_Rows_Per_Page = 25인 인덱스를 고려합니다. 리프 수준 위 첫 번째 인덱스 수준에 인덱스 행이 1000개 저장되고 리프 페이지당 인덱스 행 1개씩, 각 페이지마다 인덱스 행 25개가 들어갈 수 있습니다. 즉 인덱스 행을 1000개 저장하려면 40 페이지가 필요합니다. 인덱스의 다음 수준에서는 40개 행을 저장해야 하므로 즉 2 페이지가 필요합니다. 인덱스의 최종 수준에서는 2개 행을 저장해야 하므로 즉 1 페이지가 필요합니다. 이렇게 하면 리프가 아닌 인덱스 페이지가 43개 있습니다. 앞의 수식에 이 숫자들을 사용하면 다음 결과가 나옵니다.

    Non-leaf_Levels = 1 + log(25) (1000 / 25) = 3

    Num_Index_Pages = 1000/(25^3)+ 1000/(25^2) + 1000/(25^1) = 1 + 2 + 40 = 43(예에서 설명한 페이지 수)

  9. 인덱스 크기를 계산합니다. 페이지당 총 바이트 수는 8,192바이트입니다.

    Index_Space_Used = 8192 x Num_Index_Pages

3단계 계산된 값을 합산합니다

이전 두 단계에서 얻은 값의 합계:

클러스터형 인덱스 크기(바이트) = Leaf_Space_Used + Index_Space_used

이 계산에서는 다음을 고려하지 않습니다.

  • 분할

    분할로 인한 공간 오버헤드는 최소화되지만 계산하기 복잡합니다. 포함하는 것은 중요하지 않습니다.

  • 할당 페이지

    힙에 할당된 페이지를 추적하는 데 사용되는 IAM 페이지가 하나 이상 있지만 공간 오버헤드는 최소화되며 사용되는 IAM 페이지 수를 정확하게 계산하는 알고리즘은 없습니다.

  • LOB(큰 개체) 값

    LOB 데이터 형식 varchar(max), varbinary(max), nvarchar(max), text, ntext, xml, 및 image 값을 저장하는 데 사용될 공간을 정확하게 측정하는 알고리즘은 복잡합니다. 예상되는 LOB 값의 평균 크기를 추가하고 Num_Rows를 곱한 다음 총 클러스터형 인덱스 크기에 추가하면 됩니다.

  • 압축

    압축된 인덱스의 크기를 미리 계산할 수 없습니다.

  • 스파스 열

    스파스 열의 스페이스 요구 사항에 대해 자세한 정보는 스파스 열 사용을 참조하세요.

다음 단계