Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Dotyczy:
Databricks SQL
Databricks Runtime
Użyj instrukcji , ANALYZE TABLE … COMPUTE STATISTICS aby zebrać szacowane statystyki dotyczące określonej tabeli lub wszystkich tabel w określonym schemacie. Te statystyki są używane przez optymalizator zapytań do generowania optymalnego planu zapytania.
Analiza predykcyjna jest automatycznie uruchamiana ANALYZE w tabelach zarządzanych przez Unity Catalog w celu zebrania tych informacji. Databricks zaleca włączenie optymalizacji predykcyjnej dla wszystkich tabel zarządzanych przez Unity Catalog, aby uprościć konserwację danych i zmniejszyć koszty przechowywania. Zobacz Optymalizację predykcyjną dla tabel zarządzanych w Unity Catalog.
Składnia
ANALYZE TABLE table_name [ PARTITION clause ]
COMPUTE [ DELTA ] STATISTICS [ NOSCAN | FOR COLUMNS col1 [, ...] | FOR ALL COLUMNS ]
ANALYZE TABLES [ { FROM | IN } schema_name ] COMPUTE STATISTICS [ NOSCAN ]
Parametry
-
Identyfikuje tabelę do przeanalizowania. Nazwa nie może zawierać specyfikacji czasowej ani specyfikacji opcji ani ścieżki . Jeśli nie można odnaleźć tabeli usługi Azure Databricks, wystąpi błąd TABLE_OR_VIEW_NOT_FOUND.
PARTITION klauzula
Opcjonalnie ogranicza polecenie do podzbioru partycji.
Ta klauzula nie jest obsługiwana dla tabel Delta Lake.
DELTADotyczy:
Databricks SQL
Databricks Runtime 14.3 LTS i nowszePrzelicza statystyki przechowywane w dzienniku Delta dla kolumn skonfigurowanych do zbierania statystyk w tabeli Delta.
Po określeniu
DELTAsłowa kluczowego nie są zbierane normalne statystyki optymalizatora zapytań.Usługa Databricks zaleca uruchamianie
ANALYZE TABLE table_name COMPUTE DELTA STATISTICSpo ustawieniu nowych kolumn dla danych pomijających aktualizowanie statystyk dla wszystkich wierszy w tabeli. Aby zoptymalizować wydajność, uruchom polecenieANALYZE TABLE table_name COMPUTE STATISTICSdo aktualizacji planu zapytania po zakończeniu aktualizacji dziennika Delta.[ NOSCAN | FOR COLUMNS kolumn [, …] | DLA WSZYSTKICH COLUMNS ]
Jeśli nie określono opcji analizy,
ANALYZE TABLEzbiera liczbę wierszy i rozmiar tabeli w bajtach.NOSCAN
Zbierz tylko rozmiar tabeli w bajtach (który nie wymaga skanowania całej tabeli).
DLA COLUMNS kol [, ...] | DLA WSZYSTKICH COLUMNS
Zbierz statystyki kolumn dla każdej określonej kolumny lub alternatywnie dla każdej kolumny, a także statystyki tabeli.
Statystyki kolumn nie są obsługiwane w połączeniu z klauzulą
PARTITION.
{ FROM
|IN } schema_nameOkreśla nazwę schematu do przeanalizowania. Bez nazwy schematu
ANALYZE TABLESzbiera wszystkie tabele w bieżącym schemacie, do których bieżący użytkownik ma uprawnienia do analizowania.
Przykłady
> CREATE TABLE students (name STRING, student_id INT) PARTITIONED BY (student_id);
> INSERT INTO students PARTITION (student_id = 111111) VALUES ('Mark');
> INSERT INTO students PARTITION (student_id = 222222) VALUES ('John');
> ANALYZE TABLE students COMPUTE STATISTICS NOSCAN;
> DESC EXTENDED students;
col_name data_type comment
-------------------- -------------------- -------
name string null
student_id int null
... ... ...
Statistics 864 bytes
... ... ...
> ANALYZE TABLE students COMPUTE STATISTICS;
> DESC EXTENDED students;
col_name data_type comment
-------------------- -------------------- -------
name string null
student_id int null
... ... ...
Statistics 864 bytes, 2 rows
... ... ...
-- Note: ANALYZE TABLE .. PARTITION is not supported for Delta tables.
> ANALYZE TABLE students PARTITION (student_id = 111111) COMPUTE STATISTICS;
> DESC EXTENDED students PARTITION (student_id = 111111);
col_name data_type comment
-------------------- -------------------- -------
name string null
student_id int null
... ... ...
Partition Statistics 432 bytes, 1 rows
... ... ...
OutputFormat org.apache.hadoop...
> ANALYZE TABLE students COMPUTE STATISTICS FOR COLUMNS name;
> DESC EXTENDED students name;
info_name info_value
-------------- ----------
col_name name
data_type string
comment NULL
min NULL
max NULL
num_nulls 0
distinct_count 2
avg_col_len 4
max_col_len 4
histogram NULL
> ANALYZE TABLES IN school_schema COMPUTE STATISTICS NOSCAN;
> DESC EXTENDED teachers;
col_name data_type comment
-------------------- -------------------- -------
name string null
teacher_id int null
... ... ...
Statistics 1382 bytes
... ... ...
> DESC EXTENDED students;
col_name data_type comment
-------------------- -------------------- -------
name string null
student_id int null
... ... ...
Statistics 864 bytes
... ... ...
> ANALYZE TABLES COMPUTE STATISTICS;
> DESC EXTENDED teachers;
col_name data_type comment
-------------------- -------------------- -------
name string null
teacher_id int null
... ... ...
Statistics 1382 bytes, 2 rows
... ... ...
> DESC EXTENDED students;
col_name data_type comment
-------------------- -------------------- -------
name string null
student_id int null
... ... ...
Statistics 864 bytes, 2 rows
... ... ...
> ANALYZE TABLE some_delta_table COMPUTE DELTA STATISTICS;