CREATE MATERIALIZED VIEW

Dotyczy: zaznacz pole wyboru oznaczone jako tak Databricks SQL

zmaterializowany widok to widok, w którym są dostępne wstępnie obliczone wyniki dla zapytania i można je zaktualizować, aby odzwierciedlić zmiany w danych wejściowych. Za każdym razem, gdy zmaterializowany widok jest odświeżany, wyniki zapytania są ponownie obliczane w celu odzwierciedlenia zmian w nadrzędnych zestawach danych. Wszystkie zmaterializowane widoki są wspierane przez potok ETL. Możesz odświeżyć widoki zmaterializowane ręcznie lub zgodnie z harmonogramem.

Aby dowiedzieć się więcej na temat wykonywania odświeżania ręcznego, zobacz REFRESH (MATERIALIZED VIEW lub STREAMING TABLE).

Aby dowiedzieć się więcej o planowaniu odświeżania, zobacz Przykłady lub ALTER MATERIALIZED VIEW.

Zmaterializowane widoki można tworzyć wyłącznie przy użyciu serwera SQL Pro lub Bezserwerowego, albo w ramach potoku.

Uwaga

Operacje tworzenia i odświeżania w zmaterializowanych widokach i tabelach przesyłania strumieniowego są obsługiwane przez bezserwerowe potoki lakeflow. Eksplorator wykazu umożliwia wyświetlanie szczegółowych informacji o potokach tworzenia kopii zapasowych w interfejsie użytkownika. Zobacz Co to jest Eksplorator katalogu?.

Składnia

{ CREATE OR REPLACE MATERIALIZED VIEW | CREATE MATERIALIZED VIEW [ IF NOT EXISTS ] }
  view_name
  [ column_list ]
  [ view_clauses ]
  AS query

column_list
   ( { column_name column_type column_properties } [, ...]
      [ CONSTRAINT expectation_name EXPECT (expectation_expr)
        [ ON VIOLATION { FAIL UPDATE | DROP ROW } ] ] [, ...]
      [ , table_constraint ] [...])

   column_properties
      { NOT NULL | COMMENT column_comment | column_constraint | MASK clause } [ ... ]

view_clauses
  { USING { DELTA | ICEBERG } |
    PARTITIONED BY (col [, ...]) |
    CLUSTER BY clause |
    COMMENT view_comment |
    DEFAULT COLLATION UTF8_BINARY |
    TBLPROPERTIES clause |
    REFRESH POLICY refresh_clause |
    SCHEDULE [ REFRESH ] schedule_clause |
    schedule |
    WITH { ROW FILTER clause } } [...]

schedule
  { SCHEDULE [ REFRESH ] schedule_clause |
    TRIGGER ON UPDATE [ AT MOST EVERY trigger_interval ] }

schedule_clause
  { EVERY number { HOUR | HOURS | DAY | DAYS | WEEK | WEEKS } |
    CRON cron_string [ AT TIME ZONE timezone_id ] }

Parametry

Zamień

Jeśli zostanie określony, zastępuje widok i jego zawartość, jeśli już istnieje.
JEŚLI NIE ISTNIEJE

Tworzy widok, jeśli nie istnieje. Jeśli widok o tej nazwie już istnieje, CREATE MATERIALIZED VIEW instrukcja jest ignorowana.

Możesz określić co najwyżej jeden z IF NOT EXISTS lub OR REPLACE.
view_name

Nazwa nowo utworzonego widoku. W pełni kwalifikowana nazwa widoku musi być unikatowa.
column_list

Opcjonalnie etykietuje kolumny w wynikach zapytania widoku. Jeśli podasz listę kolumn, liczba aliasów kolumn musi być zgodna z liczbą wyrażeń w zapytaniu. Jeśli nie określono listy kolumn, aliasy pochodzą z treści widoku.
- nazwa_kolumny
  
  Nazwy kolumn muszą być unikatowe i odpowiadać kolumnom wyjściowym zapytania.
- typ_kolumny
  
  Określa typ danych kolumny. Nie wszystkie typy danych obsługiwane przez Azure Databricks są obsługiwane przez zmaterializowane widoki.
- column_comment
  
  Opcjonalny literał STRING opisujący kolumnę. Tę opcję należy określić wraz z column_type. Jeśli typ kolumny nie zostanie określony, komentarz kolumny zostanie pominięty.
- column_constraint
  
  Dodaje ograniczenie klucza podstawowego lub klucza obcego o charakterze informacyjnym do kolumny w zmaterializowanym widoku. Jeśli typ kolumny nie zostanie określony, ograniczenie kolumny zostanie pominięte.
- Klauzula "MASK"
  
  Dodaje funkcję maski kolumn do anonimowości poufnych danych. Wszystkie kolejne zapytania z tej kolumny otrzymują wynik oceny tej funkcji w kolumnie zamiast oryginalnej wartości kolumny. Może to być przydatne w celach szczegółowej kontroli dostępu, w których funkcja może sprawdzić tożsamość lub członkostwo w grupach użytkownika wywołującego w celu określenia, czy zredagować wartość. Jeśli typ kolumny nie zostanie określony, maska kolumny zostanie pominięta.
- CONSTRAINT expectation_name EXPECT (expectation_expr) [ W PRZYPADKU NARUSZENIA { FAIL UPDATE | DROP ROW } ]
  
  Dodaje oczekiwania dotyczące jakości danych do zmaterializowanego widoku. Te oczekiwania dotyczące jakości danych można śledzić w miarę upływu czasu i uzyskiwać do nich dostęp za pośrednictwem zmaterializowanego dziennika zdarzeń widoku. Oczekiwanie FAIL UPDATE powoduje niepowodzenie przetwarzania podczas tworzenia zmaterializowanego widoku i jego odświeżania. Oczekiwanie DROP ROW powoduje usunięcie całego wiersza, jeżeli oczekiwanie nie zostanie spełnione.
  
  Jeśli pominięto ON VIOLATION, oczekiwanie używa akcji domyślnej warn . Naruszenie wierszy jest zachowywane, a liczba naruszeń jest rejestrowana w obiekcie dziennika ExpectationMetricszdarzeń.
  
  expectation_expr Może składać się z literałów, identyfikatorów kolumn w zmaterializowanym widoku oraz deterministycznych, wbudowanych funkcji LUB operatorów SQL z wyjątkiem:
  - Funkcje agregujące
    - Funkcje okna analitycznego
    - Funkcje okna klasyfikacji
    - Funkcje generatora wartości tabeli
  Ponadto expr nie może zawierać żadnego podzapytania.
  
  Zmaterializowany widok, którego definicja zawiera oczekiwania, jest w pełni odświeżany w każdej aktualizacji i nie obsługuje odświeżania przyrostowego. Aby użyć odświeżania przyrostowego, usuń oczekiwania lub zastosuj je poza zmaterializowaną definicją widoku.
ograniczenie tabeli

Dodaje ograniczenie klucza głównego informacyjnego lub klucza obcego informacyjnego do tabeli w zmaterializowanym widoku. Jeśli typ kolumny nie zostanie określony, ograniczenie tabeli zostanie pominięte.
view_clauses

Opcjonalnie określ partycjonowanie, komentarze, właściwości zdefiniowane przez użytkownika i harmonogram odświeżania dla nowego zmaterializowanego widoku. Każda klauzula podrzędna może być określona tylko raz.
- UŻYWANIE FUNKCJI DELTA
  
  Określa format danych. Wartość domyślna to DELTA.
  
  Ta klauzula jest opcjonalna.
- KORZYSTANIE Z GÓRY LODOWEJ
  
  Tworzy zmaterializowany widok zgodny z zewnętrznymi czytnikami góry lodowej. Po utworzeniu zmaterializowanego widoku uruchom polecenie REPAIR TABLE <mv_name> SYNC METADATA. Zmaterializowany widok jest tylko do odczytu dla zewnętrznych czytelników góry lodowej. Zobacz Tworzenie zmaterializowanego widoku zgodnego z zewnętrznymi czytnikami góry lodowej.
  
  Ważna
  
  Zmaterializowane widoki zarządzanej góry lodowej są dostępne w publicznej wersji zapoznawczej. Aby włączyć tę funkcję, skontaktuj się z zespołem ds. kont usługi Databricks.
- PARTYCJONOWANE PRZEZ
  
  Opcjonalna lista kolumn, według których tabela jest partycjonowana.
  
  Uwaga
  
  Liquid clustering zapewnia elastyczne, zoptymalizowane rozwiązanie do klastrowania. Rozważ użycie CLUSTER BY zamiast PARTITIONED BY w przypadku zmaterializowanych widoków.
- CLUSTER BY
  
  Klauzula opcjonalna do klastrowania według podzestawu kolumn. Użyj automatycznego klastrowania liquid z usługą CLUSTER BY AUTO, a usługa Databricks inteligentnie wybiera klucze klastrowania, aby zoptymalizować wydajność zapytań. Zobacz Używaj płynnego grupowania dla tabel.
  
  Klastrowanie liquid nie może być łączone z PARTITIONED BY.
- KOMENTARZ wyświetl_komentarz
  
  Literał STRING służący do opisania tabeli.
- DOMYŚLNE SORTOWANIE UTF8_BINARY
  
  Dotyczy:, sprawdź, czy usługa SQL databricks Databricks Runtime 17.1 lub nowsza
  
  Wymusza domyślne uporządkowanie zmaterializowanego widoku na UTF8_BINARY. Ta klauzula jest obowiązkowa, jeśli schemat, w którym jest tworzony widok, ma sortowanie domyślne inne niż UTF8_BINARY. Domyślne sortowanie zmaterializowanego widoku jest używane jako domyślne sortowanie w treści widoku.
- TBLPROPERTIES
  
  Opcjonalnie ustawia co najmniej jedną właściwość zdefiniowaną przez użytkownika.
  
  Użyj tego ustawienia, aby określić kanał środowiska uruchomieniowego potoków lakeflow używany do uruchamiania tej instrukcji. Ustaw wartość właściwości pipelines.channel na wartość "PREVIEW" lub "CURRENT". Domyślna wartość to "CURRENT". Aby uzyskać więcej informacji na temat kanałów potoków lakeflow, zobacz Kanały środowiska uruchomieniowego potoków lakeflow.
- REFRESH ZASAD
  
  (Wersja beta) Opcjonalnie ustawia zasady odświeżania dla zmaterializowanego widoku.
- harmonogram
  
  Harmonogram może być instrukcją SCHEDULE lub instrukcją TRIGGER .
  - harmonogram [ REFRESH ] klauzula harmonogramu
    - EVERY number { HOUR | HOURS | DAY | DAYS | WEEK | WEEKS }
      
      Aby zaplanować odświeżanie okresowo, użyj składni EVERY. Jeśli określono składnię EVERY, tabela strumieniowana lub zmaterializowany widok jest okresowo odświeżany w określonych odstępach czasu na podstawie podanej wartości, takiej jak HOUR, HOURS, DAY, DAYS, WEEKlub WEEKS. W poniższej tabeli wymieniono zaakceptowane wartości całkowite dla number.
      
      Jednostka czasu Wartość całkowita
      
      HOUR or HOURS 1 <= H <= 72
      
      DAY or DAYS 1 <= D <= 31
      
      WEEK or WEEKS 1 <= W <= 8
      
      Uwaga
      
      Liczba pojedyncza i mnoga dołączonej jednostki czasowej są semantycznie równoważne.
    - CRON cron_string [ AT TIME ZONE timezone_id ]
      
      Aby zaplanować odświeżanie przy użyciu wartości quartz cron. Akceptowane są prawidłowe time_zone_values . AT TIME ZONE LOCAL nie jest obsługiwana.
      
      Wyrażenie cron używa sześciu pól rozdzielanych spacjami w kolejności: seconds minutes hours day-of-month month day-of-week. Użyj ? polecenia day-of-month lub day-of-week , aby pozostawić go nieokreślony.
      
      Na przykład SCHEDULE CRON '0 0 0 * * ?' AT TIME ZONE 'UTC' odświeża codziennie o północy czasu UTC.
      
      Jeśli AT TIME ZONE jest nieobecny, używana jest strefa czasowa sesji. Jeśli AT TIME ZONE jest nieobecny, a strefa czasowa sesji nie jest ustawiona, zostanie zgłoszony błąd. SCHEDULEjest semantycznie równoważne .SCHEDULE REFRESH
  - WYZWALACZ NA UPDATE [ CO NAJWYŻEJ CO TRIGGER_INTERVAL ]
    
    Opcjonalnie ustaw tabelę tak, aby odświeżyła się po zaktualizowaniu nadrzędnego źródła danych, co najwyżej co minutę. Ustaw wartość , AT MOST EVERY aby wymagać co najmniej minimalnego czasu między odświeżeniami.
    
    Nadrzędne źródła danych muszą być zewnętrznymi lub zarządzanymi tabelami delty (w tym zmaterializowanymi widokami lub tabelami przesyłania strumieniowego) albo widokami zarządzanymi, których zależności są ograniczone do obsługiwanych typów tabel. Udostępnianie udostępnionych tabel openSharing nie jest obsługiwane jako nadrzędne źródła.
    
    Włączenie zdarzeń plików może sprawić, że wyzwalacze będą bardziej wydajne i zwiększa niektóre limity dotyczące aktualizacji wyzwalacza.
    
    Jest trigger_interval to instrukcja INTERVAL , która jest co najmniej 1 minuta.
    
    TRIGGER ON UPDATE ma następujące ograniczenia
    - Nie więcej niż 10 nadrzędnych źródeł danych na widok materializowany przy użyciu TRIGGER ON UPDATE.
    - Maksymalnie 1000 tabel przesyłania strumieniowego lub zmaterializowanych widoków można określić za pomocą TRIGGER ON UPDATE.
    - Klauzula AT MOST EVERY jest domyślnie ustawiona na 1 minutę i nie może być mniejsza niż 1 minuta.
- Z klauzulą ROW FILTER
  
  Dodaje do tabeli funkcję filtru wierszy. Wszystkie kolejne zapytania z tej tabeli otrzymują podzbiór wierszy, dla których funkcja zwraca wartość logiczną TRUE. Może to być przydatne w celach szczegółowej kontroli dostępu, w których funkcja może sprawdzić tożsamość lub członkostwo w grupach użytkownika wywołującego w celu określenia, czy filtrować niektóre wiersze.
Zapytanie AS

Zapytanie, które konstruuje widok z tabel podstawowych lub innych widoków.

Jednostka czasu	Wartość całkowita
`HOUR or HOURS`	1 <= H <= 72
`DAY or DAYS`	1 <= D <= 31
`WEEK or WEEKS`	1 <= W <= 8

Wymagane uprawnienia

Użytkownik tworzący zmaterializowany widok (MV) jest właścicielem mv i musi mieć następujące uprawnienia:

SELECT uprawnienia dotyczące tabel podstawowych, do których odwołuje się MV.
uprawnienie USE CATALOG w katalogu nadrzędnym oraz uprawnienie USE SCHEMA w schemacie nadrzędnym.
CREATE MATERIALIZED VIEW uprawnienie do schematu zawierającego zmaterializowany widok.
Potoki korzystające ze starszego CREATE TABLE również wymagają uprawnień.

Aby użytkownik mógł odświeżyć MV, potrzebuje:

uprawnienie USE CATALOG w katalogu nadrzędnym oraz uprawnienie USE SCHEMA w schemacie nadrzędnym.
Własność MV lub REFRESH przywilej na MV.
Właściciel MV musi mieć przywilej SELECT dotyczący tabel podstawowych, do których odwołuje się MV.

Aby użytkownik mógł wykonywać zapytania dotyczące MV, potrzebuje:

uprawnienie USE CATALOG w katalogu nadrzędnym oraz uprawnienie USE SCHEMA w schemacie nadrzędnym.
SELECT uprawnienia do materializowanego widoku.

Filtry wierszy i maski kolumn

Filtry wierszy umożliwiają określenie funkcji, która ma zastosowanie jako filtr za każdym razem, gdy skanowanie tabeli pobiera wiersze. Te filtry zapewniają, że kolejne zapytania zwracają tylko wiersze, dla których predykat filtru daje wartość true.

Maski kolumn umożliwiają maskowanie wartości kolumny za każdym razem, gdy skanowanie tabeli pobiera wiersze. Wszystkie przyszłe zapytania obejmujące tę kolumnę otrzymają wynik oceny funkcji w kolumnie, zastępując oryginalną wartość kolumny.

Aby uzyskać więcej informacji na temat używania filtrów wierszy i masek kolumn, zobacz Filtry wierszy i maski kolumn.

Zarządzanie filtrami wierszy i maskami kolumn

Filtry wierszy i maski kolumn w widokach materializowanych należy dodawać za pomocą instrukcji CREATE.

Zachowanie

Odśwież jako definiujący: gdy REFRESH MATERIALIZED VIEW instrukcja odświeża zmaterializowany widok, funkcje filtrowania wierszy są uruchamiane z uprawnieniami definiującego (jako właściciel tabeli). Oznacza to, że odświeżanie tabeli używa kontekstu zabezpieczeń użytkownika, który utworzył zmaterializowany widok.
Zapytanie: Podczas gdy większość filtrów jest uruchamiana z prawami definiowanego, funkcje sprawdzające kontekst użytkownika (takie jak CURRENT_USER i IS_MEMBER) są wyjątkami. Te funkcje działają jako wywołujący. Takie podejście wymusza zabezpieczenia danych specyficzne dla użytkownika i mechanizmy kontroli dostępu na podstawie kontekstu bieżącego użytkownika.
Podczas tworzenia zmaterializowanych widoków w tabelach źródłowych zawierających filtry wierszy i maski kolumn odświeżanie zmaterializowanego widoku jest zawsze pełnym odświeżaniem. Pełne odświeżanie ponownie przetwarza wszystkie dane dostępne w źródle przy użyciu najnowszych definicji. Zapewnia to, że zasady bezpieczeństwa w tabelach źródłowych są oceniane i stosowane z wykorzystaniem najbardziej aktualnych danych i definicji.

Obserwowalność

Użyj DESCRIBE EXTENDED, INFORMATION_SCHEMAlub Eksploratora wykazu, aby zbadać istniejące filtry wierszy i maski kolumn, które mają zastosowanie do danego zmaterializowanego widoku. Ta funkcja umożliwia użytkownikom kontrolowanie i przeglądanie dostępu do danych oraz środków bezpieczeństwa w zmaterializowanych widokach.

Ograniczenia

Gdy zmaterializowany widok z agregacją w kolumnie, która może zawierać wartości NULL, ma ostatnią wartość inną niż NULL usuniętą z tej kolumny, przez co pozostają tylko wartości sum, wtedy wynikowa wartość agregowana tego widoku zwraca zero zamiast NULL.
Odwołanie do kolumny nie wymaga aliasu. Wyrażenia nieodwołujące się do kolumn wymagają aliasu, jak w poniższym przykładzie:
- Dozwolone: SELECT col1, SUM(col2) AS sum_col2 FROM t GROUP BY col1
- Niedozwolone: SELECT col1, SUM(col2) FROM t GROUP BY col1
NOT NULL należy określić ręcznie wraz z instrukcją PRIMARY KEY , aby być prawidłową instrukcją.
Zmaterializowane widoki nie obsługują kolumn tożsamości ani kluczy zastępczych.
Zmaterializowane widoki nie obsługują poleceń OPTIMIZE i VACUUM. Konserwacja odbywa się automatycznie.
Zmaterializowane widoki nie obsługują funkcji CLONE. Nie można użyć zmaterializowanego widoku jako źródła lub celu głębokiego lub płytkiego klonu. Zobacz Klonowanie tabeli w usłudze Azure Databricks.

Przykłady

-- Create a materialized view if it doesn't exist
> CREATE MATERIALIZED VIEW IF NOT EXISTS subscribed_movies
  AS SELECT mo.member_id, mb.full_name, mo.movie_title
       FROM movies AS mo INNER JOIN members AS mb ON mo.member_id = mb.id;

-- Create and schedule a materialized view to be refreshed whenever the
-- upstream data is updated
> CREATE MATERIALIZED VIEW IF NOT EXISTS subscribed_movies
  TRIGGER ON UPDATE
  AS SELECT mo.member_id, mb.full_name, mo.movie_title
       FROM movies AS mo INNER JOIN members AS mb ON mo.member_id = mb.id;

-- Create and schedule a materialized view to be refreshed every day.
-- Note: All columns in a GROUP BY need to be explicitly aliased
> CREATE MATERIALIZED VIEW daily_sales
  COMMENT 'Daily sales numbers'
  SCHEDULE EVERY 1 DAY
  AS SELECT date AS date, sum(sales) AS sumOfSales
       FROM table1
       GROUP BY date;

-- Create and schedule a materialized view using a cron expression.
-- The cron expression uses six space-separated fields:
-- seconds minutes hours day-of-month month day-of-week
-- Use '?' for day-of-month or day-of-week to leave it unspecified.
-- This example refreshes daily at midnight UTC.
> CREATE MATERIALIZED VIEW daily_revenue
  SCHEDULE CRON '0 0 0 * * ?' AT TIME ZONE 'UTC'
  AS SELECT date AS date, sum(revenue) AS totalRevenue
       FROM orders
       GROUP BY date;

-- Sets the runtime channel to "PREVIEW"
> CREATE MATERIALIZED VIEW mv_preview
  TBLPROPERTIES(pipelines.channel = "PREVIEW")
  AS SELECT * FROM RANGE(10)

-- Create a materialized view with a table constraint
> CREATE MATERIALIZED VIEW IF NOT EXISTS subscribed_movies(
    member_id int NOT NULL,
    full_name string,
    movie_title string,
    CONSTRAINT movie_pk PRIMARY KEY(member_id)
  )
  AS SELECT mo.member_id, mb.full_name, mo.movie_title
       FROM movies AS mo INNER JOIN members AS mb ON mo.member_id = mb.id;

-- Create or replace the materialized view to remove the table constraint and add a partition
> CREATE OR REPLACE MATERIALIZED VIEW subscribed_movies
  PARTITIONED BY (member_id)
  AS SELECT mo.member_id, mb.full_name, mo.movie_title
       FROM movies AS mo INNER JOIN members AS mb ON mo.member_id = mb.id;

-- Create a materialized view with a row filter and a column mask
> CREATE MATERIALIZED VIEW masked_view (
    id int,
    name string,
    region string,
    ssn string MASK catalog.schema.ssn_mask_fn
  )
  WITH ROW FILTER catalog.schema.us_filter_fn ON (region)
  AS SELECT id, name, region, ssn
       FROM employees;

REFRESH

Opinia

Czy ta strona była pomocna?

Last updated on 2026-07-10