CREATE MATERIALIZED VIEW (rörledningar)

En materialiserad vy är en vy där förberäknade resultat är tillgängliga för frågor och kan uppdateras för att återspegla ändringar i indata. Materialiserade vyer stöds av en pipeline. Varje gång en materialiserad vy uppdateras beräknas frågeresultaten om för att återspegla ändringar i överordnade datamängder. Du kan uppdatera materialiserade vyer manuellt eller enligt ett schema.

Mer information om hur du utför eller schemalägger uppdateringar finns i Köra en pipelineuppdatering.

Syntax

CREATE [OR REFRESH] [PRIVATE] MATERIALIZED VIEW
  view_name
  [ column_list ]
  [ view_clauses ]
  AS query

column_list
   ( { column_name column_type column_properties } [, ...]
    [ CONSTRAINT expectation_name EXPECT (expectation_expr)
      [ ON VIOLATION { FAIL UPDATE | DROP ROW } ] ] [, ...]
    [ , table_constraint ] [...] )

   column_properties
      { NOT NULL | COMMENT column_comment | column_constraint | MASK clause } [ ... ]

view_clauses
  { USING { DELTA | ICEBERG } |
    PARTITIONED BY (col [, ...]) |
    CLUSTER BY clause |
    LOCATION path |
    COMMENT view_comment |
    TBLPROPERTIES clause |
    REFRESH POLICY refresh_clause |
    WITH { ROW FILTER clause } } [...]

Parameterar

REFRESH

Om det anges skapar du vyn eller uppdaterar en befintlig vy och dess innehåll.
PRIVAT

Skapar en privat materialiserad vy. En privat materialiserad vy kan vara användbar som en mellanliggande tabell i en pipeline som du inte vill ska publiceras i katalogen.
- De läggs inte till i katalogen och är endast tillgängliga i den definierande pipelinen
- De kan ha samma namn som ett befintligt objekt i katalogen. Om en privat materialiserad vy och ett objekt i katalogen har samma namn i pipelinen matchas referenser till namnet till den privata materialiserade vyn.
- Privata materialiserade vyer sparas bara under pipelinens livslängd, inte bara en enda uppdatering.
Privata materialiserade vyer skapades tidigare med parametern TEMPORARY .
view_name

Namnet på den nyligen skapade vyn. Det fullständigt kvalificerade vynamn måste vara unikt.

Privata materialiserade vyer kan ha samma namn som ett objekt som publiceras i katalogen.
column_list

Du kan också etikettera kolumnerna i frågeresultatet i vyn. Om du anger en kolumnlista måste antalet kolumnalias matcha antalet uttryck i frågan. Om ingen kolumnlista anges härleds alias från brödtexten i vyn.
- kolumnnamn
  
  Kolumnnamnen måste vara unika och mappas till frågans utdatakolumner.
- kolumntyp
  
  Specificerar kolumnens datatyp. Alla datatyper som stöds av Azure Databricks stöds inte av materialiserade vyer.
- column_comment
  
  En valfri STRING-literal som beskriver kolumnen. Det här alternativet måste anges tillsammans med column_type. Om kolumntypen inte har angetts hoppas kolumnkommenteringen över.
- column_constraint
  
  Lägger till en informationsprimärnyckel eller informationsutländsk nyckelbegränsning till en kolumn i en materialiserad vy.
- MASK-villkor
  
  Lägger till en kolumnmaskfunktion för att anonymisera känsliga data. Se Radfilter och kolumnmasker.
- CONSTRAINT expectation_name EXPECT (expectation_expr) [ ON VIOLATION { FAIL UPDATE | TA BORT RAD } ]
  
  Lägger till datakvalitetsförväntningar i den materialiserade vyn. Dessa förväntningar på datakvalitet kan spåras över tid och nås via den materialiserade vyns händelselogg. En FAIL UPDATE förväntan gör att bearbetningen misslyckas när både den materialiserade vyn skapas och uppdateras. En DROP ROW förväntan gör att hela raden tas bort om förväntningarna inte uppfylls. Se avsnittet Hantera datakvalitet med pipeline-förväntningar.
  
  expectation_expr kan bestå av literaler, kolumnidentifierare i den materialiserade vyn och deterministiska, inbyggda SQL-funktioner eller operatorer förutom:
  - Mängdfunktioner
    - Analytiska fönsterfunktioner
    - Funktioner för rangordningsfönster
    - Generatorfunktioner som returnerar tabellvärden
  Får inte heller expr innehålla någon underfråga.
  
  En materialiserad vy vars definition innehåller förväntningar uppdateras fullständigt för varje uppdatering och stöder inte inkrementell uppdatering. Om du vill använda inkrementell uppdatering tar du bort förväntningarna eller tillämpar dem utanför den materialiserade vydefinitionen.
tabellbegränsning

När du anger ett schema kan du definiera primära och externa nycklar. Begränsningarna är informationsmässiga och tillämpas inte. CONSTRAINT Se satsen i SQL-språkreferensen.

Anmärkning

För att definiera tabellbegränsningar måste pipelinen vara en Unity Catalog-aktiverad pipeline.
view_clauses

Du kan också ange partitionering, kommentarer och användardefinierade egenskaper för den materialiserade vyn. Varje undersats kan endast anges en gång.
- ANVÄNDA DELTA
  
  Anger dataformatet. Standardvärdet är DELTA.
  
  Den här satsen är valfri.
- ANVÄNDA ISBERG
  
  Skapar en materialiserad vy som är kompatibel med externa Iceberg-läsare. När du har skapat den materialiserade vyn kör du REPAIR TABLE <mv_name> SYNC METADATA. Den materialiserade vyn är skrivskyddad för externa Isbergsläsare. Se Skapa en materialiserad vy som är kompatibel med externa Iceberg-läsare.
  
  Important
  
  Hanterade iceberg-materialiserade vyer finns i offentlig förhandsversion. Om du vill aktivera den här funktionen kontaktar du ditt Databricks-kontoteam.
- Partitionerad efter
  
  En valfri lista över en eller flera kolumner som ska användas för partitionering i tabellen. Ömsesidigt uteslutande med CLUSTER BY.
  
  Flytande klustring ger en flexibel, optimerad lösning för klustring. Överväg att använda CLUSTER BY i stället för PARTITIONED BY för pipelines.
- CLUSTER BY
  
  Aktivera flytande klustring i tabellen och definiera de kolumner som ska användas som klustringsnycklar. Använd automatisk flytande klustring med CLUSTER BY AUTO, och Databricks väljer intelligent klustringsnycklar för att optimera frågeprestanda. Ömsesidigt uteslutande med PARTITIONED BY.
  
  Se Använda flytande klustring för tabeller.
- PLATS
  
  En valfri lagringsplats för tabelldata. Om det inte anges är systemet standard för lagringsplatsen för pipelinen.
  
  Det här alternativet är endast tillgängligt när du publicerar till Hive-metaarkivet. I Unity Catalog hanteras platsen automatiskt.
- KOMMENTAR
  
  En valfri beskrivning för tabellen.
- TBLPROPERTIES
  
  En valfri lista över tabellegenskaper för tabellen.
- REFRESH POLITIK
  
  (Beta) Du kan också ange en uppdateringsprincip för den materialiserade vyn.
  
  Se REFRESH POLICY-satsen (pipelines).
- MED ROW FILTER
  
  Lägger till en radfilterfunktion i tabellen. Framtida frågor för tabellen tar emot en delmängd av de rader som funktionen utvärderas till TRUE för. Detta är användbart för detaljerad åtkomstkontroll eftersom den gör att funktionen kan kontrollera identitets- och gruppmedlemskapen för den anropande användaren för att avgöra om vissa rader ska filtreras.
  
  Se ROW FILTER-satsen.
fråga

En fråga som definierar datauppsättningen för tabellen.

Behörigheter som krävs

Kör som-användaren för en pipeline måste ha följande behörigheter:

SELECT behörighet över de bastabeller som refereras till av den materialiserade vyn.
USE CATALOG behörighet i den överordnade katalogen och USE SCHEMA behörighet i det överordnade schemat.
CREATE TABLE och CREATE MATERIALIZED VIEW behörigheter för schemat som innehåller den materialiserade vyn.

För att en användare ska kunna uppdatera pipelinen, krävs det att den materialiserade vyn definieras inom vilken:

USE CATALOG behörighet i den överordnade katalogen och USE SCHEMA behörighet i det överordnade schemat.
Ägarskap för den materialiserade vyn eller REFRESH behörigheten i den materialiserade vyn.
Ägaren av den materialiserade vyn måste ha behörigheten SELECT över bastabellerna som refereras till av den materialiserade vyn.

För att en användare ska kunna fråga den resulterande materialiserade vyn behöver de:

USE CATALOG behörighet i den överordnade katalogen och USE SCHEMA behörighet i det överordnade schemat.
SELECT behörighet över den materialiserade vyn.

Begränsningar

När en materialiserad vy med en sum aggregering över en NULL-kapabel kolumn har det sista icke-NULL-värdet borttaget från den kolumnen – och därmed endast NULL värden finns kvar i den kolumnen – returnerar den materialiserade vyns resulterande aggregeringsvärde noll i stället för NULL.
Kolumnreferens kräver inget alias. Referensuttryck som inte är kolumner kräver ett alias, som i följande exempel:
- Tillåten: SELECT col1, SUM(col2) AS sum_col2 FROM t GROUP BY col1
- Tillåts inte: SELECT col1, SUM(col2) FROM t GROUP BY col1
NOT NULL måste anges manuellt tillsammans med PRIMARY KEY för att vara en giltig instruktion.
Materialiserade vyer stöder inte identitetskolumner eller surrogatnycklar.
Materialiserade vyer stöder inte kommandon för OPTIMIZE och VACUUM. Underhåll sker automatiskt.
Det går inte att byta namn på tabellen eller ändra ägaren.
Genererade kolumner, identitetskolumner och standardkolumner stöds inte.

Examples

-- Create a materialized view by reading from an external data source, using the default schema:
CREATE OR REFRESH MATERIALIZED VIEW taxi_raw
AS SELECT * FROM read_files("/databricks-datasets/nyctaxi/sample/json/")

-- Create a materialized view by reading from a dataset defined in a pipeline:
CREATE OR REFRESH MATERIALIZED VIEW filtered_data
AS SELECT
  ...
FROM taxi_raw

-- Specify a schema and clustering columns for a table:
CREATE OR REFRESH MATERIALIZED VIEW sales
(customer_id STRING,
  customer_name STRING,
  number_of_line_items STRING,
  order_datetime STRING,
  order_number LONG,
  order_day_of_week STRING GENERATED ALWAYS AS (dayofweek(order_datetime))
) CLUSTER BY (order_day_of_week, customer_id)
COMMENT "Raw data on sales"
AS SELECT * FROM ...

-- Use automatic liquid clustering to let Databricks choose the clustering columns:
CREATE OR REFRESH MATERIALIZED VIEW sample_trips
CLUSTER BY AUTO
AS SELECT pickup_zip, fare_amount FROM samples.nyctaxi.trips

-- Specify partition columns for a table:
CREATE OR REFRESH MATERIALIZED VIEW sales
(customer_id STRING,
  customer_name STRING,
  number_of_line_items STRING,
  order_datetime STRING,
  order_number LONG,
  order_day_of_week STRING GENERATED ALWAYS AS (dayofweek(order_datetime))
) PARTITIONED BY (order_day_of_week)
COMMENT "Raw data on sales"
AS SELECT * FROM ...

-- Specify a primary and foreign key constraint for a table:
CREATE OR REFRESH MATERIALIZED VIEW sales
(customer_id STRING NOT NULL PRIMARY KEY,
  customer_name STRING,
  number_of_line_items STRING,
  order_datetime STRING,
  order_number LONG,
  order_day_of_week STRING GENERATED ALWAYS AS (dayofweek(order_datetime)),
  CONSTRAINT fk_customer_id FOREIGN KEY (customer_id) REFERENCES main.default.customers(customer_id)
)
COMMENT "Raw data on sales"
AS SELECT * FROM ...

-- Specify a row filter and mask clause for a table:
CREATE OR REFRESH MATERIALIZED VIEW sales (
  customer_id STRING MASK catalog.schema.customer_id_mask_fn,
  customer_name STRING,
  number_of_line_items STRING COMMENT 'Number of items in the order',
  order_datetime STRING,
  order_number LONG,
  order_day_of_week STRING GENERATED ALWAYS AS (dayofweek(order_datetime))
)
COMMENT "Raw data on sales"
WITH ROW FILTER catalog.schema.order_number_filter_fn ON (order_number)
AS SELECT * FROM sales_bronze

Feedback

Var den här sidan till hjälp?

Last updated on 2026-07-10