CREATE MATERIALIZED VIEW (パイプライン)

マテリアライズドビューは、事前計算済みの結果をクエリに使用できるビューであり、入力の変更を反映するように更新できます。マテリアライズドビューはパイプラインによってサポートされます。マテリアライズドビューが更新されるたびに、クエリ結果が再計算されてアップストリームのデータセットでの変更が反映されます。マテリアライズドビューは、手動またはスケジュールに従って更新できます。

更新を実行またはスケジュールする方法の詳細については、「パイプライン更新の実行」を参照してください。

構文

CREATE [OR REFRESH] [PRIVATE] MATERIALIZED VIEW
  view_name
  [ column_list ]
  [ view_clauses ]
  AS query

column_list
   ( { column_name column_type column_properties } [, ...]
    [ CONSTRAINT expectation_name EXPECT (expectation_expr)
      [ ON VIOLATION { FAIL UPDATE | DROP ROW } ] ] [, ...]
    [ , table_constraint ] [...] )

   column_properties
      { NOT NULL | COMMENT column_comment | column_constraint | MASK clause } [ ... ]

view_clauses
  { USING { DELTA | ICEBERG } |
    PARTITIONED BY (col [, ...]) |
    CLUSTER BY clause |
    LOCATION path |
    COMMENT view_comment |
    TBLPROPERTIES clause |
    REFRESH POLICY refresh_clause |
    WITH { ROW FILTER clause } } [...]

パラメーター

REFRESH

指定した場合は、ビューを作成するか、既存のビューとそのコンテンツを更新します。
プライベート

プライベートのマテリアライズドビューを作成します。プライベートのマテリアライズドビューは、パイプライン内の中間テーブルとして使用でき、これをカタログに発行したくない場合に便利です。
- これらはカタログに追加されず、定義したパイプライン内でのみアクセスできます。
- カタログ内の既存のオブジェクトと同じ名前を持つことができます。パイプライン内で、プライベートマテリアライズドビューとカタログ内のオブジェクトの名前が同じである場合、その名前への参照はプライベートマテリアライズドビューに解決されます。
- プライベートのマテリアライズドビューは、1 回の更新中だけではなく、そのパイプラインの有効期間全体にわたって存続します。
プライベートのマテリアライズドビューの作成には、以前は TEMPORARY パラメーターが使用されていました。
view_name

新しく作成されたビューの名前。完全修飾のビュー名は一意にする必要があります。

プライベートのマテリアライズドビューは、カタログ内で発行されるオブジェクトと同じ名前を持つことができます。
column_list

必要に応じて、ビューのクエリ結果内の列にラベルを付けます。列の一覧を指定する場合は、列の別名の数がクエリ内の式の数と一致している必要があります。列リストが指定されていない場合、別名はビューの本体から派生します。
- column_name
  
  列名は一意である必要があり、かつクエリの出力列にマップされている必要があります。
- 列タイプ
  
  列のデータ型を指定します。 Azure Databricks でサポートされているすべてのデータ型が、すべてのマテリアライズドビューでサポートされているわけではありません。
- column_comment
  
  列を記述する任意のSTRING リテラル。このオプションは、column_type と共に指定する必要があります。列の種類が指定されていない場合、列コメントはスキップされます。
- column_constraint
  
  情報主キーまたは情報外部キーの制約を、マテリアライズドビューの列に追加します。
- MASK 句
  
  列マスク関数を追加して、機密データを匿名化します。「行フィルターと列マスク」を参照してください。
- CONSTRAINT expectation_name EXPECT (expectation_expr) [ 違反時 { FAIL UPDATE | ROWを削除 } ]
  
  具体化されたビューにデータ品質の期待値を追加します。これらのデータ品質の期待値は、時間の経過と同時に追跡し、具体化されたビューのイベントログを通じてアクセスできます。 FAIL UPDATE期待値により、具体化されたビューの作成と更新の両方で処理が失敗します。 DROP ROW 期待値が満たされない場合、行全体が削除されます。パイプラインの期待を使用してデータ品質を管理する方法については、を参照してください。
  
  expectation_expr は、リテラル、具体化されたビュー内の列識別子、および決定論的な組み込みの SQL 関数または演算子で構成できます。ただし、次の点を除きます。
  - 集計関数
    - 分析ウィンドウ関数
    - 順位付けウィンドウ関数
    - テーブル値ジェネレーター関数
  また expr には、サブクエリを含めることはできません。
  
  定義に期待値が含まれる具体化されたビューは、更新ごとに完全に更新され、増分更新はサポートされません。増分更新を使用するには、期待値を削除するか、具体化されたビュー定義の外部に適用します。
テーブル制約

スキーマを指定するときに、主キーと外部キーを定義できます。制約は情報提供のみを目的としており、強制されるものではありません。 SQL 言語リファレンスの CONSTRAINT 句を参照してください。

注

テーブル制約を定義するには、パイプラインが Unity Catalog 対応のパイプラインである必要があります。
view_clauses

必要に応じて、マテリアライズドビューのパーティション分割、コメント、ユーザー定義プロパティを指定します。各サブ句は、1 回だけ指定できます。
- DELTA の使用
  
  データ形式を指定します。既定値は DELTA です。
  
  この句は省略可能です。
- ICEBERG の使用
  
  外部 Iceberg リーダーと互換性のある具体化されたビューを作成します。具体化されたビューを作成したら、 REPAIR TABLE <mv_name> SYNC METADATA実行します。具体化されたビューは、外部 Iceberg リーダーの読み取り専用です。「外部 Iceberg リーダーと互換性のある具体化されたビューを作成する」を参照してください。
  
  Important
  
  管理された Iceberg 具体化されたビューはパブリックプレビュー段階です。この機能を有効にするには、Databricks アカウントチームにお問い合わせください。
- でパーティション分割
  
  テーブル内のパーティション分割に使用する 1 つ以上の列のリスト (省略可能)。 CLUSTER BY と相互に排他的です。
  
  液体クラスタリングは、クラスタリング用の柔軟で最適化されたソリューションを提供します。パイプラインにCLUSTER BYするのではなく、PARTITIONED BYを使用することを検討してください。
- CLUSTER BY
  
  リキッドクラスタリングをテーブルに対して有効化し、クラスタリングキーとして使用する列を定義します。 CLUSTER BY AUTOで自動液体クラスタリングを使用し、Databricks はクエリのパフォーマンスを最適化するためにクラスタリングキーをインテリジェントに選択します。 PARTITIONED BY と相互に排他的です。
  
  表に液体クラスタリングを使用するを参照してください。
- 場所
  
  テーブルデータの保存場所 (省略可能)。設定されていない場合、システムは既定でパイプラインストレージの場所に設定されます。
  
  このオプションは、Hive メタストアに発行する場合にのみ使用できます。 Unity カタログでは、場所は自動的に管理されます。
- コメント
  
  テーブルの説明 (省略可能)。
- TBLPROPERTIES
  
  テーブルのテーブルプロパティのリスト (省略可能)。
- REFRESH ポリシー
  
  (ベータ)必要に応じて、マテリアライズドビューの更新ポリシーを設定します。
  
  POLICY 句 (パイプライン) REFRESH参照してください。
- で ROW FILTER
  
  行フィルター関数をテーブルに追加します。それ以降のそのテーブルに対するクエリでは、行のうち、この関数による評価の結果が TRUE であるものだけが返されます。これは、細粒度のアクセス制御に役立ちます。呼び出し元ユーザーの ID とグループメンバーシップをその関数で検査した結果として、特定の行をフィルター処理するかどうかを決定できるからです。
  
  ROW FILTER の条項を参照してください。
クエリ

テーブルのデータセットを定義するクエリ。

必要なアクセス許可

パイプラインの実行時のユーザーには、次のアクセス許可が必要です。

マテリアライズドビューによって参照されるベーステーブルに対する SELECT 特権。
親カタログに対する USE CATALOG 特権と、親スキーマに対する USE SCHEMA 特権。
マテリアライズドビューを含むスキーマに対する CREATE TABLE および CREATE MATERIALIZED VIEW 権限。

パイプラインの中でマテリアライズドビューが定義されている場合に、そのパイプラインを更新するユーザーには、次のものが必要です。

親カタログに対する USE CATALOG 特権と、親スキーマに対する USE SCHEMA 特権。
マテリアライズドビューの所有権、またはマテリアライズドビューに対する REFRESH 特権。
マテリアライズドビューの所有者は、マテリアライズドビューで参照されるベーステーブルに対する SELECT 特権が付与されている必要があります。

結果として得られたマテリアライズドビューに対してクエリを実行するユーザーには、次のものが必要です。

親カタログに対する USE CATALOG 特権と、親スキーマに対する USE SCHEMA 特権。
マテリアライズドビューに対する SELECT 特権。

制限事項

NULL 許容列に対する sum 集計を含むマテリアライズドビューで、最後の NULL 非許容値がその列から削除され、その列に残っているのが NULL 値のみである場合、マテリアライズドビューの結果の集計値は、NULL ではなくゼロを返します。
列参照に別名は必要ありません。次の例のように、非列参照式には別名が必要です。
- 許可: SELECT col1, SUM(col2) AS sum_col2 FROM t GROUP BY col1
- 許可されない: SELECT col1, SUM(col2) FROM t GROUP BY col1
有効なステートメントにするには、NOT NULL を PRIMARY KEY と共に手動で指定する必要があります。
マテリアライズドビューでは、ID 列や代理キーはサポートされていません。
マテリアライズドビューでは、OPTIMIZE および VACUUM コマンドはサポートされていません。メンテナンスは自動的に行われます。
テーブルの名前変更や所有者の変更はサポートされていません。
生成された列、ID 列、既定の列はサポートされていません。

例示

-- Create a materialized view by reading from an external data source, using the default schema:
CREATE OR REFRESH MATERIALIZED VIEW taxi_raw
AS SELECT * FROM read_files("/databricks-datasets/nyctaxi/sample/json/")

-- Create a materialized view by reading from a dataset defined in a pipeline:
CREATE OR REFRESH MATERIALIZED VIEW filtered_data
AS SELECT
  ...
FROM taxi_raw

-- Specify a schema and clustering columns for a table:
CREATE OR REFRESH MATERIALIZED VIEW sales
(customer_id STRING,
  customer_name STRING,
  number_of_line_items STRING,
  order_datetime STRING,
  order_number LONG,
  order_day_of_week STRING GENERATED ALWAYS AS (dayofweek(order_datetime))
) CLUSTER BY (order_day_of_week, customer_id)
COMMENT "Raw data on sales"
AS SELECT * FROM ...

-- Use automatic liquid clustering to let Databricks choose the clustering columns:
CREATE OR REFRESH MATERIALIZED VIEW sample_trips
CLUSTER BY AUTO
AS SELECT pickup_zip, fare_amount FROM samples.nyctaxi.trips

-- Specify partition columns for a table:
CREATE OR REFRESH MATERIALIZED VIEW sales
(customer_id STRING,
  customer_name STRING,
  number_of_line_items STRING,
  order_datetime STRING,
  order_number LONG,
  order_day_of_week STRING GENERATED ALWAYS AS (dayofweek(order_datetime))
) PARTITIONED BY (order_day_of_week)
COMMENT "Raw data on sales"
AS SELECT * FROM ...

-- Specify a primary and foreign key constraint for a table:
CREATE OR REFRESH MATERIALIZED VIEW sales
(customer_id STRING NOT NULL PRIMARY KEY,
  customer_name STRING,
  number_of_line_items STRING,
  order_datetime STRING,
  order_number LONG,
  order_day_of_week STRING GENERATED ALWAYS AS (dayofweek(order_datetime)),
  CONSTRAINT fk_customer_id FOREIGN KEY (customer_id) REFERENCES main.default.customers(customer_id)
)
COMMENT "Raw data on sales"
AS SELECT * FROM ...

-- Specify a row filter and mask clause for a table:
CREATE OR REFRESH MATERIALIZED VIEW sales (
  customer_id STRING MASK catalog.schema.customer_id_mask_fn,
  customer_name STRING,
  number_of_line_items STRING COMMENT 'Number of items in the order',
  order_datetime STRING,
  order_number LONG,
  order_day_of_week STRING GENERATED ALWAYS AS (dayofweek(order_datetime))
)
COMMENT "Raw data on sales"
WITH ROW FILTER catalog.schema.order_number_filter_fn ON (order_number)
AS SELECT * FROM sales_bronze

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-07-10