SELECT

發行項
03/01/2024

適用於： check marked yes Databricks SQL Databricks Runtime

從一或多個數據表參考撰寫結果集。子 SELECT 句可以是查詢的一部分，其中也包含通用數據表表達式（CTE）、集合作業和各種其他子句。

語法

SELECT [ hints ] [ ALL | DISTINCT ] { named_expression | star_clause } [, ...]
  FROM table_reference [, ...]
  [ LATERAL VIEW clause ]
  [ WHERE clause ]
  [ GROUP BY clause ]
  [ HAVING clause]
  [ QUALIFY clause ]

named_expression
   expression [ column_alias ]

star_clause
   [ { table_name | view_name } . ] * [ except_clause ]

except_clause
   EXCEPT ( { column_name | field_name } [, ...] )

參數

提示

提示可協助 Azure Databricks 優化器做出更佳的規劃決策。 Azure Databricks 支援影響選取聯結策略和重新分割數據的提示。
ALL

從數據表參考中選取所有相符的數據列。預設為啟用。
DISTINCT

在移除結果中的重複項目之後，從數據表參考中選取所有相符的數據列。
named_expression

具有選擇性指派名稱的表達式。
- expression
  
  評估為值的一或多個值、運算元和 SQL 函式的組合。
- column_alias
  
  為表達式結果命名的選擇性數據行標識碼。 column_alias如果沒有，則 Databricks SQL 會衍生一個。
star_clause

用來命名子句中 FROM 所有可參考數據行的速記，或子句中 FROM 特定數據表參考的數據行或欄位。
table_reference

的輸入 SELECT來源。這個輸入參考可以在參考之前使用 STREAM 關鍵詞，轉換成串流參考。
橫向檢視

與之類的 EXPLODE產生器函式搭配使用，其會產生包含一或多個數據列的虛擬數據表。 LATERAL VIEW 會將數據列套用至每個原始輸出數據列。

在 Databricks SQL 中，從 Databricks Runtime 12.2 開始，這個子句已被取代。您應該叫用數據表值產生器函式做為 table_reference。
WHERE

根據提供的述詞篩選子句的結果 FROM 。
GROUP BY

用來分組數據列的表達式。這會與聚合函數（MIN、、 SUMMAXCOUNT、 AVG）搭配使用，根據每個群組中的群組表達式和匯總值來分組數據列。 FILTER當子句附加至聚合函數時，只會將相符的數據列傳遞至該函式。
HAVING

篩選所產生之數據列的 GROUP BY 述詞。子 HAVING 句是用來在群組執行之後篩選數據列。如果您指定 HAVING 不含 GROUP BY，則表示 GROUP BY 沒有群組表達式的（全域匯總）。
資格

用來篩選視窗函式結果的述詞。若要使用 QUALIFY，至少需要有一個視窗函式出現在 SELECT 清單或 QUALIFY 子句中。

在 Delta 數據表上選取

除了標準 SELECT 選項之外，Delta 數據表還支援本節中所述的時間移動選項。如需詳細資訊，請參閱使用 Delta Lake 數據表歷程記錄。

`AS OF` 語法

table_identifier TIMESTAMP AS OF timestamp_expression

table_identifier VERSION AS OF version

timestamp_expression 可以是下列任一項：
- '2018-10-18T22:15:12.013Z'，也就是可以轉換成時間戳的字串
- cast('2018-10-18 13:36:32 CEST' as timestamp)
- '2018-10-18'，也就是日期字串
- current_timestamp() - interval 12 hours
- date_sub(current_date(), 1)
- 任何其他可轉換成時間戳的表達式
version 是一個長值，可從的 DESCRIBE HISTORY table_spec輸出取得。

兩version者timestamp_expression都不能是子查詢。

範例

> SELECT * FROM events TIMESTAMP AS OF '2018-10-18T22:15:12.013Z'

> SELECT * FROM delta.`/mnt/delta/events` VERSION AS OF 123

`@` 語法

@使用語法來指定時間戳或版本。時間戳的格式必須為 yyyyMMddHHmmssSSS 。您可以在之後 @ 指定版本，方法是在版本前面加上 v 。例如，若要查詢資料表events的版本123，請指定 events@v123。

範例

> SELECT * FROM events@20190101000000000

> SELECT * FROM events@v123

範例

-- select all referencable columns from all tables
> SELECT * FROM VALUES(1, 2) AS t1(c1, c2), VALUES(3, 4) AS t2(c3, c4);
  1   2   3   4

-- select all referencable columns from one table
> SELECT t2.* FROM VALUES(1, 2) AS t1(c1, c2), VALUES(3, 4) AS t2(c3, c4);
  3   4

-- select all referencable columns from all tables except t2.c4
> SELECT * EXCEPT(c4) FROM VALUES(1, 2) AS t1(c1, c2), VALUES(3, 4) AS t2(c3, c4);
  1   2   3

-- select all referencable columns from a table, except a nested field.
> SELECT * EXCEPT(c2.b) FROM VALUES(1, named_struct('a', 2, 'b', 3)) AS t(c1, c2);
  1  { "a" : 2 }

-- Removing all fields results in an empty struct
> SELECT * EXCEPT(c2.b, c2.a) FROM VALUES(1, named_struct('a', 2, 'b', 3)) AS t(c1, c2);
  1  { }

-- Overlapping names result in an error
> SELECT * EXCEPT(c2, c2.a) FROM VALUES(1, named_struct('a', 2, 'b', 3)) AS t(c1, c2);
  Error: EXCEPT_OVERLAPPING_COLUMNS

SELECT

語法

參數

在 Delta 數據表上選取

AS OF 語法

範例

@ 語法

範例

範例

相關文章

其他資源

`AS OF` 語法

`@` 語法