適用於 Python 的 Databricks SQL 連接器

2025-06-09

適用於 Python 的 Databricks SQL 連接器是一個 Python 連結庫，可讓您使用 Python 程式代碼在 Azure Databricks 全用途計算和 Databricks SQL 倉儲上執行 SQL 命令。適用於 Python 的 Databricks SQL Connector 比 pyodbc 之類的類似 Python 連結庫更容易設定及使用。此連結庫遵循 PEP 249 – Python 資料庫 API 規格 v2.0。

這很重要

Databricks SQL Connector for Python 3.0.0 版和更新版本支援原生參數化查詢執行，這可防止 SQL 插入並改善查詢效能。舊版使用內嵌參數化執行，這在 SQL 插入中不安全，而且有其他缺點。如需詳細資訊，請參閱使用原生參數。

Databricks SQL Connector for Python 也支援 Azure Databricks 的 SQLAlchemy 方言，但必須安裝才能使用這些功能。請參閱使用 SQLAlchemy 搭配 Azure Databricks。

需求

執行 Python >=3.8 和 <=3.11 的開發機器。
Databricks 建議您使用 Python 虛擬環境，例如 Python 隨附的 venv 所提供的環境。虛擬環境可協助您確保同時使用正確的 Python 版本和適用於 Python 的 Databricks SQL 連接器。設定和使用虛擬環境不屬於本文的討論範圍。如需詳細資訊，請參閱建立虛擬環境。
現有的所有用途計算或 SQL 倉儲。

開始使用

安裝適用於 Python 的 Databricks SQL 連接器。 PyArrow 是適用於 Python 的 Databricks SQL Connector 選擇性相依性，預設不會在連接器 4.0.0 版和更新版本中安裝。如果未安裝 PyArrow，CloudFetch 和其他 Apache Arrow 功能等功能無法使用，可能會影響大量數據的效能。
- 若要安裝精簡連接器，請使用 pip install databricks-sql-connector。
- 若要安裝完整的連接器，包括 PyArrow 請使用 pip install databricks-sql-connector[pyarrow]。
針對您想要使用的所有用途計算或 SQL 倉儲，收集下列資訊：

多功能計算
- 所有用途計算的伺服器主機名。您可以從 [>] 索引標籤中的 [伺服器主機名] 值取得此值，以進行所有用途的計算。
- 所有用途計算的 HTTP 路徑。您可以從 [>] 索引卷標中的 [HTTP 路徑] 值取得此值，以進行所有用途的計算。
SQL 資料倉儲
- SQL 倉儲的伺服器主機名稱。您可以從 SQL 倉儲的 [連線詳細資料] 索引標籤中的 [伺服器主機名稱] 值取得此值。
- SQL 倉儲的 HTTP 路徑。您可以從 SQL 倉儲的 [連線詳細資料] 索引標籤中的 [HTTP 路徑] 值取得此值。

驗證

適用於 Python 的 Databricks SQL 連接器支援下列 Azure Databricks 驗證類型：

Databricks 個人存取令牌驗證
Microsoft Entra ID 令牌驗證
OAuth 機器對機器（M2M）驗證
OAuth 使用者對機器（U2M）驗證

適用於 Python 的 Databricks SQL 連接器尚不支援下列 Azure Databricks 驗證類型：

Databricks 個人存取權憑證驗證

若要搭配 Azure Databricks 個人存取令牌驗證使用適用於 Python 的 Databricks SQL 連接器，您必須先建立 Azure Databricks 個人存取令牌。若要這樣做，請遵循適用於工作區使用者的 Azure Databricks 個人存取令牌中的步驟。

若要驗證適用於 Python 的 Databricks SQL 連接器，請使用下列程式碼片段。此片段假設您已設定下列環境變數：

DATABRICKS_SERVER_HOSTNAME設定為所有用途計算或 SQL 倉儲的伺服器 主機名 值。
DATABRICKS_HTTP_PATH，設定為用於所有用途計算或 SQL 倉儲的 HTTP 路徑 值。
DATABRICKS_TOKEN，將其設定為 Azure Databricks 個人存取權杖。

若要設定環境變數，請參閱作業系統的文件。

from databricks import sql
import os

with sql.connect(server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                 http_path       = os.getenv("DATABRICKS_HTTP_PATH"),
                 access_token    = os.getenv("DATABRICKS_TOKEN")) as connection:
# ...

OAuth 機器對機器 (M2M) 驗證

適用於 Python 2.7.0 版和更新版本的 Databricks SQL Connector 支援 OAuth 機器對機器（M2M）驗證。您也必須安裝適用於 Python 的 Databricks SDK 0.18.0 或更新版本 (例如透過執行 pip install databricks-sdk 或 python -m pip install databricks-sdk)。

若要搭配 OAuth M2M 驗證使用適用於 Python 的 Databricks SQL 連接器，您必須執行下列動作：

在 Azure Databricks 工作區中建立 Azure Databricks 服務主體，並為該服務主體建立 OAuth 祕密。

若要建立服務主體及其 OAuth 秘密，請參閱使用 OAuth 授權 Azure Databricks 資源的自動存取權。記下服務主體的 UUID 或 應用程式識別碼 值，以及服務主體的 OAuth 秘密值。
為服務主體提供您所有用途計算或倉儲的存取權。

若要授與服務主體存取您所有用途的計算或倉儲，請參閱計算許可權或管理 SQL 倉儲。

若要驗證適用於 Python 的 Databricks SQL 連接器，請使用下列程式碼片段。此片段假設您已設定下列環境變數：

DATABRICKS_SERVER_HOSTNAME 設為通用計算或 SQL 倉儲的 伺服器主機名 值。
DATABRICKS_HTTP_PATH，設定為用於所有用途計算或 SQL 倉儲的 HTTP 路徑 值。
DATABRICKS_CLIENT_ID，設定為服務主體的 UUID 或 應用程式識別碼 值。
DATABRICKS_CLIENT_SECRET，設定服務主體的 OAuth 憑證為 Secret 值。

若要設定環境變數，請參閱作業系統的文件。

from databricks.sdk.core import Config, oauth_service_principal
from databricks import sql
import os

server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME")

def credential_provider():
  config = Config(
    host          = f"https://{server_hostname}",
    client_id     = os.getenv("DATABRICKS_CLIENT_ID"),
    client_secret = os.getenv("DATABRICKS_CLIENT_SECRET"))
  return oauth_service_principal(config)

with sql.connect(server_hostname      = server_hostname,
                 http_path            = os.getenv("DATABRICKS_HTTP_PATH"),
                 credentials_provider = credential_provider) as connection:
# ...

Microsoft Entra ID 令牌驗證

若要使用適用於 Python 的 Databricks SQL 連接器搭配 Microsoft Entra ID 權杖驗證，您必須提供適用於 Python 的 Databricks SQL 連接器和 Microsoft Entra ID 權杖。若要建立 Microsoft Entra ID 存取權杖，請按照下列步驟操作：

針對 Azure Databricks 使用者，您可以使用 Azure CLI。請參閱使用 Azure CLI 為使用者取得 Microsoft Entra ID 令牌。
如需Microsoft Entra ID 服務主體，請參閱使用 Azure CLI 取得Microsoft Entra ID 存取令牌。若要建立Microsoft Entra ID 受控服務主體，請參閱服務主體。

Microsoft Entra ID 憑證的預設有效期限約為 1 小時。若要建立新的 Microsoft Entra ID 權杖，請重複此程序。

若要驗證適用於 Python 的 Databricks SQL 連接器，請使用下列程式碼片段。此片段假設您已設定下列環境變數：

針對所有用途的計算或 SQL 倉儲，設定 DATABRICKS_SERVER_HOSTNAME 為 [伺服器主機名 ] 值。
針對所有用途的計算或 SQL 倉儲，設定 DATABRICKS_HTTP_PATH 為 [HTTP 路徑 ] 值。
將 DATABRICKS_TOKEN 設定為 Microsoft Entra ID 權杖。

若要設定環境變數，請參閱作業系統的文件。

from databricks import sql
import os

with sql.connect(server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                 http_path       = os.getenv("DATABRICKS_HTTP_PATH"),
                 access_token    = os.getenv("DATABRICKS_TOKEN")) as connection:
# ...

OAuth 使用者對機器 (U2M) 認證

適用於 Python 2.7.0 版和更新版本的 Databricks SQL Connector 支援 OAuth 使用者對計算機（U2M）驗證。您也必須安裝適用於 Python 的 Databricks SDK 0.19.0 或更新版本 (例如透過執行 pip install databricks-sdk 或 python -m pip install databricks-sdk)。

若要使用 OAuth U2M 驗證來驗證適用於 Python 的 Databricks SQL 連接器，請使用下列程式碼片段。 OAuth U2M 驗證透過即時的人類登入及授權來驗證目標 Azure Databricks 使用者帳戶。此片段假設您已設定下列環境變數：

針對所有用途的計算或 SQL 倉儲，設定 DATABRICKS_SERVER_HOSTNAME 為 [伺服器主機名 ] 值。
針對所有用途的計算或 SQL 倉儲，設定 DATABRICKS_HTTP_PATH 為 [HTTP 路徑 ] 值。

若要設定環境變數，請參閱作業系統的文件。

from databricks import sql
import os

with sql.connect(server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                 http_path       = os.getenv("DATABRICKS_HTTP_PATH"),
                 auth_type       = "databricks-oauth") as connection:
# ...

範例

下列程式碼範例示範如何使用適用於 Python 的 Databricks SQL 連接器來查詢和插入資料、查詢中繼資料、管理資料指標和連線，以及設定記錄。

注意

下列程式碼範例示範如何使用 Azure Databricks 個人存取權杖進行驗證。若要改用其他可用的 Azure Databricks 驗證類型，請參閱驗證。

這些程式碼範例會從下列環境變數擷取其 server_hostname、http_path 和 access_token 連線變數值：

DATABRICKS_SERVER_HOSTNAME，代表來自需求的 [伺服器主機名稱] 值。
DATABRICKS_HTTP_PATH，代表來自需求的 [HTTP 路徑] 值。
DATABRICKS_TOKEN，代表在需求中的存取憑證。

您可使用其他方法來擷取這些連線變數值。使用環境變數只是眾多方法之一。

設定 User-Agent
查詢數據
插入數據
查詢元數據
管理資料游標和連線
管理 Unity 目錄磁碟區中的檔案
設定記錄

設定 User-Agent

下列程式代碼範例示範如何設定 User-Agent 應用程式 product_name 以進行使用追蹤。

from databricks import sql
import os

with sql.connect(server_hostname   = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                 http_path         = os.getenv("DATABRICKS_HTTP_PATH"),
                 access_token      = os.getenv("DATABRICKS_TOKEN"),
                 user_agent_entry = "product_name") as connection:
  with connection.cursor() as cursor:
    cursor.execute("SELECT 1 + 1")
    result = cursor.fetchall()

    for row in result:
      print(row)

查詢資料

下列程式代碼範例示範如何呼叫適用於 Python 的 Databricks SQL 連接器，以在所有用途計算或 SQL 倉儲上執行基本 SQL 命令。此命令會從trips目錄的samples架構中傳回nyctaxi數據表的前兩列。

from databricks import sql
import os

with sql.connect(server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                 http_path       = os.getenv("DATABRICKS_HTTP_PATH"),
                 access_token    = os.getenv("DATABRICKS_TOKEN")) as connection:

  with connection.cursor() as cursor:
    cursor.execute("SELECT * FROM samples.nyctaxi.trips LIMIT 2")
    result = cursor.fetchall()

    for row in result:
      print(row)

插入資料

下列範例示範如何插入少量的資料 (數千個資料列)：

from databricks import sql
import os

with sql.connect(server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                 http_path       = os.getenv("DATABRICKS_HTTP_PATH"),
                 access_token    = os.getenv("DATABRICKS_TOKEN")) as connection:

  with connection.cursor() as cursor:
    cursor.execute("CREATE TABLE IF NOT EXISTS squares (x int, x_squared int)")

    squares = [(i, i * i) for i in range(100)]
    values = ",".join([f"({x}, {y})" for (x, y) in squares])

    cursor.execute(f"INSERT INTO squares VALUES {values}")

    cursor.execute("SELECT * FROM squares LIMIT 10")

    result = cursor.fetchall()

    for row in result:
      print(row)

針對大量數據，您應該先將數據上傳至雲端記憶體，然後執行 COPY INTO 命令。

查詢中繼資料

有專門的方法可用來擷取中繼資料。下列範例會提取範例資料表中的欄位相關資訊：

from databricks import sql
import os

with sql.connect(server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                 http_path       = os.getenv("DATABRICKS_HTTP_PATH"),
                 access_token    = os.getenv("DATABRICKS_TOKEN")) as connection:

  with connection.cursor() as cursor:
    cursor.columns(schema_name="default", table_name="squares")
    print(cursor.fetchall())

管理游標和連線

最佳做法是關閉不再使用的任何連線和游標。這會釋放 Azure Databricks 所有用途計算和 Databricks SQL 倉儲上的資源。

您可以使用內容管理員 (先前範例中的 with 語法) 來管理資源，或明確呼叫 close：

from databricks import sql
import os

connection = sql.connect(server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                         http_path       = os.getenv("DATABRICKS_HTTP_PATH"),
                         access_token    = os.getenv("DATABRICKS_TOKEN"))

cursor = connection.cursor()

cursor.execute("SELECT * from range(10)")
print(cursor.fetchall())

cursor.close()
connection.close()

管理 Unity 目錄磁碟區中的檔案

Databricks SQL 連接器可讓您將本機檔案寫入 Unity 目錄磁碟區、從磁碟區下載檔，以及從磁碟區刪除檔案，如下列範例所示：

from databricks import sql
import os

# For writing local files to volumes and downloading files from volumes,
# you must set the staging_allows_local_path argument to the path to the
# local folder that contains the files to be written or downloaded.
# For deleting files in volumes, you must also specify the
# staging_allows_local_path argument, but its value is ignored,
# so in that case its value can be set for example to an empty string.
with sql.connect(server_hostname            = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                 http_path                  = os.getenv("DATABRICKS_HTTP_PATH"),
                 access_token               = os.getenv("DATABRICKS_TOKEN"),
                 staging_allowed_local_path = "/tmp/") as connection:

  with connection.cursor() as cursor:

    # Write a local file to the specified path in a volume.
    # Specify OVERWRITE to overwrite any existing file in that path.
    cursor.execute(
      "PUT '/temp/my-data.csv' INTO '/Volumes/main/default/my-volume/my-data.csv' OVERWRITE"
    )

    # Download a file from the specified path in a volume.
    cursor.execute(
      "GET '/Volumes/main/default/my-volume/my-data.csv' TO '/tmp/my-downloaded-data.csv'"
    )

    # Delete a file from the specified path in a volume.
    cursor.execute(
      "REMOVE '/Volumes/main/default/my-volume/my-data.csv'"
    )

設定記錄

Databricks SQL 連接器會使用 Python 的標準記錄模組。您可以設定類似下列內容的記錄層級：

from databricks import sql
import os, logging

logging.getLogger("databricks.sql").setLevel(logging.DEBUG)
logging.basicConfig(filename = "results.log",
                    level    = logging.DEBUG)

connection = sql.connect(server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
                         http_path       = os.getenv("DATABRICKS_HTTP_PATH"),
                         access_token    = os.getenv("DATABRICKS_TOKEN"))

cursor = connection.cursor()

cursor.execute("SELECT * from range(10)")

result = cursor.fetchall()

for row in result:
   logging.debug(row)

cursor.close()
connection.close()

測試

若要測試程序代碼，請使用 Python 測試架構，例如 pytest。若要在模擬條件下測試程序代碼，而不呼叫 Azure Databricks REST API 端點，或變更 Azure Databricks 帳戶或工作區的狀態，您可以使用 Python 模擬連結庫，例如 unittest.mock。

例如，假設下列名為 helpers.py 的檔案，其中包含使用 get_connection_personal_access_token Azure Databricks 個人存取令牌傳回 Azure Databricks 工作區連線的函式，以及 select_nyctaxi_trips 使用連線從 trips 目錄架構中 samples 數據表取得指定數據列數目的 nyctaxi 函式：

# helpers.py

from databricks import sql
from databricks.sql.client import Connection, List, Row, Cursor

def get_connection_personal_access_token(
  server_hostname: str,
  http_path: str,
  access_token: str
) -> Connection:
  return sql.connect(
    server_hostname = server_hostname,
    http_path = http_path,
    access_token = access_token
  )

def select_nyctaxi_trips(
  connection: Connection,
  num_rows: int
) -> List[Row]:
  cursor: Cursor = connection.cursor()
  cursor.execute(f"SELECT * FROM samples.nyctaxi.trips LIMIT {num_rows}")
  result: List[Row] = cursor.fetchall()
  return result

並假設下列名為 main.py 的檔案，該檔案會呼叫 get_connection_personal_access_token 和 select_nyctaxi_trips 函式：

# main.py

from databricks.sql.client import Connection, List, Row
import os
from helpers import get_connection_personal_access_token, select_nyctaxi_trips

connection: Connection = get_connection_personal_access_token(
  server_hostname = os.getenv("DATABRICKS_SERVER_HOSTNAME"),
  http_path = os.getenv("DATABRICKS_HTTP_PATH"),
  access_token = os.getenv("DATABRICKS_TOKEN")
)

rows: List[Row] = select_nyctaxi_trips(
  connection = connection,
  num_rows = 2
)

for row in rows:
  print(row)

下列名為 test_helpers.py 的檔案會測試函 select_nyctaxi_trips 式是否傳回預期的回應。此測試會模擬 Connection 物件，而不是建立與目標工作區的實際連線。測試也會模擬一些符合實際資料中結構描述和值的資料。測試會透過模擬連接傳回仿真的數據，然後檢查其中一個仿真的數據列值是否符合預期的值。

# test_helpers.py

import pytest
from databricks.sql.client import Connection, List, Row
from datetime import datetime
from helpers import select_nyctaxi_trips
from unittest.mock import create_autospec

@pytest.fixture
def mock_data() -> List[Row]:
  return [
    Row(
      tpep_pickup_datetime = datetime(2016, 2, 14, 16, 52, 13),
      tpep_dropoff_datetime = datetime(2016, 2, 14, 17, 16, 4),
      trip_distance = 4.94,
      fare_amount = 19.0,
      pickup_zip = 10282,
      dropoff_zip = 10171
    ),
    Row(
      tpep_pickup_datetime = datetime(2016, 2, 4, 18, 44, 19),
      tpep_dropoff_datetime = datetime(2016, 2, 4, 18, 46),
      trip_distance = 0.28,
      fare_amount = 3.5,
      pickup_zip = 10110,
      dropoff_zip = 10110
    )
  ]

def test_select_nyctaxi_trips(mock_data: List[Row]):
  # Create a mock Connection.
  mock_connection = create_autospec(Connection)

  # Set the mock Connection's cursor().fetchall() to the mock data.
  mock_connection.cursor().fetchall.return_value = mock_data

  # Call the real function with the mock Connection.
  response: List[Row] = select_nyctaxi_trips(
    connection = mock_connection,
    num_rows = 2)

  # Check the value of one of the mocked data row's columns.
  assert response[1].fare_amount == 3.5

因為 select_nyctaxi_trips 函式包含 SELECT 陳述式，因此不會變更 trips 資料表的狀態，所以在此範例中絕對不需要模擬。不過，模擬可讓您快速執行測試，而無需等待與工作區建立實際連線。此外，模擬可讓您針對可能會變更資料表狀態的函式執行模擬測試多次，例如 INSERT INTO、 UPDATE和 DELETE FROM。

套件

databricks-sql-connector

使用方式：pip install databricks-sql-connector

另請參閱 Python 套件索引（PyPI）中的 databricks-sql-connector 。

模組

databricks.sql

使用方式：from databricks import sql

課程

選取的類別包括下列項目：

課程
`Connection` Azure Databricks 計算資源的工作階段。
`Cursor` 遍歷資料記錄的機制。
`Row` SQL 查詢結果中的資料列。

`Connection` 類別

若要建立 Connection 物件，使用下列參數呼叫 databricks.sql.connect 方法：

參數
`server_hostname` 類型:`str` 用於所有用途計算或 SQL 倉儲的伺服器主機名。若要取得伺服器主機名稱，請參閱本文中稍早的指示。此為必要參數。範例: `adb-1234567890123456.7.azuredatabricks.net`
`http_path` 類型:`str` 所有用途計算或 SQL 倉儲的 HTTP 路徑。若要取得 HTTP 路徑，請參閱本文中稍早的指示。此為必要參數。範例： `sql/protocolv1/o/1234567890123456/1234-567890-test123` 用於所有用途的計算。 SQL 資料庫的 `/sql/1.0/warehouses/a1b234c567d8e9fa`。
`access_token`、`auth_type` 類型:`str` Azure Databricks 驗證設定的相關資訊。如需詳細資訊，請參閱驗證。
`session_configuration` 類型:`dict[str, Any]` Spark 工作階段組態參數的字典。設定組態相當於使用 `SET key=val` SQL 命令。執行 SQL 命令 `SET -v`，以取得可用組態的完整清單。預設為 `None`。這是選用參數。範例: `{"spark.sql.variable.substitute": True}`
`http_headers` 類型:`List[Tuple[str, str]]]` 在每次用戶端提交的 RPC 請求中，需在 HTTP 標頭中設定附加的 (鍵、值) 對。一般使用方式不會設定任何額外的 HTTP 標頭。預設為 `None`。這是選用參數。自 2.0 版起
`catalog` 類型:`str` 用於連線的初始目錄。預設為 `None` (在此案例中，將會使用的預設目錄通常是 `hive_metastore`)。這是選用參數。自 2.0 版起
`schema` 類型:`str` 用於連線的初始結構描述。預設為 `None`（在這種情況下，將會使用預設的結構描述 `default`）。這是選用參數。自 2.0 版起
`use_cloud_fetch` 類型:`bool` `True` 表示將擷取要求直接傳送至雲端物件存放區，以下載資料區塊。 `False` (預設值) 將擷取要求直接傳送至 Azure Databricks。如果 `use_cloud_fetch` 設定為 `True`，但網路存取遭到封鎖，則提取要求將會失敗。自 2.8 版起
`user_agent_entry` 類型:`str` 要在 HTTP 請求標頭中包含的 User-Agent 項目，以便進行使用量追蹤。預設為 `PyDatabricksSqlConnector`。這是選用參數。自 4.0.1 版起

選取的 Connection 方法包括如下項目：

方法
`close` 關閉資料庫的連線，並釋放伺服器上的所有相關聯資源。當對此連線進行任何額外的呼叫時，將會拋出`Error`。無參數。沒有傳回值。
`cursor` 傳回一個可讓你遍歷資料庫記錄的新 `Cursor` 物件。無參數。

`Cursor` 類別

若要建立 Cursor 物件，請呼叫 Connection 類別的 cursor 方法。

選取的 Cursor 屬性包括下列項目：

屬性

屬性
`arraysize` 與 `fetchmany` 方法搭配使用，指定內部緩衝區大小，也就是每次從伺服器擷取的資料列數目。預設值是 `10000`。對於窄的結果 (其中每個資料列不包含大量資料的結果)，您應增加此值以提升效能。讀寫存取權。
`description` 包含一個由 `list` 物件組成的 Python `tuple`。其中每個 `tuple` 物件都包含 7 個值，每個 `tuple` 物件的前 2 個項目包含描述單一結果資料行的資訊，如下所示： `name`：欄位的名稱。 `type_code`：代表數據行類型的字串。例如，整數資料行的類型代碼為 `int`。不會實作每個 7 項目 `tuple` 物件的其餘 5 個項目，而且不會定義其值。它們通常會回傳為 4 `None` 值後面接著單一 `True` 值。唯讀權限。

arraysize
與 fetchmany 方法搭配使用，指定內部緩衝區大小，也就是每次從伺服器擷取的資料列數目。預設值是 10000。對於窄的結果 (其中每個資料列不包含大量資料的結果)，您應增加此值以提升效能。
讀寫存取權。

description
包含一個由 list 物件組成的 Python tuple。其中每個 tuple 物件都包含 7 個值，每個 tuple 物件的前 2 個項目包含描述單一結果資料行的資訊，如下所示：

name：欄位的名稱。
type_code：代表數據行類型的字串。例如，整數資料行的類型代碼為 int。

不會實作每個 7 項目 tuple 物件的其餘 5 個項目，而且不會定義其值。它們通常會回傳為 4
None 值後面接著單一 True 值。
唯讀權限。

選取的 Cursor 方法包括如下項目：

方法
`cancel` 中斷資料指標已啟動的任何資料庫查詢或命令的執行。要釋放伺服器上的相關聯資源，請呼叫呼叫 `close` 方法後，再使用 `cancel` 方法。無參數。沒有傳回值。
`close` 關閉游標，並釋放伺服器上的相關資源。關閉已經關閉的資料指標可能會產生錯誤。無參數。沒有傳回值。
`execute` 準備並執行資料庫查詢或命令。沒有傳回值。參數： `operation` 類型:`str` 需要準備並執行的查詢或命令。此為必要參數。不含 `parameters` 參數的範例： `cursor.execute(` `'SELECT * FROM samples.nyctaxi.trips WHERE pickup_zip="10019" LIMIT 2'` `)` 含 `parameters` 參數的範例： `cursor.execute(` `'SELECT * FROM samples.nyctaxi.trips WHERE zip=%(pickup_zip)s LIMIT 2',` `{ 'pickup_zip': '10019' }` `)` `parameters` 類型：字典要與 `operation` 參數搭配使用的參數序列。這是選用參數。預設值為 `None`。
`executemany` 準備，然後使用 `seq_of_parameters` 引數中的所有參數序列來執行資料庫查詢或命令。只會保留最終的結果集。沒有傳回值。參數： `operation` 類型:`str` 需要準備並執行的查詢或命令。此為必要參數。 `seq_of_parameters` 類型：`list` / `dict` 用來搭配的多組參數值序列 `operation` 參數。此為必要參數。
`catalogs` 執行有關目錄的中繼資料查詢。然後應該使用 `fetchmany` 或 `fetchall` 擷取實際結果。結果集中的重要欄位包括：網域名稱：`TABLE_CAT`。類型：`str`。目錄名稱無參數。沒有傳回值。自 1.0 版起
`schemas` 執行關於結構描述的中繼資料查詢。然後應該使用 `fetchmany` 或 `fetchall` 擷取實際結果。結果集中的重要欄位包括：網域名稱：`TABLE_SCHEM`。類型：`str`。結構的名稱。網域名稱：`TABLE_CATALOG`。類型：`str`。架構所屬的目錄。沒有傳回值。自 1.0 版起參數： `catalog_name` 類型:`str` 要取得資訊的目錄名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。 `schema_name` 類型:`str` 要擷取相關資訊的模式名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。
`tables` 執行資料表和視圖的中繼資料查詢。然後應該使用 `fetchmany` 或 `fetchall` 擷取實際結果。結果集中的重要欄位包括：網域名稱：`TABLE_CAT`。類型：`str`。資料表所屬的目錄。網域名稱：`TABLE_SCHEM`。類型：`str`。資料表所屬的結構。網域名稱：`TABLE_NAME`。類型：`str`。資料表的名稱。網域名稱：`TABLE_TYPE`。類型：`str`。例如 `VIEW` 或 `TABLE` 的關聯類型 (適用於 Databricks Runtime 10.4 LTS 和更新版本，以及 Databricks SQL；舊版的 Databricks Runtime 會傳回空字串)。沒有傳回值。自 1.0 版起參數 `catalog_name` 類型:`str` 要取得資訊的目錄名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。 `schema_name` 類型:`str` 要擷取相關資訊的模式名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。 `table_name` 類型:`str` 要用來擷取資訊的資料表名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。 `table_types` 類型:`List[str]` 要比對的資料表類型清單，例如 `TABLE` 或 `VIEW`。這是選用參數。
`columns` 執行關於資料行的中繼資料查詢。然後應該使用 `fetchmany` 或 `fetchall` 擷取實際結果。結果集中的重要欄位包括：網域名稱：`TABLE_CAT`。類型：`str`。欄位所屬的目錄。網域名稱：`TABLE_SCHEM`。類型：`str`。欄位所屬的模式。網域名稱：`TABLE_NAME`。類型：`str`。欄位所屬的資料表名稱。網域名稱：`COLUMN_NAME`。類型：`str`。欄位名稱。沒有傳回值。自 1.0 版起參數： `catalog_name` 類型:`str` 要取得資訊的目錄名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。 `schema_name` 類型:`str` 要擷取相關資訊的模式名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。 `table_name` 類型:`str` 要用來擷取資訊的資料表名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。 `column_name` 類型:`str` 要取得相關資訊的資料行名稱。 `%` 字元會被解釋為萬用字元。這是選用參數。
`fetchall` 取得查詢的所有資料列（或所有剩餘資料列）。無參數。查詢的所有 (或所有剩餘) 資料列將以 Python `list` 形式傳回 `Row` 物件。如果先前對 `Error` 方法的呼叫未傳回任何資料，或尚未呼叫 `execute`，則擲回 `execute`。
`fetchmany` 取得查詢的下一個資料列。以 Python `size` 的 `arraysize` 物件形式，返回查詢的下幾排資料列，最多為 `size` (如果未指定 `list`，則返回 `Row` 屬性)。如果擷取的剩餘資料列少於 `size`，則會傳回所有剩餘的資料列。如果先前對 `Error` 方法的呼叫未傳回任何資料，或尚未呼叫 `execute`，則擲回 `execute`。參數： `size` 類型:`int` 接下來要取得的資料列數量。這是選用參數。如果未指定，會使用 `arraysize` 屬性的值。範例: `cursor.fetchmany(10)`
`fetchone` 取得資料集的下一個資料列。無參數。傳回資料集的下一個資料列，作為 Python 中的單一序列。 `tuple` 物件，如果沒有可用的資料，則傳回 `None`。如果先前對 `Error` 方法的呼叫未傳回任何資料，或尚未呼叫 `execute`，則擲回 `execute`。
`fetchall_arrow` 取得查詢的所有 (或所有剩餘) 資料列，作為 PyArrow `Table` 物件。傳回非常大量資料的查詢應該改用 `fetchmany_arrow` 以減少記憶體使用量。無參數。以 PyArrow 資料表的形式傳回查詢的所有 (或所有剩餘) 資料列。如果先前對 `Error` 方法的呼叫未傳回任何資料，或尚未呼叫 `execute`，則擲回 `execute`。自 2.0 版起
`fetchmany_arrow` 以 PyArrow `Table` 物件的形式，取得查詢的下一資料列。以 Python PyArrow 的形式傳回查詢的下一資料列，最多為 `size` 個參數（如果未指定 `arraysize`，則傳回 `size` 屬性） `Table` 物件如果先前對 `Error` 方法的呼叫未傳回任何資料，或尚未呼叫 `execute`，則擲回 `execute`。自 2.0 版起參數： `size` 類型:`int` 接下來要取得的資料列數量。這是選用參數。如果未指定，會使用 `arraysize` 屬性的值。範例: `cursor.fetchmany_arrow(10)`

`Row` 類別

資料列類別是類似元組的資料結構，代表個別結果資料列。如果資料列包含名稱為 "my_column" 的資料行，可以透過 "my_column" 存取 row 的 row.my_column 欄位。您也可以使用數值索引來存取欄位，例如 row[0]。如果不允許資料列名稱作為屬性方法名稱 (例如，以數位作開頭)，則您可以將欄位存取為 row["1_my_column"]。

自 1.0 版起

選取的 Row 方法包括：

| asDict

傳回以欄位名稱索引的字典形式表示的資料列。如果有重複的欄位名稱，則會在字典中傳回其中一個重複的欄位 (但只有一個)。傳回的重複欄位未被定義。

無參數。

傳回欄位的 dict。 |

類型轉換

下列資料表會將 Apache Spark SQL 資料類型對應至其 Python 資料類型對等項目。

Apache Spark SQL 資料類型	Python 資料類型
`array`	`numpy.ndarray`
`bigint`	`int`
`binary`	`bytearray`
`boolean`	`bool`
`date`	`datetime.date`
`decimal`	`decimal.Decimal`
`double`	`float`
`int`	`int`
`map`	`str`
`null`	`NoneType`
`smallint`	`int`
`string`	`str`
`struct`	`str`
`timestamp`	`datetime.datetime`
`tinyint`	`int`

疑難排解

`tokenAuthWrapperInvalidAccessToken: Invalid access token` 訊息

問題：當您執行程式代碼時，您會看到類似的 Error during request to server: tokenAuthWrapperInvalidAccessToken: Invalid access token訊息。

可能的原因：傳遞至 access_token 的值不是有效的 Azure Databricks 個人存取令牌。

建議修正：檢查傳遞至 access_token 的值是否正確，然後再試一次。

`gaierror(8, 'nodename nor servname provided, or not known')` 訊息

問題：當您執行程式代碼時，您會看到類似的 Error during request to server: gaierror(8, 'nodename nor servname provided, or not known')訊息。

可能的原因：傳遞至 server_hostname 的值不是正確的主機名。

建議修正：檢查傳遞至 server_hostname 的值是否正確，然後再試一次。

如需尋找伺服器主機名的詳細資訊，請參閱取得 Azure Databricks 計算資源的連線詳細數據。

`IpAclError` 訊息

問題：當您執行程式代碼時，當您嘗試在 Azure Databricks Notebook 上使用連接器時，會看到訊息 Error during request to server: IpAclValidation 。

可能的原因：您可能已啟用 Azure Databricks 工作區的 IP 允許清單。使用 IP 允許清單時，預設不允許從 Spark 叢集連線回到控制平面。

建議修正：要求系統管理員將計算平面子網新增至IP允許清單。

其他資源

如需詳細資訊，請參閱

GitHub 上的 Databricks SQL Connector for Python 資源庫
數據類型
Python 網站上的內建類型（適用於bool、bytearray、float、int 和 str）
Python 網站上的 datetime （用於 datetime.date 和 datatime.datetime）
Python 網站上的十進位（適用於decimal.Decimal）
Python 網站上的內建常數（forNoneType）

共用方式為

適用於 Python 的 Databricks SQL 連接器

需求

開始使用

多功能計算

SQL 資料倉儲

驗證

Databricks 個人存取權憑證驗證

OAuth 機器對機器 (M2M) 驗證

Microsoft Entra ID 令牌驗證

OAuth 使用者對機器 (U2M) 認證

範例

設定 User-Agent

查詢資料

插入資料

查詢中繼資料

管理游標和連線

管理 Unity 目錄磁碟區中的檔案

設定記錄

測試

API 參考文件

套件

模組

課程

Connection 類別

Cursor 類別

Row 類別

類型轉換

疑難排解

tokenAuthWrapperInvalidAccessToken: Invalid access token 訊息

gaierror(8, 'nodename nor servname provided, or not known') 訊息

IpAclError 訊息

其他資源

意見反應

其他資源

`Connection` 類別

`Cursor` 類別

`Row` 類別

`tokenAuthWrapperInvalidAccessToken: Invalid access token` 訊息

`gaierror(8, 'nodename nor servname provided, or not known')` 訊息

`IpAclError` 訊息