Dokumentacja tabeli systemu obszarów roboczych

Ważne

Ta tabela systemowa znajduje się w publicznej wersji zapoznawczej.

Na tej stronie wyjaśniono, jak używać tabeli systemu obszarów roboczych do monitorowania obszarów roboczych na koncie usługi Azure Databricks. Każdy wiersz w tabeli reprezentuje najnowszy znany stan aktywnego obszaru roboczego na twoim koncie, w tym metadanych i stanu cyklu życia.

Ta tabela jest najbardziej przydatna podczas łączenia z innymi tabelami systemowymi. Służy do uzyskiwania zagregowanych statystyk dotyczących niezawodności, wydajności i kosztów w obszarach roboczych na koncie.

Uwaga / Notatka

Tabela zawiera tylko przestrzenie robocze aktualnie na Twoim koncie. Po anulowaniu obszaru roboczego jego wiersz zostanie usunięty z tabeli systemowej obszarów roboczych.

Ścieżka tabeli: ta tabela znajduje się w lokalizacji system.access.workspaces_latest

Schemat tabeli obszarów roboczych

Nazwa kolumny	Typ danych	Opis	Przykład
`account_id`	ciąg	Identyfikator konta usługi Databricks	`0722779a-fd4e-49c1-a7a6-8417a97cf9ea`
`workspace_id`	ciąg	Identyfikator obszaru roboczego usługi Databricks	'2274721051152826'
`workspace_name`	ciąg	Czytelna dla człowieka nazwa obszaru roboczego	ciasto-re-mi
`workspace_url`	ciąg	Adres URL obszaru roboczego	`https://dough-re-mi-pizza.cloud.databricks.com/`
`create_time`	sygnatura czasowa	Sygnatura czasowa utworzenia obszaru roboczego (druga precyzja)	2025-03-05 15:47
`status`	wyliczenie	Stan obszaru roboczego. W przypadku tworzenia obszaru roboczego jest początkowo ustawiony na `PROVISIONING`. Kontynuuj sprawdzanie stanu do momentu, gdy stan to `RUNNING`.	`NOT_PROVISIONED`, , `PROVISIONING`, `RUNNING`, , `FAILEDBANNED`

Przykładowe zapytania

W poniższych sekcjach znajdują się przykładowe zapytania SQL korzystające z tabeli systemowej obszarów roboczych.

Które obszary robocze aktualnie działają?
Które obszary robocze mają najwyższe wydatki?
Które zadania na moim koncie są najdroższe?

Które obszary robocze działają obecnie?

Poniższe zapytanie pokazuje wszystkie obszary robocze, które są aktualnie w stanie RUNNING na Twoim koncie.

SELECT
    workspace_id,
    workspace_name,
    workspace_url,
    create_time
FROM
    system.access.workspaces_latest
WHERE
    status = "RUNNING";

Które obszary robocze mają najwyższe wydatki?

To zapytanie oblicza 10 najważniejszych przestrzeni roboczych na koncie, uporządkowanych według wydatków z ostatnich 30 dni.

WITH
-- apply date filter
usage_with_ws_filtered_by_date AS (
  SELECT
    w.workspace_id,
    w.workspace_name,
    w.workspace_url,
    u.usage_quantity,
    u.usage_unit,
    u.sku_name,
    u.usage_end_time,
    u.cloud
  FROM
    system.billing.usage AS u NATURAL JOIN system.access.workspaces_latest AS w
  WHERE
    u.usage_date > DATE_ADD(CURRENT_DATE(), -30)
),
-- calc list priced usage in USD
prices AS (
  SELECT
    COALESCE(price_end_time, DATE_ADD(current_date, 1)) AS coalesced_price_end_time,
    *
  FROM
    system.billing.list_prices
  WHERE
    currency_code = 'USD'
),
list_priced_usd AS (
  SELECT
    COALESCE(u.usage_quantity * p.pricing.default, 0) as usage_usd,
    u.*
  FROM
    usage_with_ws_filtered_by_date as u
      LEFT JOIN prices AS p
        ON u.sku_name = p.sku_name
        AND u.cloud = p.cloud
        AND u.usage_unit = p.usage_unit
        AND (u.usage_end_time BETWEEN p.price_start_time AND p.coalesced_price_end_time)
)
-- calc total usage in USD
SELECT
  workspace_id,
  workspace_name,
  workspace_url,
  round(sum(usage_usd), 2) AS usage_usd
FROM
  list_priced_usd
GROUP BY
  1,
  2,
  3
ORDER BY
  4 DESC
limit 10;

Które zadania na moim koncie są najdroższe?

To zapytanie oblicza 10 najdroższych zadań na twoim koncie w ciągu ostatnich 30 dni.

with usage_with_cost AS (
  SELECT
    *,
    t1.usage_quantity * list_prices.pricing.default as list_cost
  FROM system.billing.usage t1
  INNER JOIN system.billing.list_prices list_prices on
      t1.cloud = list_prices.cloud and
      t1.sku_name = list_prices.sku_name and
      t1.usage_start_time >= list_prices.price_start_time and
      (t1.usage_end_time <= list_prices.price_end_time or list_prices.price_end_time is null)
),
most_expensive_jobs_30d AS (
  SELECT
    workspace_id,
    usage_metadata.job_id,
    SUM(list_cost) as list_cost
  FROM usage_with_cost
  WHERE
    usage_metadata.job_id IS NOT NULL
    AND usage_date >= CURRENT_DATE() - INTERVAL 30 DAYS
  GROUP BY ALL
  ORDER BY list_cost DESC
  LIMIT 100
),
latest_jobs AS (
  SELECT
    *,
    ROW_NUMBER() OVER (PARTITION BY workspace_id, job_id ORDER BY change_time DESC) as rn
  FROM system.lakeflow.jobs QUALIFY rn=1
)
SELECT
  t1.workspace_id,
  t2.workspace_name,
  t3.name as job_name,
  CONCAT(
    t2.workspace_url, '/jobs/', t1.job_id
  ) as job_url,
  t1.list_cost
FROM most_expensive_jobs_30d t1
LEFT JOIN  system.access.workspaces_latest t2 using (workspace_id)
LEFT JOIN latest_jobs t3 USING (workspace_id, job_id)
ORDER BY list_cost DESC
LIMIT 10;

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-22