청구 가능한 사용량 시스템 테이블 참조
Important
이 기능은 공개 미리 보기 상태입니다.
이 문서에서는 스키마 및 예제 쿼리를 포함하여 청구 가능한 사용 시스템 테이블에 대한 개요를 제공합니다. 시스템 테이블을 사용하면 계정의 청구 가능 사용량 데이터가 중앙 집중화되고 모든 지역으로 라우팅되므로 작업 영역이 있는 지역에서 계정의 전역 사용량을 볼 수 있습니다.
이 테이블을 사용하여 작업 비용을 모니터링하는 방법에 대한 자세한 내용은 시스템 테이블을 사용하여 작업 비용 모니터링을 참조 하세요.
서버리스 사용량을 분석하는 전략은 서버리스 컴퓨팅 비용 모니터링을 참조 하세요.
청구 가능한 사용 테이블 스키마
청구 가능한 사용량 시스템 테이블은 다음 스키마에 system.billing.usage
있으며 사용합니다.
열 이름 | 데이터 형식 | 설명 | 예시 |
---|---|---|---|
record_id |
string | 이 레코드의 고유 ID | 11e22ba4-87b9-4cc2 -9770-d10b894b7118 |
account_id |
string | 이 보고서가 생성된 계정의 ID입니다. | 23e22ba4-87b9-4cc2 -9770-d10b894b7118 |
workspace_id |
string | 이 사용이 연결된 작업 영역의 ID | 1234567890123456 |
sku_name |
string | SKU의 이름 | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
string | 클라우드 이 사용법은 관련이 있습니다. 가능한 값은 AWS , AZURE 및 GCP 입니다. |
AWS , AZURE 또는 GCP |
usage_start_time |
timestamp | 이 사용 레코드와 관련된 시작 시간 | 2023-01-09 10:00:00.000 |
usage_end_time |
timestamp | 이 사용 레코드와 관련된 종료 시간 | 2023-01-09 11:00:00.000 |
usage_date |
date | 사용 레코드의 날짜입니다. 이 필드는 날짜별 더 빠른 집계에 사용할 수 있습니다. | 2023-01-01 |
custom_tags |
map | 사용자가 이 사용에 적용한 태그입니다. 컴퓨팅 리소스 태그, 작업 태그 및 작업 영역 사용자 지정 태그를 포함합니다. | { “env”: “production” } |
usage_unit |
string | 이 사용량을 단위로 측정합니다. 가능한 값에는 DPU가 포함됩니다. | DBU |
usage_quantity |
decimal | 이 레코드에 사용된 단위 수입니다. | 259.2958 |
usage_metadata |
struct | 컴퓨팅 리소스 및 작업에 대한 ID를 포함하여 사용량에 대한 시스템 제공 메타데이터(해당하는 경우). 사용량 메타데이터 분석을 참조하세요. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
struct | 사용과 관련된 ID에 대한 시스템 제공 메타데이터입니다. ID 메타데이터 분석을 참조하세요. | {run_as: example@email.com} |
record_type |
string | 레코드가 수정인지 여부입니다. 가능한 값은 ORIGINAL , RETRACTION 및 RESTATEMENT 입니다. |
ORIGINAL |
ingestion_date |
date | 레코드가 테이블에 수집된 날짜입니다 usage . |
2024-01-01 |
billing_origin_product |
string | 사용에서 시작된 제품입니다. 일부 제품은 다른 SKU로 청구할 수 있습니다. 가능한 값은 사용량과 연결된 제품에 대한 정보 보기를 참조하세요. | JOBS |
product_features |
struct | 사용되는 특정 제품 기능에 대한 세부 정보입니다. | 가능한 값은 제품 기능을 참조 하세요. |
usage_type |
string | 청구 목적으로 제품 또는 워크로드에 기인하는 사용 유형입니다. 가능한 값은 COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , API_CALLS , TOKEN 또는 GPU_TIME 입니다. |
STORAGE_SPACE |
사용량 메타데이터 분석
이 값은 usage_metadata
사용량 레코드와 관련된 리소스에 대해 알려줍니다.
값 | 데이터 형식 | 설명 |
---|---|---|
cluster_id |
string |
사용 레코드와 연결된 클러스터의 ID |
instance_pool_id |
string |
사용 레코드와 연결된 인스턴스 풀의 ID |
node_type |
string |
컴퓨팅 리소스의 인스턴스 유형 |
job_id |
string |
사용 레코드와 연결된 작업의 ID입니다. 서버리스 컴퓨팅 또는 작업 클러스터 사용량에 대한 값만 반환하고, 그렇지 않으면 반환됩니다 NULL . |
job_run_id |
string |
사용 레코드와 연결된 작업 실행의 ID입니다. 서버리스 컴퓨팅 또는 작업 클러스터 사용량에 대한 값만 반환하고, 그렇지 않으면 반환됩니다 NULL . |
notebook_id |
string |
사용과 연결된 Notebook의 ID입니다. Notebook 사용에 대한 서버리스 컴퓨팅 값만 반환하고, 그렇지 않으면 반환됩니다 NULL . |
dlt_pipeline_id |
string |
사용 레코드와 연결된 Delta Live Tables 파이프라인의 ID |
참고 항목
드물긴 하지만 Azure job_run_id
Databricks가 메타데이터 캡처 job_run_id
를 시작하기 전에 컴퓨팅이 실행되기 시작한 장기 실행 작업의 경우 채워지지 않습니다. 작업의 컴퓨팅을 다시 시작하여 기록을 시작합니다 job_run_id
.
job_id 또는 notebook_id 사용하여 UI에서 작업 또는 Notebook 찾기
이 지침에서는 ID에 따라 UI에서 특정 작업 또는 Notebook을 끌어오는 방법을 설명합니다.
다음을 기반으로 job_id
UI에서 작업을 찾으려면
job_id
사용 레코드에서 복사합니다. 이 예제에서는 ID가 .입니다700809544510906
.- 작업과 동일한 Azure Databricks 작업 영역에서 워크플로 UI로 이동합니다.
- 내 필터가 소유한 유일한 작업이 선택 취소되어 있는지 확인합니다.
- ID(700809544510906)를 필터 작업 검색 창에 붙여넣습니다.
UI를 기반으로 UI에서 Notebook을 notebook_id
찾으려면 다음 지침을 사용합니다.
notebook_id
사용 레코드에서 복사합니다. 이 예제에서는 ID가 .입니다700809544510906
.- Notebook과 동일한 Azure Databricks 작업 영역에서 작업 영역 UI로 이동합니다.
- 표시되는 전자 필기장을 클릭합니다.
- Notebook을 연 후 브라우저 주소 표시줄에서 URL을 검사합니다.
https://<account-console-url>/?o=<workspace ID>#notebook/<notebook ID>/command/<command ID>
형식입니다. - 브라우저 주소 표시줄에서 전자 필기장 ID를 첫 번째 단계에서 복사한 ID로 바꾼 다음 전자 필기장 ID 다음에 있는 모든 항목을 삭제합니다.
https://<account-console-url>/?o=<workspace ID>#notebook/700809544510906
형식입니다. - 전자 필기장을 끌어온 후 공유 단추를 클릭하여 전자 필기장 소유자를 볼 수 있습니다.
ID 메타데이터 분석
이 열은 identity_metadata
서버리스 청구 레코드를 담당하는 사용자를 식별하는 데 도움이 될 수 있습니다. 열에는 ID에 run_as
대한 사용 특성을 지정하는 값이 포함됩니다. 기록된 identity_metadata.run_as
ID는 사용량과 연결된 제품에 따라 달라집니다.
동작은 다음 표를 참조하세요 identity_metadata.run_as
.
워크로드 유형 | 의 ID run_as |
---|---|
워크플로에 대한 서버리스 컴퓨팅 | 실행에 설정으로 정의된 사용자 또는 서비스 주체입니다. 기본적으로 작업은 작업 소유자의 ID로 실행되지만 관리자는 이를 다른 사용자 또는 서비스 주체로 변경할 수 있습니다. |
Notebook에 대한 서버리스 컴퓨팅 | Notebook 명령을 실행한 사용자(특히 Notebook 세션을 만든 사용자)입니다. 공유 전자 필기장의 경우 동일한 전자 필기장 세션을 공유하는 다른 사용자의 사용량이 포함됩니다. |
사용량과 관련된 제품에 대한 정보 보기
일부 Databricks 제품은 동일한 공유 SKU로 청구됩니다. 사용 현황을 구분하기 위해 열과 열은 사용 billing_origin_product
량과 product_features
관련된 특정 제품 및 기능에 대한 더 많은 인사이트를 제공합니다.
이 열에는 billing_origin_product
사용량 레코드와 연결된 Databricks 제품이 표시됩니다. 값은 다음과 같습니다.
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
MANAGED_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
열은 product_features
사용되는 특정 제품 기능에 대한 정보를 포함하는 개체이며 다음 키/값 쌍을 포함합니다.
jobs_tier
: 값에 포함LIGHT
,CLASSIC
또는null
sql_tier
: 값에 포함CLASSIC
,PRO
또는null
dlt_tier
: 값에 포함CORE
,PRO
,ADVANCED
또는null
is_serverless
: 값 포함true
또는false
, 또는null
is_photon
: 값 포함true
또는false
, 또는null
serving_type
: 값에는 포함MODEL
,GPU_MODEL
,FOUNDATION_MODEL
또는FEATURE
null
샘플 쿼리
다음 샘플 쿼리를 사용하여 청구 가능한 사용량에 대한 일반적인 질문에 대답할 수 있습니다.
- DBU 소비의 일일 추세는 무엇인가요?
- 이번 달 내내 사용된 각 SKU의 DPU는 몇 개입니까?
- 6월 1일에 작업 영역에서 사용한 각 SKU의 양
- DTU를 가장 많이 사용한 작업은 무엇입니까?
- 특정 태그가 있는 리소스의 사용량은 얼마인가요?
- 사용량이 증가하는 SKU 표시
- 다목적 컴퓨팅(Photon)의 사용 추세는 무엇인가요?
- 구체화된 뷰 또는 스트리밍 테이블의 DBU 사용량은 무엇인가요?
DBU 소비의 일일 추세는 무엇인가요?
SELECT usage_date as `Date`, sum(usage_quantity) as `DBUs Consumed`
FROM system.billing.usage
WHERE sku_name = "STANDARD_ALL_PURPOSE_COMPUTE"
GROUP BY usage_date
ORDER BY usage_date ASC
이번 달 내내 사용된 각 SKU의 DPU는 몇 개입니까?
SELECT sku_name, usage_date, sum(usage_quantity) as `DBUs`
FROM system.billing.usage
WHERE
month(usage_date) = month(NOW())
AND year(usage_date) = year(NOW())
GROUP BY sku_name, usage_date
6월 1일에 작업 영역에서 사용한 각 SKU의 양
실제 작업 영역 ID로 바꾸어 workspace_id
야 합니다.
SELECT sku_name, sum(usage_quantity) as `DBUs consumed`
FROM system.billing.usage
WHERE workspace_id = 1234567890123456
AND usage_date = "2023-06-01"
GROUP BY sku_name
참고 항목
이 쿼리는 선택한 날짜에 작업 영역에서 사용되는 고유한 SKU ID당 하나의 행을 반환합니다.
DTU를 가장 많이 사용한 작업은 무엇입니까?
SELECT usage_metadata.job_id as `Job ID`, sum(usage_quantity) as `DBUs`
FROM system.billing.usage
WHERE usage_metadata.job_id IS NOT NULL
GROUP BY `Job ID`
ORDER BY `DBUs` DESC
특정 태그가 있는 리소스의 사용량은 얼마인가요?
다양한 방법으로 비용을 절감할 수 있습니다. 이 예제에서는 사용자 지정 태그로 비용을 구분하는 방법을 보여줍니다. 쿼리에서 사용자 지정 태그의 키와 값을 바꿔야 합니다.
SELECT sku_name, usage_unit, SUM(usage_quantity) as `DBUs consumed`
FROM system.billing.usage
WHERE custom_tags.{{key}} = "{{value}}"
GROUP BY 1, 2
사용량이 증가하는 SKU 표시
SELECT after.sku_name, before_dbus, after_dbus, ((after_dbus - before_dbus)/before_dbus * 100) AS growth_rate
FROM
(SELECT sku_name, sum(usage_quantity) as before_dbus
FROM system.billing.usage
WHERE usage_date BETWEEN "2023-04-01" and "2023-04-30"
GROUP BY sku_name) as before
JOIN
(SELECT sku_name, sum(usage_quantity) as after_dbus
FROM system.billing.usage
WHERE usage_date BETWEEN "2023-05-01" and "2023-05-30"
GROUP BY sku_name) as after
where before.sku_name = after.sku_name
SORT by growth_rate DESC
다목적 컴퓨팅(Photon)의 사용 추세는 무엇인가요?
SELECT sku_name, usage_date, sum(usage_quantity) as `DBUs consumed`
FROM system.billing.usage
WHERE year(usage_date) = year(CURRENT_DATE)
AND sku_name = "ENTERPRISE_ALL_PURPOSE_COMPUTE_(PHOTON)"
AND usage_date > "2023-04-15"
GROUP BY sku_name, usage_date
구체화된 뷰 또는 스트리밍 테이블의 DBU 사용량은 무엇인가요?
구체화된 특정 뷰 또는 스트리밍 테이블에 대한 DBU 사용량 및 SKU를 확인하려면 연결된 파이프라인 ID(dlt_pipeline_id
)가 필요합니다. 카탈로그 탐색기에서 관련 구체화된 뷰 또는 스트리밍 테이블을 볼 때 세부 정보 탭에서 파이프라인 ID를 찾습니다.
SELECT
sku_name,
usage_date,
SUM(usage_quantity) AS `DBUs`
FROM
system.billing.usage
WHERE
usage_metadata.dlt_pipeline_id = "113739b7-3f45-4a88-b6d9-e97051e773b9"
AND usage_start_time > "2023-05-30"
GROUP BY
ALL
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기