중요합니다
이 기능은 다음 지역의 공개 미리 보기에 있습니다. westuswestus2eastuseastus2centralussouthcentralusnortheuropewesteuropeaustraliaeastbrazilsouthcanadacentralcentralindiasoutheastasiauksouth
OLTP 워크로드를 시작하려면 Azure Databricks UI, API 호출, Python SDK 또는 CLI를 사용하여 Lakebase 프로비전된 데이터베이스 인스턴스를 만듭니다.
데이터베이스 인스턴스 만들기
권장되는 기본값을 사용하여 데이터베이스 인스턴스를 만듭니다. 인스턴스 이름(1-63자, 문자 및 하이픈만 해당)을 제공해야 합니다. 작성자는 역할을 가진 데이터베이스 소유자입니다 databricks_superuser .
대부분의 작업 영역 사용자는 기본적으로 데이터베이스 인스턴스를 만들 수 있습니다. 사용 권한 문제가 발생하는 경우 데이터베이스 인스턴스 사용 권한을 참조하세요.
사용자 인터페이스 (UI)
- 작업 영역 사이드바에서 컴퓨팅을 클릭합니다.
- Lakebase 프로비전 탭을 클릭합니다.
- 데이터베이스 인스턴스 만들기를 클릭합니다.
- 데이터베이스 인스턴스 이름(1-63자, 문자 및 하이픈만 해당)을 입력합니다.
- 만들기를 클릭합니다.
Python SDK
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance
# Initialize the Workspace client
w = WorkspaceClient()
# Create a database instance
instance = w.database.create_database_instance(
DatabaseInstance(
name="my-database-instance",
capacity="CU_1"
)
)
print(f"Created database instance: {instance.name}")
print(f"Connection endpoint: {instance.read_write_dns}")
CLI
# Create a database instance
databricks database create-database-instance my-database-instance \
--capacity CU_1
# Create with advanced options (using JSON for more complex parameters)
databricks database create-database-instance \
--json '{
"name": "my-database-instance",
"capacity": "CU_2",
"retention_window_in_days": 14
}'
curl
데이터베이스 인스턴스를 만들고 보존 기간을 지정합니다.
export PAT=<YOUR_PAT>
export INSTANCE_NAME="instance_name"
> curl -X POST --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://[your databricks workspace]/api/2.0/database/instances \
--data-binary @- << EOF
{
"name": "$INSTANCE_NAME",
"capacity": "CU_1",
"retention_window_in_days": 14
}
EOF
고급 설정
인스턴스를 편집하여 만들거나 만든 후에 이러한 기능을 구성할 수도 있습니다.
| 특징 | Description |
|---|---|
| 서버리스 예산 정책 | 서버리스 사용량 및 특정 예산에 대한 청구 특성을 지정하려면 데이터베이스 인스턴스에 대한 예산 정책을 선택합니다. 사용자 지정 태그를 추가할 수도 있습니다. |
| 인스턴스 크기 | 워크로드 성능 요구 사항에 맞게 컴퓨팅 리소스 크기를 조정합니다(기본값은 2 CU). |
| 복원 창 | 지정 시간 복구에 대한 보존 기간(2-35일, 기본값 7일)을 설정합니다. |
| 고가용성 | 프로덕션 워크로드의 비즈니스 연속성을 보장하기 위해 장애 조치(failover) 노드를 추가합니다. |
| 부모에서 만들기 | 기존 데이터베이스 인스턴스에서 쓰기 복사 복제본을 만듭니다. |
인스턴스 중지 또는 시작
데이터베이스 인스턴스를 중지하거나 시작하려면 데이터베이스 인스턴스에 대한 권한이 있어야 합니다 CAN MANAGE . 인스턴스를 중지하거나 시작하려면 Azure Databricks UI, API 호출, Python SDK 또는 CLI를 사용합니다.
사용자 인터페이스 (UI)
- 작업 영역 사이드바에서 컴퓨팅을 클릭합니다.
- Lakebase 프로비전 탭을 클릭합니다.
- 중지하거나 시작하려는 데이터베이스 인스턴스를 클릭합니다.
- 페이지의 오른쪽 위 모서리에서 중지 또는 시작을 클릭합니다.
Python SDK
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance
# Initialize the Workspace client
w = WorkspaceClient()
# Stop a database instance
instance_name = "my-database-instance"
w.database.update_database_instance(
name=instance_name,
database_instance=DatabaseInstance(
name=instance_name,
stopped=True
),
update_mask="*"
)
print(f"Stopped database instance: {instance_name}")
# Start a database instance
w.database.update_database_instance(
name=instance_name,
database_instance=DatabaseInstance(
name=instance_name,
stopped=False
),
update_mask="*"
)
print(f"Started database instance: {instance_name}")
CLI
# Stop a database instance
databricks database update-database-instance my-database-instance \
--json '{
"stopped": true
}'
# Start a database instance
databricks database update-database-instance my-database-instance \
--json '{
"stopped": false
}'
curl
다음 API 호출은 데이터베이스 인스턴스를 중지합니다.
-X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
"stopped": true
}
EOF
다음 API 호출은 데이터베이스 인스턴스를 시작합니다.
curl -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
"stopped": false
}
EOF
중지된 경우의 동작
데이터베이스 인스턴스 동작:
- 데이터는 보존됩니다.
- 인스턴스는 읽기 또는 쓰기 작업에 사용할 수 없습니다.
- 동기화된 테이블은 읽기를 제공하지 않습니다.
- Lakeflow Spark LDP(선언적 파이프라인)는 중지된 인스턴스를 검색하지 않으며 오류를 반환할 수 있습니다.
- 중지된 인스턴스의 등록된 카탈로그는 UI에 스키마 세부 정보를 표시하지 않습니다.
기능 제한 사항:
- 만들거나 삭제
DatabaseTables할 수 없습니다.DatabaseCatalogs - 중지된 인스턴스를 삭제하거나 크기를 조정할 수 있습니다. 용량 변경은 인스턴스가 다시 시작될 때 적용됩니다.
- 파이프라인을 중지할 수 있습니다.
시작할 때의 동작
- 인스턴스가
STARTING상태에 들어가고 준비되면AVAILABLE가 됩니다.
제한점
- LDP는 중지된 인스턴스를 검색하지 않으며 오류를 반환할 수 있습니다.
- 중지된 인스턴스의 등록된 카탈로그는 UI에 스키마 세부 정보를 표시하지 않습니다.
인스턴스 삭제
데이터베이스 인스턴스를 삭제할 때는 주의해야 합니다. 이렇게 하면 연결된 모든 데이터가 삭제됩니다.
데이터베이스 인스턴스에 대한 권한이 있어야 합니다 CAN MANAGE . 테이블 또는 카탈로그의 소유자가 아닌 경우 소유권을 자신에게 다시 할당해야 합니다. 작업 영역 관리자는 소유하지 않은 데이터베이스 인스턴스를 삭제할 수 있습니다.
Databricks는 데이터베이스 인스턴스를 삭제하기 전에 연결된 모든 Unity 카탈로그 카탈로그, 동기화된 테이블 및 자식 인스턴스를 삭제하는 것이 좋습니다. 그렇지 않으면 카탈로그를 보거나 이를 참조하는 SQL 쿼리를 실행하려고 시도하면 오류가 발생합니다.
사용자 인터페이스 (UI)
- 작업 영역 사이드바에서 컴퓨팅을 클릭합니다.
- Lakebase 프로비전 탭을 클릭합니다.
- 삭제할 데이터베이스 인스턴스를 선택합니다.
- 카탈로그 탭 을 클릭하여 데이터베이스 인스턴스와 연결된 데이터베이스 카탈로그의 전체 목록을 봅니다.
- 각 데이터베이스 카탈로그에 대해 관리되는 카탈로그에 있고 데이터베이스 카탈로그로 등록되지 않은 테이블을 포함하여 동기화된 테이블을 모두 삭제합니다.
-
> 카탈로그를 삭제합니다.
Python SDK
from databricks.sdk import WorkspaceClient
# Initialize the Workspace client
w = WorkspaceClient()
# Delete a database instance
instance_name = "my-database-instance"
w.database.delete_database_instance(
name=instance_name,
purge=True # Required to delete the instance
)
print(f"Deleted database instance: {instance_name}")
# Delete with force option (to delete child instances too)
w.database.delete_database_instance(
name=instance_name,
force=True, # Delete child instances too
purge=True
)
CLI
# Delete a database instance
databricks database delete-database-instance my-database-instance \
--purge
# Delete with force option (to delete child instances too)
databricks database delete-database-instance my-database-instance \
--json '{
"force": true,
"purge": true
}'
curl
purge=true 는 데이터베이스 인스턴스를 삭제하도록 지정해야 합니다.
curl -X DELETE --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME?purge=true
데이터베이스 인스턴스의 서버리스 예산 정책 업데이트
서버리스 예산 정책은 정책에 할당된 사용자가 발생하는 서버리스 컴퓨팅 활동에 적용되는 태그로 구성됩니다. 사용 정책을 사용하여 데이터베이스 인스턴스에 태그를 지정하면 특정 정책에 대한 청구 및 사용 비용을 특성화하여 서버리스 리소스에서 지출을 보다 쉽게 추적, 관리 및 제어할 수 있습니다.
UI를 사용하여 데이터베이스 인스턴스의 예산 정책을 업데이트합니다.
- 작업 영역 사이드바에서 컴퓨팅을 클릭합니다.
- Lakebase 프로비전 탭을 클릭합니다.
- 청구 정책을 업데이트할 데이터베이스 인스턴스를 선택합니다.
- 오른쪽 위에서 편집 을 클릭합니다.
- 서버리스 예산 정책을 선택합니다.
- 저장을 클릭합니다.
다음 단계
- 기존 Unity 카탈로그 테이블의 데이터를 동기화합니다.
- 외부 도구, SQL 편집기 또는 Notebook에서 데이터베이스 인스턴스를 연결하고 쿼리합니다.
- Unity 카탈로그에 데이터베이스 인스턴스를 등록합니다.
- 다른 사용자가 Azure Databricks에서 데이터베이스 인스턴스에 액세스할 수 있도록 허용합니다. 권한 관리 및Postgres 역할 관리를 참조하세요.
제한 사항 및 요구 사항
다음 섹션에서는 관리되는 데이터베이스 인스턴스에 대한 제한 및 구성 요구 사항을 설명합니다. 인스턴스 만들기 및 사용에 대한 제약 조건은 제한 사항 및 고려 사항을 참조하세요.
인스턴스 이름 요구 사항
- 길이는 1~63자여야 합니다.
- 문자로 시작해야 합니다.
- 영숫자 문자와 하이픈만 포함할 수 있습니다.
- 두 개의 연속 하이픈을 포함할 수 없습니다.