이 문서에서는 작업 영역을 만들고 관리하기 위한 옵션에 대해 간략하게 설명합니다.
작업 영역이란 무엇입니까?
작업 영역은 클라우드 서비스 계정의 Azure Databricks 배포입니다. 지정된 사용자 집합에 대해 Azure Databricks 자산으로 작업하기 위한 통합 환경을 제공합니다.
다음 두 가지 유형의 Databricks 작업 영역을 사용할 수 있습니다.
- 서버리스 작업 영역(공개 미리 보기): 완전히 서버리스 환경을 제공하기 위해 서버리스 컴퓨팅 및 기본 스토리지로 미리 구성된 Databricks 계정의 작업 영역 배포입니다. 서버리스 작업 영역에서 클라우드 스토리지에 계속 연결할 수 있습니다.
- 클래식 작업 영역: 기존 클라우드 계정에서 스토리지 및 컴퓨팅 리소스를 프로비전하는 Databricks 계정의 작업 영역 배포입니다. 서버리스 컴퓨팅은 클래식 작업 영역에서 계속 사용할 수 있습니다.
요구 사항
Azure Databricks 작업 영역을 만들기 전에 Azure 구독이 있어야 하는데, 이는 무료 평가판 구독이 아니어야 합니다.
체험 계정이 있는 경우 다음 단계를 완료합니다.
- 프로필로 이동하여 구독을 종량제로 변경합니다. Azure 체험 계정을 참조하세요.
- 지출 한도제거합니다.
- 해당 지역의 vCPU 할당량 증가를 요청합니다.
필요한 Azure 권한
Azure Databricks 작업 영역을 만들려면 다음 중 하나여야 합니다.
구독 수준에서 Azure 기여자 또는 소유자 역할이 있는 사용자입니다.
다음 사용 권한 목록이 있는 사용자 지정 역할 정의가 있는 사용자:
Microsoft.Databricks/workspaces/*Microsoft.Resources/subscriptions/resourceGroups/readMicrosoft.Resources/subscriptions/resourceGroups/writeMicrosoft.Databricks/accessConnectors/*Microsoft.Compute/register/actionMicrosoft.ManagedIdentity/register/actionMicrosoft.Storage/register/actionMicrosoft.Network/register/actionMicrosoft.Resources/deployments/validate/actionMicrosoft.Resources/deployments/writeMicrosoft.Resources/deployments/read
비고
이러한 공급자가 구독에 이미 등록된 경우 Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action 권한이 필요하지 않습니다.
리소스 공급자 등록을 참조하세요.
작업 영역 유형 선택
다음 섹션에서는 일반적인 사용 사례에 가장 적합한 작업 영역 형식을 설명합니다. 이러한 권장 사항을 사용하여 서버리스 또는 클래식 작업 영역을 배포할지 여부를 결정할 수 있습니다.
서버리스 작업 영역을 선택하는 경우
서버리스 작업 영역은 다음 사용 사례에 가장 적합합니다.
- 비즈니스 사용자가 Databricks One에 액세스할 수 있도록 설정
- AI/BI 대시보드 만들기
- Databricks 앱 만들기
- Notebook 또는 SQL Warehouse를 사용하여 예비 분석 수행
- Lakehouse 페더레이션을 통해 SaaS 공급자에 연결(Lakeflow Connect는 아님)
- 비즈니스용 Genie Spaces 사용 사례
- 프로덕션으로 이동하기 전에 새로운 Mosaic AI 기능 테스트
- 서버리스 Lakeflow Spark 선언적 파이프라인 만들기
클래식 작업 영역을 선택하는 경우
클래식 작업 영역은 다음 사용 사례에 가장 적합합니다.
- GPU가 필요한 AI 또는 ML 개발 작업 수행
- Machine Learning 또는 Apache Spark MLib에 Databricks 런타임 사용
- Spark RDD를 사용하는 기존 레거시 Spark 코드에 대한 포트
- Scala 또는 R을 기본 코딩 언어로 사용
- 기본 또는 시간 기반 트리거 간격이 필요한 스트림 데이터
- PrivateLink 연결을 통해 Databricks API에 연결
- Lakeflow Connect를 통해 온-프레미스 시스템 또는 프라이빗 데이터베이스에 직접 연결
작업 영역 만들기 옵션
Azure Databricks 작업 영역을 배포하는 방법에는 여러 가지가 있습니다. 표준 배포 방법은 Azure Portal 또는 Terraform을 통해 수행됩니다.
또한 다음 도구를 사용하여 작업 영역을 만들 수 있습니다.