Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Este artigo é uma visão geral de suas opções para criar e gerenciar espaços de trabalho.
O que é uma área de trabalho?
Um espaço de trabalho é uma implantação do Azure Databricks em uma conta de serviço de nuvem. Ele fornece um ambiente unificado para trabalhar com ativos do Azure Databricks para um conjunto especificado de usuários.
Existem dois tipos de espaços de trabalho Databricks disponíveis:
- Espaços de trabalho 'serverless': Uma implementação de espaço de trabalho na sua conta Azure Databricks que vem pré-configurada com computação 'serverless' e armazenamento padrão para proporcionar uma experiência completamente 'serverless'. Ainda podes ligar-te ao teu armazenamento na cloud a partir de espaços de trabalho serverless.
- Espaços de trabalho híbridos: Também referido como espaço de trabalho clássico , esta implementação de espaço de trabalho fornece armazenamento e recursos computacionais na sua conta Azure existente. A computação serverless ainda está disponível em espaços de trabalho híbridos.
Requerimentos
Antes de criar um espaço de trabalho Azure Databricks, deve ter uma subscrição Azure que não seja uma Subscrição de Teste Gratuita.
Se tiver uma conta gratuita, complete os seguintes passos:
- Aceda ao seu perfil e altere a sua subscrição para pagamento consoante a utilização. Consulte Conta gratuita do Azure.
- Remova o limite de gastos.
- Solicite um aumento de cota para vCPUs em sua região.
Permissões necessárias do Azure
Para criar um espaço de trabalho do Azure Databricks, você deve ser um dos seguintes:
- Um utilizador com a função de Colaborador do Azure ou a função de Proprietário ao nível da subscrição.
- Um usuário com uma definição de função personalizada que tem a seguinte lista de permissões:
Microsoft.Databricks/workspaces/*Microsoft.Resources/subscriptions/resourceGroups/readMicrosoft.Resources/subscriptions/resourceGroups/writeMicrosoft.Databricks/accessConnectors/*Microsoft.Compute/register/actionMicrosoft.ManagedIdentity/register/actionMicrosoft.Storage/register/actionMicrosoft.Network/register/actionMicrosoft.Resources/deployments/validate/actionMicrosoft.Resources/deployments/writeMicrosoft.Resources/deployments/read
Observação
As permissões Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action não são necessárias se esses fornecedores já estiverem registados na subscrição. Consulte Registrar provedor de recursos.
Escolher um tipo de espaço de trabalho
As secções seguintes descrevem qual o tipo de espaço de trabalho que é o melhor para casos de uso comuns. Utilize estas recomendações para o ajudar a decidir se deve implementar um espaço de trabalho do tipo 'serverless' (sem servidor) ou do tipo clássico.
Quando escolher espaços de trabalho sem servidor
Os workspaces serverless são a melhor escolha para a maioria dos casos de uso e são a forma mais fácil de começar com casos de uso operacionais e de consumidores, como Lakebase, Genie e aplicações Databricks.
Os espaços de trabalho serverless são a melhor escolha para os seguintes casos de uso:
- Permitir que os utilizadores empresariais possam aceder ao Databricks One
- Criação de painéis de IA/BI
- Criação de Aplicativos Databricks
- Realizar análises exploratórias usando notebooks ou armazéns de dados SQL
- Ligação a fornecedores SaaS através da Lakehouse Federation (mas não da Lakeflow Connect)
- Utilização dos Genie Spaces para casos de uso empresariais
- Utilização de funcionalidades de IA como pesquisa vetorial, serviço de modelos, funções de IA e Agent Bricks
- Criação de Pipelines Declarativos para Lakeflow Spark sem servidor
Quando escolher espaços de trabalho clássicos
Os workspaces clássicos são a melhor escolha para os seguintes casos de uso:
- Portar código Spark legado existente que utiliza RDDs Spark
- Usar Scala ou R como linguagem de programação principal
- Dados em streaming que requerem intervalos de disparo baseados no tempo
- Ligação a sistemas locais ou bases de dados privadas diretamente, através do Lakeflow Connect
Opções de criação de espaço de trabalho
Há várias maneiras de implantar um espaço de trabalho do Azure Databricks. O método de implantação padrão é por meio do Portal do Azure ou Terraform.
- Implantar um espaço de trabalho usando o Portal do Azure
- Implantar um espaço de trabalho usando o Terraform
Além disso, você pode criar espaços de trabalho usando as seguintes ferramentas: