Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A Plataforma de Inteligência de Dados do Databricks permite que os profissionais de dados em toda a sua organização colaborem e criem soluções de dados usando ferramentas e ativos de dados controlados com segurança.
Este artigo busca ajudá-lo a identificar o ponto de partida correto para seu caso de uso.
Muitas tarefas no Azure Databricks exigem permissões elevadas. Muitas organizações restringem essas permissões elevadas a um pequeno número de usuários ou equipes. Este artigo desambigua ações que podem ser concluídas pela maioria dos usuários do workspace de ações restritas a usuários privilegiados.
Os administradores do workspace podem ajudá-lo a determinar se você deve solicitar acesso a ativos ou solicitar permissões elevadas.
Localizar e acessar dados
Esta seção fornece uma breve visão geral das tarefas para ajudá-lo a descobrir os ativos de dados disponíveis para você. A maioria dessas tarefas pressupõe que um administrador configurou permissões em ativos de dados. Confira Configurar o acesso a dados.
| Área de funcionalidades | Resources |
|---|---|
| Descoberta de dados | Para obter uma visão geral mais detalhada das tarefas de descoberta de dados, consulte Descoberta de dados. |
| Catalogs | Catálogos são o objeto de nível superior no modelo de governança de dados do Catálogo do Unity. Use o do Catalog Explorer para localizar tabelas, exibições e outros ativos de dados. Confira Explorar objetos do banco de dados.
|
| Armazenamento conectado | Se você tiver acesso aos recursos de computação, poderá usar comandos internos para explorar arquivos no armazenamento conectado. Consulte Explorar o armazenamento e localizar arquivos de dados. |
| Carregar arquivos locais | Por padrão, os usuários têm permissões para carregar arquivos de dados pequenos do computador local, como CSVs. Veja Criar ou modificar uma tabela usando o upload de arquivo. |
Trabalhar com dados
Esta seção fornece uma visão geral das tarefas de dados comuns e das ferramentas usadas para executar essas tarefas.
Para todas as tarefas descritas, os usuários devem ter permissões adequadas para ferramentas, recursos de computação, dados e outros artefatos de workspace. Veja Configurar acesso a dados e Configurar workspaces e infraestrutura.
| Área de funcionalidades | Resources |
|---|---|
| Objetos de banco de dados | Além de tabelas e exibições, o Azure Databricks usa outros objetos de banco de dados protegíveis, como volumes, para controlar dados com segurança. Confira Objetos de banco de dados no Azure Databricks. |
| Permissões de dados | O Catálogo do Unity controla todas as operações de leitura e gravação em workspaces habilitados. Você deve ter permissões adequadas para concluir essas operações. Veja Objetos protegíveis no Catálogo do Unity. |
| ETL | Cargas de trabalho de extração, transformação e carregamento (ETL) estão entre os usos mais comuns do Apache Spark e Azure Databricks, e a maior parte da plataforma possui recursos criados e otimizados para ETL. Confira o Tutorial: Criar um pipeline ETL com o Lakeflow Spark Declarative Pipelines. |
| Queries |
|
| Painéis e insights |
|
| Ingest |
|
| Transformations | O Azure Databricks usa sintaxe e ferramentas comuns para transformações que variam em complexidade, desde instruções do SQL CTAS até aplicativos de streaming quase em tempo real.
|
| IA e aprendizado de máquina | A Plataforma de Inteligência de Dados do Databricks fornece um conjunto de ferramentas para ciência de dados, aprendizado de máquina e aplicativos de IA. Confira IA e Machine Learning no Databricks. |
Configurar o acesso a dados
A maioria dos workspaces do Azure Databricks depende de um administrador de workspace ou de outros usuários avançados para configurar conexões com fontes de dados externas e impor privilégios a ativos de dados com base na associação de equipe, região ou funções. Esta seção fornece uma visão geral das tarefas comuns para configurar e controlar acess de dados que exigem permissões elevadas.
Note
Antes de solicitar permissões elevadas para configurar uma nova conexão com uma fonte de dados, confirme se você está apenas perdendo privilégios em uma conexão, catálogo ou tabela existente. Se uma fonte de dados não estiver disponível, consulte sua organização para a política para adicionar novos dados ao seu workspace.
| Área de funcionalidades | Resources |
|---|---|
| Catálogo do Unity |
|
| Conexões e acesso |
|
| Sharing |
|
Configurar espaços de trabalho e infraestrutura
Esta seção fornece uma visão geral das tarefas comuns associadas à administração de ativos e infraestrutura do ambiente de trabalho. Os ativos de workspace amplamente definidos incluem o seguinte:
Recursos de computação: os recursos de computação incluem clusters interativos para todos os fins, SQL warehouses, clusters de trabalho e computação de pipeline. Um usuário ou carga de trabalho deve ter permissões para se conectar à execução de recursos de computação para processar a lógica especificada.
Note
Os usuários que não têm acesso para se conectar a recursos de computação têm funcionalidades muito limitadas no Azure Databricks.
Ferramentas da Plataforma: A Plataforma Data Intelligence do Databricks oferece um conjunto de ferramentas adaptadas a diferentes casos de uso e perfis, como notebooks, Databricks SQL e Mosaic AI. Os administradores podem personalizar configurações que incluem comportamentos padrão, recursos opcionais e acesso do usuário para muitas dessas ferramentas.
Artefatos: os artefatos incluem notebooks, consultas, painéis, arquivos, bibliotecas, pipelines e trabalhos. Os artefatos contêm código e configurações que os usuários criarem para executar ações desejadas em seus dados.
Important
Por padrão, o usuário que cria um ativo de espaço de trabalho recebe a função de proprietário por padrão. Para a maioria dos ativos, os proprietários podem conceder permissões a qualquer outro usuário ou grupo no workspace.
Para garantir que os dados e o código sejam seguros, o Databricks recomenda configurar a função de proprietário para todos os artefatos e recursos de computação implantados em um workspace de produção.
| Área de funcionalidades | Resources |
|---|---|
| Direitos de workspace | Os direitos do workspace incluem acesso básico ao workspace, acesso ao SQL do Databricks e criação irrestrita de cluster. Confira Gerenciar direitos. |
| Políticas de acesso a recursos de computação & |
|
| Ferramentas de plataforma | Use o console de administração para configurar comportamentos que vão desde personalizar a aparência do workspace até habilitar ou desabilitar produtos e recursos. Confira Gerenciar seu workspace. |
| Workspace ACLs | As ACLs (listas de controle de acesso do workspace) regem como usuários e grupos podem interagir com ativos de workspace, incluindo recursos de computação, artefatos de código e trabalhos. Confira Listas de Controle de Acesso. |
Produção de cargas de trabalho
Todos os produtos do Azure Databricks são criados para acelerar o caminho do desenvolvimento para a produção e para escala e estabilidade. Esta seção fornece uma breve introdução ao conjunto de ferramentas recomendado para colocar cargas de trabalho em produção.
| Área de funcionalidades | Resources |
|---|---|
| Pipelines de ETL | O Lakeflow Spark Declarative Pipelines fornece uma sintaxe declarativa para compilar e produzir pipelines ETL. Consulte Pipelines Declarativos do Lakeflow Spark. |
| Orchestration | Os trabalhos permitem que você defina fluxos de trabalho complexos com dependências, gatilhos e agendamentos. Consulte Trabalhos do Lakeflow. |
| CI/CD | Os Pacotes de Ativos do Databricks facilitam o gerenciamento e a implantação de dados, ativos e artefatos em workspaces. Veja que são pacotes de ativos do Databricks?. |