Ler dados compartilhados usando o Databricks-to-Databricks Delta Sharing (para destinatários) – Azure Databricks

Esta página descreve como ler dados compartilhados com você usando o protocolo databricks-to-Databricks Delta Sharing, em que o Databricks gerencia uma conexão segura para compartilhamento de dados. Ao contrário do protocolo de compartilhamento aberto do Delta Sharing, o protocolo Databricks-to-Databricks não requer um arquivo de credencial (segurança baseada em token).

O compartilhamento Databricks para Databricks requer que você, como destinatário, atenda ambos os seguintes requisitos:

Você tem acesso a um workspace do Databricks que está habilitado para o Catálogo do Unity.
O provedor está usando o protocolo Databricks-to-Databricks Delta Sharing, não o protocolo de compartilhamento aberto, que fornece um arquivo de credencial.

Se qualquer um dos requisitos não for atendido, consulte Ler dados compartilhados usando o compartilhamento aberto delta com tokens de portador.

Como faço para disponibilizar dados compartilhados para minha equipe?

Para ler dados e notebooks que foram compartilhados com você usando o protocolo Databricks para Databricks, você deve ser um usuário em um workspace do Databricks habilitado para o Catálogo do Unity. Um membro de sua equipe fornece ao provedor de dados um identificador exclusivo para o metastore do Catálogo do Unity e o provedor de dados usa esse identificador para criar uma conexão de compartilhamento segura com sua organização. Os dados compartilhados ficam disponíveis para acesso de leitura no seu workspace. As atualizações que o provedor de dados faz para as tabelas compartilhadas, exibições, volumes e partições são refletidas em seu workspace quase em tempo real.

Note

As alterações de coluna, como adicionar, renomear ou excluir, podem não aparecer no Gerenciador de Catálogos por até um minuto. Da mesma forma, novos compartilhamentos e atualizações para compartilhamentos, incluindo a adição de novas tabelas, são armazenados em cache por um minuto antes de estarem disponíveis para exibição e consulta.

Note

As tabelas de information_schema um catálogo compartilhado refletem metadados armazenados no Catálogo do Unity. Esses metadados são atualizados do provedor somente quando você consulta a tabela compartilhada diretamente ou executa um comando como DESCRIBE ou REFRESH FOREIGN. Até lá, information_schema pode parecer obsoleto em comparação com os dados do provedor.

Para ler os dados que foram compartilhados com você:

Um usuário em sua equipe encontra o compartilhamento – o contêiner para as tabelas, exibições, volumes e notebooks que foram compartilhados com você – e usa esse compartilhamento para criar um catálogo – o contêiner de nível superior para todos os dados no Catálogo do Unity do Databricks.
Um usuário em sua equipe concede ou nega acesso ao catálogo e aos objetos dentro do catálogo (esquemas, tabelas, exibições e volumes) aos membros da sua equipe.
Você lê os dados nas tabelas, exibições e volumes aos quais você recebeu acesso como qualquer ativo de dados no Databricks ao qual você tem acesso somente leitura (SELECT ou READ VOLUME).
Você pode visualizar e clonar blocos de anotações no compartilhamento, desde que tenha o privilégio USE CATALOG no catálogo.

Permissões necessárias

Para poder listar e exibir detalhes sobre todos os provedores e compartilhamentos de provedor, você deve ter o USE PROVIDER privilégio. Outros usuários têm acesso somente aos provedores e compartilhamentos que possuem.

Para criar um catálogo a partir de um compartilhamento de provedor, você deve ser um administrador de metastore, um usuário que tenha os privilégios CREATE CATALOG e USE PROVIDER para o metastore do Catálogo do Unity ou um usuário que possui o privilégio CREATE CATALOG e a propriedade do objeto do provedor.

A capacidade de conceder acesso somente leitura aos esquemas (bancos de dados), tabelas, exibições e volumes no catálogo criado a partir do compartilhamento segue a hierarquia típica de privilégios do Catálogo do Unity. A capacidade de exibir notebooks no catálogo criado a partir do compartilhamento requer o privilégio USE CATALOG no catálogo. Confira Gerenciar permissões para esquemas, tabelas e volumes em um catálogo do Delta Sharing.

Exibir provedores e compartilhamentos

Para começar a ler os dados que foram compartilhados com você por um provedor de dados, você precisa saber o nome do provedor e os objetos de compartilhamento armazenados no metastore do seu Catálogo do Unity depois que o provedor tiver compartilhado dados com você.

O objeto do provedor representa o metastore do Catálogo do Unity, a plataforma de nuvem e a região da organização que compartilhou os dados com você.

O objeto de compartilhamento representa as tabelas, volumes e exibições que o provedor compartilhou com você.

Exibir todos os provedores que compartilharam dados com você

Para exibir uma lista de provedores de dados disponíveis, você pode usar o Gerenciador de Catálogos, a CLI do Catálogo do Databricks Unity ou o comando SQL SHOW PROVIDERS em um notebook Azure Databricks ou no editor de consultas SQL do Databricks.

Permissões necessárias: Você deve ter o USE PROVIDER privilégio. Outros usuários têm acesso apenas aos provedores e compartilhamentos de provedores de sua propriedade.

Para obter detalhes, confira Ver provedores.

Ver detalhes do provedor

Para exibir detalhes sobre um provedor, você pode usar o Gerenciador de Catálogos, a CLI do Catálogo do Databricks Unity ou o comando SQL DESCRIBE PROVIDER em um bloco de anotações Azure Databricks ou no editor de consultas SQL do Databricks.

Permissões necessárias: você precisa ser um administrador do metastore, ter o privilégio USE PROVIDER ou possuir o objeto provedor.

Para obter detalhes, confira Ver detalhes do provedor.

Exibir compartilhamentos

Para exibir os compartilhamentos que um provedor compartilhou com você, você pode usar o Catalog Explorer, a CLI do Catálogo do Databricks Unity ou o comando SQL SHOW SHARES IN PROVIDER em um bloco de anotações Azure Databricks ou no editor de consultas SQL do Databricks.

Permissões necessárias: você precisa ser um administrador do metastore, ter o privilégio USE PROVIDER ou possuir o objeto provedor.

Para obter detalhes, confira Ver compartilhamentos que um provedor compartilhou com você.

Acessar dados em uma tabela ou volume compartilhado

Para ler dados em uma tabela ou volume compartilhado:

Um usuário com privilégios precisa criar um catálogo com base no compartilhamento que contém a tabela ou volume. Pode ser um administrador do metastore, um usuário que tenha os privilégios CREATE CATALOG e USE PROVIDER para o metastore do Catálogo do Unity ou um usuário que tenha o privilégio CREATE CATALOG e a propriedade do objeto provedor.
Esse usuário ou um usuário com os mesmos privilégios precisa conceder a você acesso à tabela ou volume compartilhado.
Você pode acessar a tabela ou volume da mesma forma que faria com qualquer outro ativo de dados registrado no metastore do Catálogo do Unity.

Para tornar os dados em um compartilhamento acessíveis à sua equipe, você deve criar um catálogo a partir do compartilhamento ou montar o compartilhamento em um catálogo compartilhado existente. Para criar um catálogo a partir de um compartilhamento, você pode usar o Gerenciador de Catálogos, a CLI do Catálogo do Databricks Unity ou os comandos SQL em um bloco de anotações Azure Databricks ou no editor de consultas SQL do Databricks. Para montar o compartilhamento em um catálogo compartilhado existente, você pode usar o Gerenciador de Catálogos.

Permissões necessárias para criar um catálogo: um administrador do metastore, um usuário que tenha ambos os privilégios CREATE CATALOG e USE PROVIDER para o metastore do Unity Catalog, ou um usuário que tenha o privilégio CREATE CATALOG e a propriedade do objeto do provedor.

Permissões necessárias para montar o compartilhamento em um catálogo existente: um usuário deve ter o privilégio USE PROVIDER ou ser proprietário do objeto de provedor e também deve ser proprietário do catálogo compartilhado existente ou ter ambos os privilégios MANAGE e USE CATALOG no catálogo compartilhado existente.

Note

Se você estiver criando um catálogo a partir de um compartilhamento SAP BDC , os metadados semânticos do SAP (comentários de tabela e coluna, chaves primárias, chaves estrangeiras e marcas de governança) serão sincronizados automaticamente no catálogo. Nenhuma outra ação é necessária. Para obter detalhes, consulte metadados semânticos do SAP BDC.

Note

Se o compartilhamento incluir exibições, você deverá usar um nome de catálogo diferente do nome do catálogo que contém a exibição no metastore do provedor.

Gerenciador de Catálogos

No workspace Azure Databricks, clique em Catalog para abrir o Catalog Explorer.
Na parte superior do painel Catálogo, clique no e selecione Compartilhamento Delta.

Como alternativa, no canto superior direito, clique em Compartilhar > Delta Sharing.
Na guia Compartilhado comigo, localize e selecione o provedor.
Localize o compartilhamento desejado e clique em Montar no catálogo na linha de compartilhamento.
Selecione Criar um novo catálogo ou Montar no catálogo existente para adicionar o ativo de dados a um catálogo existente.
Insira um nome para o seu novo catálogo ou escolha a qual catálogo existente em que deseja adicionar o compartilhamento.
Clique em Criar ou Montar.

Como alternativa, ao abrir o Catalog Explorer, você pode clicar em + > Criar Catálogo no canto superior direito para criar um catálogo compartilhado. Confira Criar catálogos.

SQL

Execute o comando a seguir em um notebook ou no editor de SQL do Databricks.

CREATE CATALOG [IF NOT EXISTS] <catalog-name>
USING SHARE <provider-name>.<share-name>;

CLI

databricks catalogs create <catalog-name> /
--provider-name <provider-name> /
--share-name <share-name>

O catálogo criado com base em um compartilhamento tem um tipo de catálogo do Delta Sharing. Você pode exibir o tipo na página de detalhes do catálogo no Gerenciador de Catálogos ou executando o comando SQL DESCRIBE CATALOG em um notebook ou consulta SQL do Databricks. Todos os catálogos compartilhados estão listados em Catálogo > Compartilhado no painel esquerdo do Gerenciador de Catálogos.

Um catálogo do Delta Sharing pode ser gerenciado da mesma forma que catálogos regulares em um metastore do Catálogo do Unity. Você pode exibir, atualizar e excluir um catálogo do Delta Sharing usando o Explorador do Catálogo, a CLI do Databricks e comandos SQL SHOW CATALOGS, DESCRIBE CATALOG, ALTER CATALOG e DROP CATALOG.

A estrutura de namespace de 3 níveis em um catálogo do Delta Sharing criado com base em um compartilhamento é a mesma de um catálogo regular no Catálogo do Unity: catalog.schema.table ou catalog.schema.volume.

Os dados de tabela ou volume em um catálogo compartilhado são somente leitura, o que significa que você pode executar operações de leitura como:

DESCRIBE, SHOW e SELECT para tabelas.
DESCRIBE VOLUME, LIST <volume-path>, SELECT * FROM <format>.'<volume_path>' e COPY INTO para volumes.

Os notebooks em um catálogo compartilhado podem ser visualizados e clonados por qualquer usuário com USE CATALOG ao catálogo.

Os modelos em um catálogo compartilhado podem ser lidos e carregados para inferência por qualquer usuário com os seguintes privilégios: privilégio EXECUTE no modelo registrado, além de privilégios USE SCHEMA e USE CATALOG no esquema e catálogo que contém o modelo.

Por padrão, o criador de catálogos é o proprietário de todos os objetos de dados em um catálogo do Delta Sharing e pode gerenciar permissões para qualquer um deles.

Os privilégios são herdados de cima para baixo, embora alguns workspaces ainda possam estar no modelo de segurança herdado que não tenha fornecido a herança. Consulte Herança de privilégios. Qualquer usuário com o privilégio SELECT no catálogo terá o privilégio SELECT em todos os esquemas e tabelas no catálogo, a menos que esse privilégio seja revogado. Da mesma forma, qualquer usuário com o privilégio READ VOLUME no catálogo terá o privilégio READ VOLUME em todos os volumes no catálogo, a menos que esse privilégio seja revogado. Você não pode conceder privilégios que dão acesso de gravação ou atualização a um catálogo ou objetos do Delta Sharing em um catálogo do Delta Sharing.

O proprietário do catálogo pode delegar a propriedade de objetos de dados a outros usuários ou grupos, concedendo a esses usuários a capacidade de gerenciar as permissões de objetos e os ciclos de vida.

Para obter informações detalhadas sobre como gerenciar privilégios em objetos de dados usando o Catálogo do Unity, confira Gerenciar privilégios no Catálogo do Unity.

Ler dados em uma tabela compartilhada

Você pode ler dados em uma tabela compartilhada usando qualquer uma das ferramentas disponíveis para você como um usuário Azure Databricks: Gerenciador de Catálogos, notebooks, consultas SQL, CLI do Databricks e APIs REST do Databricks. Você precisa ter o privilégio SELECT na tabela.

Se o provedor tiver compartilhado a tabela WITH HISTORY, você poderá executar transações na tabela. Para obter mais informações sobre requisitos e limitações de transações, consulte Transações.

Ler dados em uma tabela estrangeira compartilhada ou em um esquema estrangeiro

Important

Esse recurso está em Beta. Os administradores do workspace podem controlar o acesso a esse recurso na página Visualizações . Consulte Gerenciar versões de pré-visualização do Azure Databricks.

Você pode ler dados em uma tabela externa compartilhada ou em um esquema externo usando qualquer uma das ferramentas disponíveis para você como um usuário do Azure Databricks: Catalog Explorer, notebooks, consultas SQL, a CLI do Databricks e APIs REST do Databricks. Você deve ter o privilégio SELECT na tabela estrangeira compartilhada ou no esquema estrangeiro.

Você pode executar transações em tabelas estrangeiras compartilhadas. Consulte os requisitos e as limitações da transação.

Há custos adicionais ao acessar uma tabela estrangeira compartilhada ou um esquema estrangeiro. Para obter informações sobre como os custos de compartilhamento são computados, confira Como fazer para incorrer e verificar os custos de compartilhamento Delta?.

Limitações: você não pode ignorar a restrição de cluster para ler tabelas estrangeiras compartilhadas, mesmo se o provedor permitir.

Ler dados em uma tabela de Iceberg estrangeira compartilhada

Important

Esse recurso está em uma versão prévia.

Você pode ler dados em uma tabela de Iceberg externa compartilhada usando qualquer uma das ferramentas disponíveis para você como usuário do Azure Databricks: Explorador de Catálogos, notebooks, consultas SQL, a CLI do Databricks e as APIs REST do Databricks. No Catalog Explorer, uma tabela Iceberg estrangeira compartilhada é exibida com o tipo de tabela estrangeira e o formato da fonte de dados Iceberg.

Você tem acesso ao local de origem do Iceberg, mas só pode executar os seguintes tipos de consultas:

Consultas de snapshot
Consultas de streaming

Requisitos:

Você deve ter o privilégio SELECT na tabela Iceberg compartilhada estrangeira.
Você deve usar o Databricks Runtime 15.4 LTS ou superior.

Ler dados em um volume compartilhado

Você pode ler dados em um volume compartilhado usando qualquer uma das ferramentas disponíveis para você como um usuário Azure Databricks: Gerenciador de Catálogos, notebooks, consultas SQL, CLI do Databricks e APIs REST do Databricks. Você precisa ter o privilégio READ VOLUME no volume.

Ler dados protegidos por ABAC e aplicar políticas ABAC

Important

Esse recurso está em uma versão prévia.

Atribute-based access control (ABAC) é um modelo de governança de dados que fornece controle de acesso flexível, escalonável e centralizado em Azure Databricks.

Os administradores de conta no lado do destinatário devem ativar o Controle de Acesso Baseado em Atributos para Compartilhamento Delta no console de conta nas Pré-visualizações para ler tabelas compartilhadas protegidas por políticas ABAC. Isso garante que os resultados da consulta estejam corretos. Caso contrário, há o risco de que os dados não sejam controlados corretamente.

Crie políticas ABAC para tabelas compartilhadas, esquemas e catálogos criados a partir de um compartilhamento. As exibições materializadas são suportadas com limitações. Você não pode criar políticas ABAC para tabelas de streaming compartilhadas ou views materializadas. Para configurar políticas abac, consulte Criar e gerenciar políticas abac.

Ler colunas de acompanhamento de linhas em tabelas compartilhadas

Se o provedor de dados tiver habilitado o acompanhamento de linhas em uma tabela compartilhada, você poderá consultar as colunas de metadados de acompanhamento de linhas. Consulte o acompanhamento de linhas no Databricks para obter uma lista de colunas disponíveis.

Como você acessa essas colunas depende do tipo de tabela compartilhada:

Tabelas compartilhadas com histórico e sem filtros de partição: você pode consultar colunas de acompanhamento de linhas sem restrições.
Tabelas com filtros de partição ou tabelas compartilhadas sem histórico: você deve usar o Scala Spark e definir explicitamente a opção responseFormat como delta.
```
spark.read.option(“responseformat”, “delta”).table(“shared_table”).select(“_metadata.row_id”).show()
```

Carregar um modelo compartilhado para inferência

Para obter detalhes sobre como carregar um modelo compartilhado e usá-lo para inferência em lotes, consulte Carregar versão de modelo por alias para cargas de trabalho de inferência.

Consultar os dados de histórico de uma tabela

Se o histórico for compartilhado junto com a tabela, consulte os dados da tabela a partir de uma versão ou carimbo de data/hora. Requer o Databricks Runtime 12.2 LTS ou superior.

Por exemplo:

SELECT * FROM vaccine.vaccine_us.vaccine_us_distribution VERSION AS OF 3;
SELECT * FROM vaccine.vaccine_us.vaccine_us_distribution TIMESTAMP AS OF "2023-01-01 00:00:00";

Além disso, se o feed de dados de alteração (CDF) estiver habilitado com a tabela, consulte o CDF. Há suporte para a versão e o carimbo de data/hora:

SELECT * FROM table_changes('vaccine.vaccine_us.vaccine_us_distribution', 0, 3);
SELECT * FROM table_changes('vaccine.vaccine_us.vaccine_us_distribution', "2023-01-01 00:00:00", "2022-02-01 00:00:00");

Para obter mais informações sobre o feed de dados de alterações, consulte Use o feed de dados de alterações do Delta Lake no Azure Databricks.

Consultar uma tabela usando o Streaming Estruturado do Apache Spark

Se uma tabela for compartilhada com o histórico, você poderá usá-la como fonte do Streaming Estruturado do Spark. Requer o Databricks Runtime 12.2 LTS ou superior.

Opções com suporte:

ignoreDeletes: ignorar transações que excluem dados.
ignoreChanges: reprocessar as atualizações se os arquivos foram reescritos na tabela de origem devido a uma operação de alteração de dados, como UPDATE, MERGE INTO, DELETE (dentro de partições) ou OVERWRITE. Linhas inalteradas ainda podem ser emitidas. Portanto, seus consumidores downstream devem ser capazes de lidar com duplicatas. As exclusões não são propagadas por downstream. ignoreChanges incorpora ignoreDeletes. Portanto, se você usar ignoreChanges, seu stream não será interrompido por exclusões ou atualizações na tabela de origem.
startingVersion: a versão da tabela compartilhada de início. Todas as alterações de tabela que começam a partir dessa versão (inclusive) serão lidas pela fonte de streaming.
startingTimestamp: o carimbo de data/hora do qual começar. Todas as alterações de tabela confirmadas no registro de data/hora (inclusive) serão lidas pela fonte de streaming. Exemplo: "2023-01-01 00:00:00.0"
maxFilesPerTrigger: o número de novos arquivos a serem considerados em cada microlote.
maxBytesPerTrigger: a quantidade de dados que é processada em cada microlote. Essa opção define um “máximo flexível”, o que significa que um lote processa aproximadamente essa quantidade de dados e pode processar mais do que o limite para fazer a consulta de streaming avançar nos casos em que a menor unidade de entrada for maior que esse limite.
readChangeFeed: o stream lê o feed de dados de alterações da tabela compartilhada.

Opções sem suporte:

Trigger.availableNow

Exemplos de consultas de Streaming Estruturado

Scala

spark.readStream.format("deltaSharing")
.option("startingVersion", 0)
.option("ignoreChanges", true)
.option("maxFilesPerTrigger", 10)
.table("vaccine.vaccine_us.vaccine_us_distribution")

Python

spark.readStream.format("deltaSharing")\
.option("startingVersion", 0)\
.option("ignoreDeletes", true)\
.option("maxBytesPerTrigger", 10000)\
.table("vaccine.vaccine_us.vaccine_us_distribution")

Se o feed de dados alterados (CDF) estiver habilitado com a tabela, você poderá transmitir a leitura do CDF.

spark.readStream.format("deltaSharing")
.option("readChangeFeed", "true")
.table("vaccine.vaccine_us.vaccine_us_distribution")

Aplicar filtros de linha e máscaras de coluna

Para aplicar filtros de linha e máscaras de coluna em tabelas e tabelas estrangeiras compartilhadas pelo seu provedor de dados, consulte Aplicar manualmente filtros de linha e máscaras de coluna. Não é possível aplicar máscaras de colunas a tabelas de streaming ou visões materializadas.

Ler as tabelas com vetores de exclusão ou mapeamento de colunas ativados

Important

Esse recurso está em uma versão prévia.

Os vetores de exclusão são um recurso de otimização de armazenamento que seu provedor pode habilitar nas tabelas Delta compartilhadas. Consulte vetores de exclusão no Databricks.

Azure Databricks também dá suporte ao mapeamento de colunas para tabelas Delta. Confira Renomear e remover colunas usando o mapeamento de colunas do Delta Lake.

Se o provedor compartilhou uma tabela com vetores de exclusão ou mapeamento de coluna habilitado, você pode executar leituras em lote na tabela usando um SQL warehouse ou um cluster executando o Databricks Runtime 14.1 ou superior. As consultas de streaming e CDF exigem o Databricks Runtime 14.2 ou superior.

Você pode executar consultas em lote como estão, pois elas podem resolver responseFormat automaticamente com base nos recursos de tabela da tabela compartilhada.

Para ler um CDF (feed de dados de alteração) ou executar consultas de streaming em tabelas compartilhadas com vetores de exclusão ou mapeamento de colunas habilitado, você deve definir a opção adicional responseFormat=delta.

Os seguintes exemplos mostram consultas em lote, de streaming e CDF:

import org.apache.spark.sql.SparkSession

// Batch query
spark.read.format("deltaSharing").table(<tableName>)

// CDF query
spark.read.format("deltaSharing")
  .option("readChangeFeed", "true")
  .option("responseFormat", "delta")
  .option("startingVersion", 1)
  .table(<tableName>)

// Streaming query
spark.readStream.format("deltaSharing").option("responseFormat", "delta").table(<tableName>)

Ler tabelas gerenciadas de Iceberg compartilhadas

Important

Esse recurso está em uma versão prévia.

Ler tabelas de Iceberg gerenciadas compartilhadas é a mesma que ler tabelas compartilhadas, com estas exceções:

Suporte no compartilhamento aberto:

As instruções neste artigo se concentram na leitura de dados compartilhados usando interfaces de usuário do Azure Databricks, especificamente interfaces e sintaxe do Unity Catalog. Devido à limitação do suporte avançado de recursos Delta para conectores de compartilhamento Delta, não há suporte para consultar tabelas de Iceberg gerenciadas compartilhadas usando Python, Tableau e Power BI.

Alterar feed de dados:

O fluxo de dados de alteração não é suportado para tabelas de Iceberg gerenciadas.

limitações do Azure Databricks Iceberg:

As limitações da tabela Iceberg e da tabela Iceberg gerenciada se aplicam. Veja as limitações da tabela Iceberg.

Ler exibições compartilhadas

Ler exibições compartilhadas é o mesmo que ler tabelas compartilhadas, com essas exceções:

Restrições de exibições compartilhadas:

As exibições compartilhadas dão suporte apenas a um subconjunto de funções internas e operadores no Databricks. Consulte Funções com suporte em exibições compartilhadas de Databricks para Databricks.
Os destinatários não podem consultar mais de 20 exibições compartilhadas em uma consulta no compartilhamento Databricks-to-Databricks. As exibições compartilhadas não podem ser de mais de cinco provedores-compartilhamentos diferentes.
Quando o provedor é da mesma conta ou quando você usa computação sem servidor em uma conta diferente, não é possível consultar várias exibições dependentes do mesmo provedor em uma única consulta. Por exemplo, se view1 depender de view2 no lado do provedor e ambas as visualizações forem compartilhadas com você, você não poderá referenciar tanto view1 quanto view2 na mesma consulta.
Você pode executar transações em exibições compartilhadas. Consulte os requisitos e as limitações da transação.

Requisitos de nomenclatura:

O nome do catálogo que você usa para o catálogo compartilhado que contém a exibição não pode ser o mesmo que qualquer catálogo de provedores que contenha uma tabela referenciada pelo modo de exibição. Por exemplo, se a exibição compartilhada estiver contida em seu test catálogo e uma das tabelas do provedor referenciadas nesse modo de exibição estiver contida no catálogo do test provedor, a consulta resultará em um erro de conflito de namespace. Consulte Criar um catálogo com base em um compartilhamento.

Tempo limite do resultado da consulta:

Se você não tiver acesso direto aos dados subjacentes, Azure Databricks executará a materialização on-the-fly ao consultar a exibição. Quando essa materialização leva mais de 5 minutos, a consulta atinge o tempo limite. Alterne para a computação sem servidor para evitar essa limitação.

Histórico e streaming:

Você não pode consultar o histórico ou usar um modo de exibição como fonte de streaming.

Exibir o suporte no compartilhamento aberto:

As instruções neste artigo se concentram na leitura de dados compartilhados usando interfaces de usuário do Azure Databricks, especificamente interfaces e sintaxe do Unity Catalog. Você também pode consultar exibições compartilhadas usando o Apache Spark, Python e ferramentas de BI, como Tableau e Power BI.

Costs:

Para obter informações sobre como os custos de compartilhamento são computados, confira Como fazer para incorrer e verificar os custos de compartilhamento Delta?.

Ler tabelas de streaming compartilhadas e exibições materializadas

Ler tabelas de streaming compartilhadas e exibições materializadas é o mesmo que ler tabelas compartilhadas, com estas exceções:

Suporte no compartilhamento aberto:

As instruções nesta página se concentram na leitura de dados compartilhados usando interfaces de usuário do Azure Databricks, especificamente a sintaxe e as interfaces do Unity Catalog. Você também pode consultar tabelas de streaming compartilhadas e exibições materializadas usando o Apache Spark, Python e ferramentas de BI, como Tableau e Power BI. Consulte Ler dados compartilhados usando o compartilhamento aberto delta com tokens de portador.

Transações:

Você pode executar transações em exibições materializadas compartilhadas e tabelas de streaming. Consulte os requisitos e as limitações da transação.

Limitações do SQL:

Não há suporte para a função current_recipient.
Não há suporte para o comando DESCRIBE EXTENDED.

Mapeamento de coluna:

Se você estiver usando a computação clássica ao receber um compartilhamento de uma conta de Azure Databricks diferente, deverá especificar o responseFormat como abaixo ao consultar uma exibição materializada ou tabelas de streaming com mapeamento de coluna.

spark.read.option("responseFormat", "delta").table("catalog_name.schema_name.mv_name")

Se você estiver usando compute clássico ao compartilhar na mesma conta do Azure Databricks ou compute sem servidor em qualquer cenário, poderá consultar sem restrições.

Costs:

Para obter informações sobre como os custos de compartilhamento são computados, confira Como fazer para incorrer e verificar os custos de compartilhamento Delta?.

Exceções específicas da visão materializada

History:

Não é possível consultar o histórico.

Refresh:

Não é possível acessar o status de atualização e o cronograma de atualização da exibição materializada.

Exibir e transmitir a criação da tabela:

Não é possível criar tabelas de streaming em exibições materializadas compartilhadas.

Exceções específicas da tabela de streaming

History:

O histórico de consulta está disponível nas seguintes circunstâncias de compartilhamento do Databricks para Databricks:

Você está usando a computação sem servidor ao compartilhar com uma conta de Azure Databricks diferente.
Você está usando a computação clássica ou sem servidor ao compartilhar dentro da mesma conta Azure Databricks.

Para obter mais informações sobre cálculos diferentes, consulte Computação.

Refresh:

Você não pode acessar o status de atualização e o agendamento de atualização da tabela de streaming.

Ler UDFs Python compartilhadas

Ler UDFs de Python compartilhados é o mesmo que ler tabelas compartilhadas. Depois de criar um novo catálogo para o compartilhamento ou montar o compartilhamento em um catálogo existente, você poderá acessar e usar o Python UDF.

Leitura compartilhada `FeatureSpecs`

Ler FeatureSpecs compartilhado é o mesmo que ler tabelas compartilhadas. Depois de criar um novo catálogo para o compartilhamento ou montar o compartilhamento em um catálogo existente, você poderá implantar o FeatureSpec no ponto de extremidade de serviço de sua preferência. Para saber como criar um ponto de extremidade, consulte Criar um ponto de extremidade.

Se o provedor atualizar o sistema com uma nova dependência, mas não compartilhar a dependência com você, seu modelo irá falhar. Entre em contato com seu provedor de dados para verificar se há novas dependências.

Antes de servir o FeatureSpec, você deve criar uma loja online e publicar as tabelas dependentes em seu workspace. Para saber como criar repositórios online e publicar a tabela, consulte Os Repositórios de Recursos do Databricks Online.

Ler notebooks compartilhados

Para visualizar e clonar arquivos de notebooks compartilhados, use o Explorador do Catálogo.

Limitação de armazenamento: Se o armazenamento usar Pontos de Extremidade Privados, você não poderá ler notebooks compartilhados.

Permissões necessárias: proprietário ou usuário do catálogo com privilégio USE CATALOG no catálogo criado a partir do compartilhamento.

No workspace Azure Databricks, clique em Catalog.
No painel esquerdo, expanda o menu Catálogo, encontre e selecione o catálogo criado a partir do compartilhamento.
Na guia Outros ativos , você verá todos os arquivos de bloco de anotações compartilhados.
Clique no nome de um arquivo de notebook compartilhado para visualizá-lo.
(Opcional) Clique no botão Clonar para importar o arquivo de notebook compartilhado para seu workspace.
1. Na caixa de diálogo Clonar para, insira opcionalmente um Novo nome e selecione a pasta do workspace para a qual deseja clonar o arquivo do notebook.
2. Clique em Clonar.
3. Depois que o notebooks for clonado, uma caixa de diálogo será exibida para informar que ele foi clonado com sucesso. Clique em revelar no editor do notebook na caixa de diálogo para visualizá-lo no editor do notebooks.
Consulte os notebooks do Databricks.

Desmonte um compartilhamento para remover o ativo de dados de seu catálogo.

Permissões necessárias: Usuário com USE CATALOG e MANAGE privilégios no catálogo compartilhado.

No workspace Azure Databricks, clique em Catalog para abrir o Catalog Explorer.
Na parte superior do painel Catálogo, clique no e selecione Compartilhamento Delta.

Como alternativa, no canto superior direito, clique em Compartilhar > Delta Sharing.
Na guia Compartilhado comigo, localize e selecione o provedor.
Clique no na linha de compartilhamento.
Clique Desmontar compartilhamento.
Clique em Desmontar.

Comentários

Esta página foi útil?

Last updated on 2026-04-30

Leitura do compartilhamento de dados usando o Delta Sharing do Databricks para Databricks (para destinatários)

Como faço para disponibilizar dados compartilhados para minha equipe?

Permissões necessárias

Exibir provedores e compartilhamentos

Exibir todos os provedores que compartilharam dados com você

Ver detalhes do provedor

Exibir compartilhamentos

Acessar dados em uma tabela ou volume compartilhado

Criar um catálogo com base em um compartilhamento

Gerenciador de Catálogos

SQL

CLI

Gerenciar permissões para os esquemas, tabelas e volumes em um catálogo do Delta Sharing

Ler dados em uma tabela compartilhada

Ler dados em uma tabela estrangeira compartilhada ou em um esquema estrangeiro

Ler dados em uma tabela de Iceberg estrangeira compartilhada

Ler dados em um volume compartilhado

Ler dados protegidos por ABAC e aplicar políticas ABAC

Ler colunas de acompanhamento de linhas em tabelas compartilhadas

Carregar um modelo compartilhado para inferência

Consultar os dados de histórico de uma tabela

Consultar uma tabela usando o Streaming Estruturado do Apache Spark

Exemplos de consultas de Streaming Estruturado

Scala

Python

Aplicar filtros de linha e máscaras de coluna

Ler as tabelas com vetores de exclusão ou mapeamento de colunas ativados

Ler tabelas gerenciadas de Iceberg compartilhadas

Ler exibições compartilhadas

Ler tabelas de streaming compartilhadas e exibições materializadas

Exceções específicas da visão materializada

Exceções específicas da tabela de streaming

Ler UDFs Python compartilhadas

Leitura compartilhada FeatureSpecs

Ler notebooks compartilhados

Desmontar um compartilhamento

Comentários

Recursos adicionais

Leitura compartilhada `FeatureSpecs`