Editar

Perguntas mais frequentes sobre o Azure Synapse Link para o Azure Cosmos DB

APLICA-SE A: NoSQL MongoDB Gremlin

O Azure Synapse Link for Azure Cosmos DB cria uma integração total entre o Azure Cosmos DB e o Azure Synapse Analytics. Ele permite que os clientes executem análises quase em tempo real sobre seus dados operacionais com isolamento total de desempenho de suas cargas de trabalho transacionais e sem um pipeline de ETL. Este artigo responde a perguntas mais frequentes sobre o Synapse Link para o Azure Cosmos DB.

FAQ Gerais

O Azure Synapse Link tem suporte para a API do Azure Cosmos DB para NoSQL e para a API do Azure Cosmos DB para MongoDB. O suporte para a API do Azure Cosmos DB para Gremlin está agora em pré-visualização.

Sim, para contas do Azure Cosmos DB de várias regiões, os dados armazenados no repositório analítico também são distribuídos globalmente. A loja analítica existirá em todas as regiões onde você também tem armazenamento transacional. Independentemente de ser uma única região de escrita ou várias regiões de escrita, as consultas analíticas executadas no Azure Synapse Analytics podem ser servidas a partir da região local mais próxima.

Quando o Azure Synapse Link está habilitado para uma conta de várias regiões, o repositório analítico é criado em todas as regiões escolhidas pelos clientes para replicação geográfica transacional. Os dados subjacentes são otimizados para taxa de transferência e consistência transacional no repositório transacional.

O repositório analítico é suportado em todas as regiões do Azure Cosmos DB?

Sim.

Atualmente, depois que o recurso Synapse Link estiver ativado no nível da conta, você não poderá desativá-lo. Não há implicações de faturamento se o recurso Synapse Link estiver habilitado no nível da conta e não houver contêineres habilitados para armazenamento analítico.

Se você precisar desativar o recurso, exclua e recrie uma nova conta do Azure Cosmos DB, migrando os dados, se necessário.

Sim, você pode usar a CLI do Azure ou o PowerShell para definir o TTL analítico como 0, o que desativará o Synapse Link do contêiner e excluirá permanentemente o repositório analítico. Observe que, atualmente, essa ação não pode ser desfeita e bloqueará a migração da conta do banco de dados para o backup contínuo.

O repositório analítico tem algum impacto nos SLAs transacionais do Azure Cosmos DB?

Não, não há impacto.

Sim, para as APIs para contas de banco de dados MongoDB e NoSQLs. Use CLI ou PowerShell para contas MongoDB.

Repositório analítico do Azure Cosmos DB

Posso ativar o armazenamento analítico em recipientes existentes?

Sim. Atualmente, você pode usar o portal do Azure, a CLI do Azure, o PowerShell ou os SDKs do Azure Cosmos DB para habilitar o armazenamento analítico para a API existente para contêineres NoSQL. E você pode usar a CLI do Azure ou o PowerShell para a API existente para coleções do MongoDB.

Posso ver arquivos de repositório analítico usando o Azure Data Explorer?

N.º O armazenamento analítico é mantido em uma conta de armazenamento localizada em uma assinatura interna do Cosmos DB. Os clientes não têm acesso a essa conta de armazenamento e precisam usar os tempos de execução do Azure Synapse para ler os dados.

Posso desabilitar o repositório analítico em meus contêineres do Azure Cosmos DB?

Sim, o armazenamento analítico pode ser desabilitado na API para contêineres NoSQL e na API para coleções MongoDB, usando PowerShell ou CLI. Atualmente, essa ação não pode ser desfeita.

Há suporte para armazenamento analítico para contêineres do Azure Cosmos DB com taxa de transferência provisionada em escala automática?

Sim, o armazenamento analítico pode ser habilitado em contêineres com taxa de transferência provisionada em escala automática.

Há algum efeito nas RUs provisionadas do repositório transacional do Azure Cosmos DB?

O Azure Cosmos DB garante o isolamento de desempenho entre as cargas de trabalho transacionais e analíticas. Habilitar o repositório analítico em um contêiner não afeta o RU/s do Azure Cosmos DB. As transações (leitura ou gravação) e os custos de armazenamento para o armazenamento analítico são cobrados separadamente. Consulte os preços do repositório analítico do Azure Cosmos DB para obter mais detalhes.

Posso restringir o acesso de rede ao repositório analítico do Azure Cosmos DB?

Sim, você pode configurar um ponto de extremidade privado gerenciado e restringir o acesso à rede do repositório analítico para a rede virtual gerenciada do Azure Synapse. Os endpoints privados gerenciados estabelecem um link privado para sua loja analítica.

Você pode adicionar pontos de extremidade privados do repositório transacional e do repositório analítico à mesma conta do Azure Cosmos DB em um espaço de trabalho do Azure Synapse Analytics. Se você quiser executar apenas consultas analíticas, talvez queira habilitar apenas o ponto de extremidade privado analítico no espaço de trabalho do Synapse Analytics.

Posso usar chaves gerenciadas pelo cliente com o repositório analítico do Azure Cosmos DB?

Você pode criptografar perfeitamente os dados em repositórios transacionais e analíticos usando as mesmas chaves gerenciadas pelo cliente de maneira automática e transparente. Para usar chaves gerenciadas pelo cliente com o repositório analítico, você precisa usar a identidade gerenciada atribuída ao sistema da sua conta do Azure Cosmos DB em sua política de acesso ao Cofre da Chave do Azure. Você deve então ser capaz de ativar o armazenamento analítico em sua conta. Clique aqui para mais informações.

As operações de exclusão e atualização no repositório transacional são refletidas no repositório analítico?

Sim, exclusões e atualizações dos dados no repositório transacional são refletidas no repositório analítico. Você pode configurar o tempo de vida (TTL) no contêiner para incluir dados históricos para que o repositório analítico retenha todas as versões de itens que satisfaçam os critérios analíticos de TTL. Consulte a visão geral do TTL analítico para obter mais detalhes.

Posso conectar-me ao repositório analítico a partir de mecanismos de análise diferentes do Azure Synapse Analytics?

Só pode aceder e executar consultas no arquivo analítico com os vários tempos de execução disponibilizados pelo Azure Synapse Analytics. Pode consultar e analisar o arquivo analítico com:

  • Synapse Spark com suporte total para Scala, Python, SparkSQL e C#. O Synapse Spark é fundamental para os cenários de ciência e engenharia de dados
  • Pool SQL sem servidor com linguagem T-SQL e suporte para ferramentas de BI familiares (por exemplo, Power BI Premium, etc.)

Posso me conectar ao repositório analítico a partir do Synapse SQL provisionado?

No momento, o repositório analítico não pode ser acessado a partir do Synapse SQL provisionado.

Posso reescrever os resultados da agregação de consultas do Synapse de volta ao repositório analítico?

Não, o repositório analítico é somente leitura.

A replicação de sincronização automática do repositório transacional para o repositório analítico é assíncrona ou síncrona e quais são as latências?

A latência de sincronização automática geralmente é de 2 minutos. Em casos de banco de dados de taxa de transferência compartilhado com um grande número de contêineres, a latência de sincronização automática de contêineres individuais pode ser maior e levar até 5 minutos.

Existem cenários em que os itens do repositório transacional não são propagados automaticamente para o repositório analítico?

Se itens específicos em seu contêiner violarem o esquema bem definido para análise, eles não serão incluídos no repositório analítico.

Posso particionar os dados no repositório analítico de forma diferente do armazenamento transacional?

Por padrão, o repositório analítico não é particionado. Se suas consultas analíticas tiverem usado filtros com freqüência, use o particionamento personalizado para obter um melhor desempenho. Clique aqui para mais informações.

Posso personalizar ou substituir a forma como os dados transacionais são transformados em formato colunar no repositório analítico?

Atualmente, não é possível transformar os itens de dados quando eles são propagados automaticamente do repositório transacional para o repositório analítico. Se você tiver cenários bloqueados por essa limitação, envie um email para a equipe do Azure Cosmos DB.

Posso acessar o repositório analítico com SDKs do Azure Cosmos DB?

Não, você não pode acessar o repositório analítico com os SDKs do Azure Cosmos DB. Você precisa usar os pools sem servidor do Azure Synapse Analytics, Spark ou SQL.

Posso acessar o repositório analítico com APIs REST do Azure Cosmos DB?

Não, não é possível acessar o repositório analítico com as APIs REST do Azure Cosmos DB. Você precisa usar os pools sem servidor do Azure Synapse Analytics, Spark ou SQL.

O Terraform suporta o arquivo analítico?

Atualmente, o Terraform não suporta contentores do arquivo analítico. Verifique Terraform GitHub Issues para obter mais informações.

Você precisa de pelo menos a função de Operador para habilitar o Synapse Link, por consequência para habilitar o armazenamento analítico, no nível de contêiner ou coleta.

Tempo de vida analítico (TTL)

O TTL para dados analíticos é suportado no nível do contêiner e do item?

No momento, o TTL para dados analíticos só pode ser configurado no nível do contêiner e não há suporte para definir o TTL analítico no nível do item.

Depois de definir o TTL analítico de nível de contêiner em um contêiner do Azure Cosmos DB, posso alterar para um valor diferente posteriormente?

Sim, o TTL analítico pode ser atualizado para qualquer valor válido. Consulte o artigo TTL analítico para obter mais detalhes sobre o TTL analítico.

Posso atualizar ou excluir um item do repositório analítico depois que ele tiver sido retirado do repositório transacional?

Todas as atualizações e exclusões transacionais são copiadas para o repositório analítico, mas se o item tiver sido removido do repositório transacional, ele não poderá ser atualizado no repositório analítico. Para saber mais, consulte o artigo TTL analítico.

Faturação

O modelo de cobrança do Azure Synapse Link inclui os custos incorridos usando o repositório analítico do Azure Cosmos DB e o tempo de execução do Synapse. Para saber mais, consulte os artigos de preços da loja analítica do Azure Cosmos DB e do Azure Synapse Analytics.

Nenhum. As cobranças só ocorrem quando você cria um contêiner habilitado para armazenamento analítico e começa a carregar dados.

Segurança

Quais são as maneiras de autenticar com o repositório analítico?

A autenticação com o repositório analítico é a mesma que um repositório transacional. Para um determinado banco de dados, você pode autenticar com a chave primária ou somente leitura. Você pode usar serviços vinculados no Azure Synapse Studio para impedir a colagem das chaves do Azure Cosmos DB nos blocos de anotações do Spark. O acesso a este Serviço Vinculado está disponível para todos que têm acesso ao espaço de trabalho. Ao usar pools SQL sem servidor Synapse, você pode consultar o repositório analítico do Azure Cosmos DB pré-criando e referenciando credenciais SQL na função OPENROWSET. Para saber mais, consulte Consulta com um pool SQL sem servidor no artigo Azure Synapse Link .

Sim, o Azure Synapse Link dá suporte à configuração de chaves gerenciadas pelo cliente usando a identidade gerenciada da sua conta do Azure Cosmos DB. Você pode criptografar perfeitamente os dados em repositórios transacionais e analíticos usando as mesmas chaves gerenciadas pelo cliente de maneira automática e transparente. Para saber mais, consulte o artigo Configurando chaves gerenciadas pelo cliente usando as identidades gerenciadas das contas do Azure Cosmos DB.

Sim, você pode controlar o acesso da rede aos dados nos armazenamentos transacionais e analíticos de forma independente. O isolamento de rede é feito usando pontos de extremidade privados gerenciados separados para cada loja, dentro de redes virtuais gerenciadas nos espaços de trabalho do Azure Synapse. Para saber mais, consulte o artigo Como configurar pontos de extremidade privados para armazenamento analítico.

Normalmente, 403s são devido a configurações de rede/firewall que impedem os usuários de acessar dados específicos, mesmo a partir do portal. A causa mais comum para esse problema é que a etapa 1 do processo de habilitar isolamento de rede usando pontos de extremidade privados não foi executada com a CLI do Azure ou o PowerShell. Mais detalhes aqui.

Tempos de execução da sinapse

Quais são os tempos de execução do Synapse atualmente suportados para acessar o repositório analítico do Azure Cosmos DB?

Tempo de execução do Azure Synapse Suporte atual
Pools do Azure Synapse Spark Leitura, Gravação (através do repositório transacional), Tabela, Vista Temporária
Azure Synapse serverless SQL pool Ler, Ver
Azure Synapse SQL provisionado Não disponível

As tabelas do Spark são sincronizadas com as tabelas do SQL Serverless da mesma forma que fazem com o Azure Data Lake?

Atualmente, esse recurso não está disponível.

Posso fazer streaming estruturado do Spark a partir da loja analítica?

Atualmente, o suporte de streaming estruturado do Spark para o Azure Cosmos DB é implementado usando a funcionalidade de feed de alterações do repositório transacional e ainda não é suportado pelo repositório analítico.

O streaming é suportado?

Não suportamos streaming de dados do repositório analítico.

Azure Synapse Studio

No Azure Synapse Studio, como posso reconhecer se estou conectado a um contêiner do Azure Cosmos DB com o repositório de análise habilitado?

Um contêiner do Azure Cosmos DB habilitado com armazenamento analítico tem o seguinte ícone:

Contêiner do Azure Cosmos DB habilitado com ícone de repositório analítico

Um contêiner de armazenamento transacional é representado com o seguinte ícone:

Contêiner do Azure Cosmos DB habilitado com ícone de repositório transacional

Como você passa as credenciais do Azure Cosmos DB do Azure Synapse Studio?

Atualmente, as credenciais do Azure Cosmos DB são passadas durante a criação do serviço vinculado pelo usuário que tem acesso aos bancos de dados do Azure Cosmos DB. O acesso a essa loja está disponível para outros usuários que têm acesso ao espaço de trabalho.

Posso usar o SQL Server Management Studio para consultar o repositório analítico usando o pool SQL Synapse Serverless?

Sim.

Próximos passos