Consultar Azure Cosmos DB dados usando um pool de SQL sem servidor

Tip

Microsoft Fabric Data Warehouse é um armazém relacional de escala empresarial com base de data lake, arquitetura pronta para o futuro, IA integrada e novos recursos. Se você não estiver familiarizado com o data warehouse, comece com Fabric Data Warehouse. As cargas de trabalho existentes de pools de SQL dedicados podem ser atualizadas para Fabric para acessar novos recursos em ciência de dados, análise em tempo real e relatórios.

Importante

Link do Synapse para Cosmos DB não tem mais suporte para novos projetos. Não use esse recurso.

Use o Azure Cosmos DB Mirroring para o Microsoft Fabric, que agora está disponível de forma geral. O espelhamento fornece os mesmos benefícios de ETL zero e é totalmente integrado ao Microsoft Fabric. Saiba mais na Visão Geral do Espelhamento do Cosmos DB.

Um pool de SQL sem servidor permite que você analise dados em seus contêineres de Azure Cosmos DB habilitados com Azure Link do Synapse quase em tempo real sem afetar o desempenho de suas cargas de trabalho transacionais. Ele oferece uma sintaxe Transact-SQL (T-SQL) conhecida para consultar dados do repositório analítico e conectividade integrada a uma grande variedade de ferramentas de business intelligence (BI) e ad hoc por meio da interface T-SQL.

Para consultar o Azure Cosmos DB, toda a área de superfície SELECT tem suporte por meio da função OPENROWSET, que inclui a maioria dos operadores e funções do SQL. Você também pode armazenar resultados da consulta que lê dados do Azure Cosmos DB juntamente com dados no Armazenamento de Blobs do Azure ou Azure Data Lake Storage utilizando o comando Criar Tabela Externa como Selecionar (CETAS). No momento, não é possível armazenar os resultados da consulta do pool de SQL sem servidor para Azure Cosmos DB usando o CETAS.

Este artigo explica como escrever uma consulta com um pool de SQL sem servidor que consulta dados de contêineres Azure Cosmos DB habilitados com o Azure Link do Synapse. Em seguida, você pode saber mais sobre como criar exibições de pool de SQL sem servidor em contêineres de Azure Cosmos DB e conectá-los a modelos Power BI em this tutorial. Este tutorial usa um contêiner com um esquema Azure Cosmos DB bem definido. Você também pode conferir o módulo de aprendizado sobre como consultar o Azure Cosmos DB com SQL Serverless para Azure Synapse Analytics.

Pré-requisitos

Prepare o repositório analítico:
- Habilite o armazenamento analítico em seus containers do Azure Cosmos DB.
- Obtenha a cadeia de conexão com uma chave somente leitura que você pode usar para consultar o repositório analítico.
- Obtenha a chave somente leitura que será usada para acessar o contêiner do Azure Cosmos DB.
Aplique todas as práticas recomendadas, como:
- Verifique se o armazenamento analítico Azure Cosmos DB está na mesma região que o pool de SQL sem servidor.
- Verifique se o aplicativo cliente (Power BI, serviço de Análise) está na mesma região que o pool de SQL sem servidor.
- Ao retornar uma grande quantidade de dados (mais de 80 GB), considere usar uma camada de cache, como Analysis Services, e carregue as partições com menos de 80 GB no modelo de Analysis Services.
- Ao filtrar dados usando colunas de strings, use a função OPENROWSET com a cláusula WITH explícita que tenha os tipos mais simples possíveis. Por exemplo, não use VARCHAR(1000) se você souber que a propriedade tem até cinco caracteres.

Visão geral

O pool de SQL sem servidor permite consultar o armazenamento analítico do Azure Cosmos DB usando a função OPENROWSET.

OPENROWSET( 
       'CosmosDB',
       '<SQL connection string for Azure Cosmos DB>',
       <other parameters>
    )  [ < with clause > ] AS alias

A string de conexão SQL para o Azure Cosmos DB inclui os seguintes componentes:

account - O nome da conta do Azure Cosmos DB que você está visando.
banco de dados – O nome do contêiner, especificado sem aspas na sintaxe OPENROWSET. Se o nome do contêiner contiver caracteres especiais (por exemplo, um traço -), ele deverá ser colocado entre colchetes ([]).
região (opcional) – a região do armazenamento analítico do Cosmos DB. Caso omitida, a região primária do contêiner será usada.
ponto de extremidade (opcional) – o URI do ponto de extremidade do Cosmos DB (por exemplo https://<account name>.documents.azure.us) que será necessário se sua conta do Cosmos DB não seguir o formato padrão *.documents.azure.com .

Importante

O endpoint parâmetro é necessário para contas que não correspondem ao formato padrão *.documents.azure.com . Por exemplo, se sua conta de Azure Cosmos DB terminar com .documents.azure.us, certifique-se de adicionar endpoint=https://<account name>.documents.azure.us na cadeia de conexão. Inclua o prefixo https://.

Essas propriedades podem ser identificadas no cadeia de conexão padrão do Cosmos DB, por exemplo:

AccountEndpoint=https://<database account name>.documents.azure.com:443/;AccountKey=<database account master key>;

A cadeia de conexão do SQL pode ser formatada da seguinte maneira:

account=<database account name>;database=<database name>;region=<region name>

Esse cadeia de conexão não inclui as informações de autenticação necessárias para se conectar ao armazenamento analítico do Cosmos DB. Informações adicionais são necessárias dependendo do tipo de autenticação usado:

Se OPENROWSET usar a identidade gerenciada do workspace para acessar o repositório analítico, você deverá adicionar a propriedade AuthType.
Se OPENROWSET usar uma chave de conta embutida, você deverá adicionar a propriedade key. Isso permite que você consulte Azure Cosmos DB coleções sem a necessidade de preparar credenciais.
Em vez de incluir informações de autenticação no cadeia de conexão, OPENROWSET pode fazer referência a uma credencial que contém a chave da conta Azure Cosmos DB. Essa abordagem pode ser usada para criar exibições em coleções de Azure Cosmos DB.

Essas opções são descritas abaixo.

OPENROWSET com chave ou identidade gerenciada
OPENROWSET com credencial

O pool de SQL sem servidor permite consultar o armazenamento analítico do Cosmos DB e autenticar com a chave de conta original do Cosmos DB ou permitir que a identidade gerenciada do Synapse acesse o armazenamento analítico do Cosmos DB. Você pode usar a seguinte sintaxe neste cenário:

OPENROWSET( 
       'CosmosDB',
       '<SQL connection string for Azure Cosmos DB>',
       <Container name>
    )  [ < with clause > ] AS alias

Além das propriedades comuns na string de conexão do SQL descritas acima (conta, database, region e endpoint), você precisa adicionar uma das seguintes opções:

AuthType – defina essa opção para ManagedIdentity se acessar o Cosmos DB usando a Identidade Gerenciada do workspace do Synapse.
chave – a chave mestra para acessar dados do Cosmos DB, usada se não estiver utilizando a identidade gerenciada do workspace do Synapse.

Os exemplos de cadeias de conexão são mostrados na tabela a seguir:

Tipo de autenticação	Cadeia de conexão
Identidade gerenciada do workspace do Synapse	`account=<account name>;database=<db name>;region=<region name>;AuthType=ManagedIdentity`
Chave mestra da conta do Cosmos DB	`account=<account name>;database=<db name>;region=<region name>;key=<account master key>`

Em vez de definir a chave de acesso em OPENROWSET, você pode colocá-la na credencial separada e usar OPENROWSET a sintaxe que faz referência a uma credencial:

OPENROWSET( 
       PROVIDER = 'CosmosDB',
       CONNECTION = '<SQL connection string for Azure Cosmos DB without account key>',
       OBJECT = '<Container name>',
       [ CREDENTIAL | SERVER_CREDENTIAL ] = '<credential name>'
    )  [ < with clause > ] AS alias

A cadeia de conexão SQL para o Azure Cosmos DB não contém uma chave neste caso. O cadeia de conexão tem o seguinte formato:

account=<database account name>;database=<database name>;region=<region name>

A chave mestra da conta de banco de dados é adicionada à credencial no escopo do banco de dados ou à credencial em nível de servidor.

Importante

Verifique se você está usando uma ordenação de banco de dados UTF-8, por exemplo, Latin1_General_100_CI_AS_SC_UTF8, porque os valores de cadeia de caracteres em um repositório analítico Azure Cosmos DB são codificados como texto UTF-8. Uma incompatibilidade entre a codificação de texto no arquivo e no agrupamento pode causar erros inesperados de conversão de texto. Você pode alterar facilmente o agrupamento padrão do banco de dados atual usando a instrução T-SQL alter database current collate Latin1_General_100_CI_AI_SC_UTF8.

Observação

Um pool de SQL sem servidor não dá suporte à consulta de um repositório transacional Azure Cosmos DB.

Amostra do conjunto de dados

Os exemplos neste artigo são baseados em dados do Centro Europeu de Prevenção e Controle de Doenças (ECDC) Casos de COVID-19 e do Conjunto de Dados de Pesquisa Aberta COVID-19 (CORD-19).

Para acompanhar este artigo mostrando como consultar Azure Cosmos DB dados com um pool de SQL sem servidor, certifique-se de criar os seguintes recursos:

Uma conta de banco de dados Azure Cosmos DB que esteja habilitada para o Link do Azure Synapse
Um banco de dados Azure Cosmos DB chamado covid
Dois contêineres Azure Cosmos DB chamados Ecdc e Cord19 carregados com os conjuntos de dados de exemplo anteriores

Observe que essa conexão não garante o desempenho, pois a conta pode estar localizada em uma região remota em relação ao ponto de extremidade SQL do Synapse.

Explorar dados Azure Cosmos DB com inferência automática de esquema

A maneira mais fácil de explorar dados em Azure Cosmos DB é usando a funcionalidade de inferência de esquema automático. Ao omitir a cláusula WITH da instrução OPENROWSET, você pode instruir o pool de SQL sem servidor a autodetectar (inferir) o esquema do repositório analítico do contêiner do Azure Cosmos DB.

OPENROWSET com chave
OPENROWSET com credencial

Importante

No script, substitua esses valores por seus próprios valores:

your-cosmosdb - o nome da sua conta do Cosmos DB
yourcosmosdbkey - sua chave de conta do Cosmos DB

SELECT TOP 10 *
FROM OPENROWSET( 
       'CosmosDB',
       'Account=your-cosmosdb;Database=covid;Key=yourcosmosdbkey',
       Ecdc) as documents

/*  Setup - create server-level or database scoped credential with Azure Cosmos DB account key:
    CREATE CREDENTIAL MyCosmosDbAccountCredential
    WITH IDENTITY = 'SHARED ACCESS SIGNATURE', SECRET = 'yourcosmosdbkey';
*/
SELECT TOP 10 *
FROM OPENROWSET(
      PROVIDER = 'CosmosDB',
      CONNECTION = 'Account=your-cosmosdb;Database=covid',
      OBJECT = 'Ecdc',
      SERVER_CREDENTIAL = 'MyCosmosDbAccountCredential'
    ) with ( date_rep varchar(20), cases bigint, geo_id varchar(6) ) as rows

No exemplo anterior, instruimos o pool de SQL sem servidor a se conectar ao banco de dados covid na conta Azure Cosmos DB MyCosmosDbAccount autenticado usando a chave Azure Cosmos DB (o fictício no exemplo anterior). Em seguida, acessamos o repositório analítico do contêiner Ecdc na West US 2 região. Como não há projeção de propriedades específicas, a função OPENROWSET retorna todas as propriedades dos itens de Azure Cosmos DB.

Supondo que os itens no contêiner Azure Cosmos DB tenham propriedades date_rep, cases e geo_id, os resultados dessa consulta são mostrados na tabela a seguir:

date_rep	Casos	geo_id
2020-08-13	254	RS
2020-08-12	235	RS
11-08-2020	163	RS

Se você precisar explorar dados do outro contêiner no mesmo banco de dados Azure Cosmos DB, poderá usar o mesmo cadeia de conexão e referenciar o contêiner necessário como o terceiro parâmetro:

SELECT TOP 10 *
FROM OPENROWSET( 
       'CosmosDB',
       'Account=your-cosmosdb;Database=covid;Key=yourcosmosdbkey',
       Cord19) as cord19

Especificar explicitamente o esquema

Embora a funcionalidade de inferência de esquema automático em OPENROWSET ofereça uma experiência simples e fácil de usar, seus cenários de negócios podem exigir que você especifique explicitamente o esquema para extrair apenas as propriedades relevantes dos dados do Azure Cosmos DB.

A função OPENROWSET permite especificar explicitamente quais propriedades você deseja ler dos dados no contêiner e especificar os tipos de dados.

Vamos imaginar que importamos alguns dados do conjunto de dados ECDC COVID com a seguinte estrutura em Azure Cosmos DB:

{"date_rep":"2020-08-13","cases":254,"countries_and_territories":"Serbia","geo_id":"RS"}
{"date_rep":"2020-08-12","cases":235,"countries_and_territories":"Serbia","geo_id":"RS"}
{"date_rep":"2020-08-11","cases":163,"countries_and_territories":"Serbia","geo_id":"RS"}

Esses documentos JSON simples em Azure Cosmos DB podem ser representados como um conjunto de linhas e colunas no SQL do Synapse. A função OPENROWSET permite especificar um subconjunto de propriedades que você deseja ler e os tipos de coluna exatos na cláusula WITH:

OPENROWSET com chave
OPENROWSET com credencial

SELECT TOP 10 *
FROM OPENROWSET(
      'CosmosDB',
      'Account=your-cosmosdb;Database=covid;Key=yourcosmosdbkey',
       Ecdc
    ) with ( date_rep varchar(20), cases bigint, geo_id varchar(6) ) as rows

/*  Setup - create server-level or database scoped credential with Azure Cosmos DB account key:
    CREATE CREDENTIAL MyCosmosDbAccountCredential
    WITH IDENTITY = 'SHARED ACCESS SIGNATURE', SECRET = 'yourcosmosdbkey';
*/
SELECT TOP 10 *
FROM OPENROWSET(
      PROVIDER = 'CosmosDB',
      CONNECTION = 'Account=your-cosmosdb;Database=covid',
      OBJECT = 'Ecdc',
      SERVER_CREDENTIAL = 'MyCosmosDbAccountCredential'
    ) with ( date_rep varchar(20), cases bigint, geo_id varchar(6) ) as rows

O resultado dessa consulta pode ser semelhante à seguinte tabela:

date_rep	Casos	geo_id
2020-08-13	254	RS
2020-08-12	235	RS
11-08-2020	163	RS

Para obter mais informações sobre os tipos SQL que devem ser usados para valores Azure Cosmos DB, consulte Azure Cosmos DB para mapeamentos de tipo SQL no final deste artigo.

Criar visualização

A criação de exibições nos bancos de dados padrão ou master não é recomendada nem tem suporte. Você precisa criar um banco de dados de usuário para suas visualizações.

Depois de identificar o esquema, você pode preparar uma exibição sobre seus dados do Azure Cosmos DB. Você deve adicionar a chave de conta do Azure Cosmos DB a uma credencial separada e referenciar essa credencial na função OPENROWSET. Não mantenha a chave de conta na definição de exibição.

CREATE CREDENTIAL MyCosmosDbAccountCredential
WITH IDENTITY = 'SHARED ACCESS SIGNATURE', SECRET = 'yourcosmosdbkey';
GO
CREATE OR ALTER VIEW Ecdc
AS SELECT *
FROM OPENROWSET(
      PROVIDER = 'CosmosDB',
      CONNECTION = 'Account=your-cosmosdb;Database=covid',
      OBJECT = 'Ecdc',
      SERVER_CREDENTIAL = 'MyCosmosDbAccountCredential'
    ) with ( date_rep varchar(20), cases bigint, geo_id varchar(6) ) as rows

Não use OPENROWSET sem um esquema explicitamente definido, pois isso pode afetar seu desempenho. Use os menores tamanhos possíveis para suas colunas (por exemplo, VARCHAR(100) em vez de VARCHAR(8000) padrão). Você deve usar um agrupamento UTF-8 como agrupamento de banco de dados padrão ou defini-lo como um agrupamento de coluna explícito para evitar um problema de conversão UTF-8. O agrupamento Latin1_General_100_BIN2_UTF8 fornece o melhor desempenho ao filtrar os dados usando algumas colunas de cadeia de caracteres.

Ao consultar a exibição, você pode encontrar erros ou resultados inesperados. O modo de exibição faz referência a colunas ou objetos que provavelmente foram modificados ou não existem mais. Você precisa ajustar manualmente a definição de exibição para se alinhar com as alterações de esquema subjacentes. Tenha em mente que isso pode acontecer ao usar a inferência automática de esquema na exibição ao especificar explicitamente o esquema.

Consultar objetos aninhados

Com Azure Cosmos DB, você pode representar modelos de dados mais complexos compondo-os como objetos aninhados ou matrizes. A capacidade de sincronização automática do Azure Link do Synapse para Azure Cosmos DB gerencia a representação do esquema no repositório analítico de forma incorporada, o que inclui o tratamento de tipos de dados aninhados que permitem consultas ricas do pool de SQL sem servidor.

Por exemplo, o conjunto de dados CORD-19 tem documentos JSON que seguem esta estrutura:

{
    "paper_id": <str>,                   # 40-character sha1 of the PDF
    "metadata": {
        "title": <str>,
        "authors": <array of objects>    # list of author dicts, in order
        ...
     }
     ...
}

Os objetos aninhados e as matrizes em Azure Cosmos DB são representados como cadeias de caracteres JSON no resultado da consulta quando a função OPENROWSET os lê. Você pode especificar os caminhos aos valores aninhados nos objetos usando a cláusula WITH:

SELECT TOP 10 *
FROM OPENROWSET( 
       'CosmosDB',
       'Account=your-cosmosdb;Database=covid;Key=yourcosmosdbkey',
       Cord19)
WITH (  paper_id    varchar(8000),
        title        varchar(1000) '$.metadata.title',
        metadata     varchar(max),
        authors      varchar(max) '$.metadata.authors'
) AS docs;

O resultado dessa consulta pode ser semelhante à seguinte tabela:

paper_id	título	metadados	autores
bb11206963e831f…	Informações complementares Um eco-epidemi...	`{"title":"Supplementary Informati…`	`[{"first":"Julien","last":"Mélade","suffix":"","af…`
bb1206963e831f1…	O uso do Convalescent Sera em Immune-E...	`{"title":"The Use of Convalescent…`	`[{"first":"Antonio","last":"Lavazza","suffix":"", …`
bb378eca9aac649…	Tylosema esculentum (Marama) Tuber e B...	`{"title":"Tylosema esculentum (Ma…`	`[{"first":"Walter","last":"Chingwaru","suffix":"",…`

Para saber mais, consulte Analisar tipos de dados complexos no Azure Synapse Analytics ou Consultar tipos aninhados em arquivos Parquet e JSON usando o pool de SQL sem servidor.

Importante

Se você vir caracteres inesperados em seu texto, como MÃƒÂ©lade em vez de Mélade, então o agrupamento do banco de dados não está definido para o agrupamento UTF-8. Você pode alterar o agrupamento do banco de dados para um agrupamento UTF-8 usando uma instrução SQL como ALTER DATABASE MyLdw COLLATE LATIN1_GENERAL_100_CI_AS_SC_UTF8.

Mesclar matrizes aninhadas

Os dados do Azure Cosmos DB podem ter subconjuntos aninhados como a matriz do autor de um conjunto de dados CORD-19:

{
    "paper_id": <str>,                      # 40-character sha1 of the PDF
    "metadata": {
        "title": <str>,
        "authors": [                        # list of author dicts, in order
            {
                "first": <str>,
                "middle": <list of str>,
                "last": <str>,
                "suffix": <str>,
                "affiliation": <dict>,
                "email": <str>
            },
            ...
        ],
        ...
}

Em alguns casos, talvez seja necessário unir as propriedades do item superior (metadados) com todos os elementos da matriz (autores). Um pool de SQL sem servidor permite nivelar estruturas aninhadas aplicando a função OPENJSON na matriz aninhada:

SELECT
    *
FROM
    OPENROWSET(
      'CosmosDB',
      'Account=your-cosmosdb;Database=covid;Key=yourcosmosdbkey',
       Cord19
    ) WITH ( title varchar(1000) '$.metadata.title',
             authors varchar(max) '$.metadata.authors' ) AS docs
      CROSS APPLY OPENJSON ( authors )
                  WITH (
                       first varchar(50),
                       last varchar(50),
                       affiliation nvarchar(max) as json
                  ) AS a

O resultado dessa consulta pode ser semelhante à seguinte tabela:

título	autores	primeiro	último	afiliação
Informações complementares Um eco-epidemi...	`[{"first":"Julien","last":"Mélade","suffix":"","affiliation":{"laboratory":"Centre de Recher…`	Julien	Mélade	`{"laboratory":"Centre de Recher…`
Informações complementares Um eco-epidemi...	`[{"first":"Nicolas","last":"4#","suffix":"","affiliation":{"laboratory":"","institution":"U…`	Nicolas	4#	`{"laboratory":"","institution":"U…`
Informações complementares Um eco-epidemi...	`[{"first":"Beza","last":"Ramazindrazana","suffix":"","affiliation":{"laboratory":"Centre de Recher…`	Beza	Ramazindrazana	`{"laboratory":"Centre de Recher…`
Informações complementares Um eco-epidemi...	`[{"first":"Olivier","last":"Flores","suffix":"","affiliation":{"laboratory":"UMR C53 CIRAD, …`	Olivier	Flores	`{"laboratory":"UMR C53 CIRAD, …`

Importante

Azure Cosmos DB para mapeamentos de tipo SQL

Embora Azure Cosmos DB repositório transacional seja independente de esquema, o repositório analítico é esquematizado para otimizar o desempenho da consulta analítica. Com a capacidade de sincronização automática do Azure Link do Synapse, o Azure Cosmos DB gerencia a representação de esquema no repositório analítico de forma nativa, o que inclui o tratamento de tipos de dados aninhados. Como um pool SQL sem servidor consulta o repositório analítico, é importante entender como mapear os tipos de dados de entrada do Azure Cosmos DB para os tipos de dados SQL.

As contas do Azure Cosmos DB da API do SQL (Core) dão suporte aos tipos de propriedade JSON de número, cadeia de caracteres, booliano, nulo, objeto aninhado ou matriz. Você precisaria escolher tipos SQL que correspondam a esses tipos JSON se estiver usando a cláusula WITH em OPENROWSET. A tabela a seguir mostra os tipos de coluna SQL que devem ser usados para diferentes tipos de propriedade em Azure Cosmos DB.

Tipo de propriedade do Azure Cosmos DB	Tipo de coluna SQL
booleano	bit
Número Inteiro	bigint
Decimal	derivar
fio	varchar (agrupamento do banco de dados UTF-8)
Data e hora (cadeia de caracteres formatada em ISO)	varchar(30)
Data e hora (carimbo de data/hora UNIX)	bigint
Nulo	`any SQL type`
Objeto ou matriz aninhada	varchar(max) (agrupamento do banco de dados UTF-8), serializado como texto JSON

Esquema de total fidelidade

O esquema de total fidelidade do Azure Cosmos DB registra os valores e seus melhores tipos de correspondência para cada propriedade em um contêiner. A função OPENROWSET em um contêiner com esquema de total fidelidade fornece o tipo e o valor real em cada célula. Suponha que a seguinte consulta leia os itens de um contêiner com esquema de total fidelidade:

SELECT *
FROM OPENROWSET(
      'CosmosDB',
      'account=MyCosmosDbAccount;database=covid;region=westus2;key=C0Sm0sDbKey==',
       Ecdc
    ) as rows

O resultado dessa consulta retorna tipos e valores formatados como texto JSON:

date_rep	Casos	geo_id
{"date":"2020-08-13"}	{"int32":"254"}	{"string":"RS"}
{"date":"2020-08-12"}	{"int32":"235"}	{"string":"RS"}
{"date":"2020-08-11"}	{"int32":"316"}	{"string":"RS"}
{"date":"2020-08-10"}	{"int32":"281"}	{"string":"RS"}
{"date":"2020-08-09"}	{"int32":"295"}	{"string":"RS"}
{"string":"2020/08/08"}	{"int32":"312"}	{"string":"RS"}
{"date":"2020-08-07"}	{"float64":"339.0"}	{"string":"RS"}

Para cada valor, você pode ver o tipo identificado em um item de contêiner Azure Cosmos DB. A maioria dos valores da propriedade date_rep contém valores date, mas alguns deles são armazenados incorretamente como cadeias de caracteres em Azure Cosmos DB. O esquema de fidelidade total retorna os valores date digitados corretamente e os valores string formatados incorretamente.

O número de casos é armazenado como um valor int32, mas há um valor inserido como um número decimal. Esse valor tem o tipo float64. Se alguns valores excederem o maior número de int32, eles serão armazenados como o tipo int64. Todos os valores geo_id neste exemplo são armazenados como tipos string.

Importante

A função OPENROWSET sem uma cláusula WITH expõe os valores com os tipos esperados e os valores com tipos inseridos incorretamente. Essa função foi projetada para exploração de dados e não para geração de relatórios. Não analise os valores JSON retornados dessa função para gerar relatórios. Use uma cláusula WITH explícita para gerar relatórios. Você deve limpar os valores que têm tipos incorretos no contêiner Azure Cosmos DB para aplicar correções no repositório analítico de fidelidade total.

Para consultar as contas do Azure Cosmos DB for Mongo DB, você pode saber mais sobre a representação do esquema com fidelidade total no repositório analítico e os nomes de propriedade estendida a serem usados em O que é o armazenamento analítico do Azure Cosmos DB?.

Itens de consulta com esquema de total fidelidade

Ao consultar o esquema de fidelidade total, você precisa especificar explicitamente o tipo SQL e o tipo de propriedade Azure Cosmos DB esperado na cláusula WITH.

No exemplo a seguir, presumimos que string é o tipo correto para a propriedade geo_id e int32 é o tipo correto para a propriedade cases:

SELECT geo_id, cases = SUM(cases)
FROM OPENROWSET(
      'CosmosDB'
      'account=MyCosmosDbAccount;database=covid;region=westus2;key=C0Sm0sDbKey==',
       Ecdc
    ) WITH ( geo_id VARCHAR(50) '$.geo_id.string',
             cases INT '$.cases.int32'
    ) as rows
GROUP BY geo_id

Os valores de geo_id e cases que têm outros tipos são retornados como valores NULL. Essa consulta faz referência somente a cases com o tipo especificado na expressão (cases.int32).

Se você tiver valores com outros tipos (cases.int64, cases.float64) que não podem ser limpos em um contêiner de Azure Cosmos DB, você precisará referenciá-los explicitamente em uma cláusula WITH e combinar os resultados. A consulta a seguir agrega int32, int64 e float64 armazenados na coluna cases:

SELECT geo_id, cases = SUM(cases_int) + SUM(cases_bigint) + SUM(cases_float)
FROM OPENROWSET(
      'CosmosDB',
      'account=MyCosmosDbAccount;database=covid;region=westus2;key=C0Sm0sDbKey==',
       Ecdc
    ) WITH ( geo_id VARCHAR(50) '$.geo_id.string', 
             cases_int INT '$.cases.int32',
             cases_bigint BIGINT '$.cases.int64',
             cases_float FLOAT '$.cases.float64'
    ) as rows
GROUP BY geo_id

Neste exemplo, o número de casos é armazenado como os valores int32, int64 ou float64. Todos os valores devem ser extraídos para calcular o número de casos por país ou região.

Solução de problemas

Revise a página de autoajuda para encontrar os problemas conhecidos ou as etapas de solução que podem ajudá-lo a resolver possíveis problemas com consultas do Azure Cosmos DB.

Use o Power BI e o pool SQL sem servidor do Synapse para analisar dados do Azure Cosmos DB
Criar e usar exibições usando o pool de SQL sem servidor
Tutorial: Explore e analise lagos de dados com um pool de SQL sem servidor
Se você estiver recebendo erros ou enfrentando problemas de desempenho, consulte Solucionar problemas de pool de SQL sem servidor
Module: implementar Link do Synapse do Azure com Azure Cosmos DB

Comentários

Esta página foi útil?

Last updated on 2026-05-03

Consultar Azure Cosmos DB dados usando um pool de SQL sem servidor

Pré-requisitos

Visão geral

Amostra do conjunto de dados

Explorar dados Azure Cosmos DB com inferência automática de esquema

Especificar explicitamente o esquema

Criar visualização

Consultar objetos aninhados

Mesclar matrizes aninhadas

Azure Cosmos DB para mapeamentos de tipo SQL

Esquema de total fidelidade

Itens de consulta com esquema de total fidelidade

Solução de problemas

Conteúdo relacionado

Comentários

Recursos adicionais