Manipular esquema
Dependendo da fonte de dados, as informações sobre tipos de dados e nomes de colunas podem ou não ser fornecidas explicitamente. As APIs REST do OData normalmente lidam com isso usando a definição de $metadata, e o método OData.Feed
do Power Query manipula automaticamente a análise dessas informações e a aplicação aos dados retornados de uma fonte OData.
Muitas APIs REST não têm uma maneira de determinar programaticamente seu esquema. Nesses casos, você precisará incluir uma definição de esquema no conector.
A abordagem mais simples é codificar uma definição de esquema em seu conector. Isso é suficiente para a maioria dos casos de uso.
No geral, a imposição de um esquema nos dados retornados pelo conector tem vários benefícios, como:
- Definir os tipos de dados corretos.
- Remover colunas que não precisam ser mostradas aos usuários finais (como IDs internas ou informações de estado).
- Garantir que cada página de dados tenha a mesma forma adicionando todas as colunas que possam estar ausentes em uma resposta (as APIs REST geralmente indicam que os campos devem ser nulos ao omiti-los inteiramente).
Considere o seguinte código que retorna uma tabela simples do serviço de exemplo TripPin OData:
let
url = "https://services.odata.org/TripPinWebApiService/Airlines",
source = Json.Document(Web.Contents(url))[value],
asTable = Table.FromRecords(source)
in
asTable
Observação
TripPin é uma fonte do OData; portanto, praticamente, faria mais sentido usar apenas o tratamento automático de esquema da função OData.Feed
. Neste exemplo, você tratará a origem como uma API REST típica e usará Web.Contents
para demonstrar a técnica de codificação manual de um esquema.
Esta tabela é o resultado:
Você pode usar a função útil Table.Schema
para verificar o tipo de dados das colunas:
let
url = "https://services.odata.org/TripPinWebApiService/Airlines",
source = Json.Document(Web.Contents(url))[value],
asTable = Table.FromRecords(source)
in
Table.Schema(asTable)
O Código de Companhia Aérea e o Nome são do tipo any
. Table.Schema
retorna muitos metadados sobre as colunas em uma tabela, incluindo nomes, posições, informações de tipo e muitas propriedades avançadas, como Precisão, Escala e Tamanho máximo. Por enquanto, você só deve se preocupar com o tipo atribuído (TypeName
), o tipo primitivo (Kind
) e se o valor da coluna pode ser nulo (IsNullable
).
Sua tabela de esquema será composta por duas colunas:
Coluna | Detalhes |
---|---|
Nome | O nome da coluna. Isso deve corresponder ao nome nos resultados retornados pelo serviço. |
Tipo | O tipo de dados da linguagem M que você vai definir. Pode ser um tipo primitivo (texto, número, datetime e assim por diante) ou um tipo inscrito (Int64.Type, Currency.Type e assim por diante). |
A tabela de esquema codificada para a tabela Airlines
definirá suas colunas AirlineCode
e Name
como text
e terá esta aparência:
Airlines = #table({"Name", "Type"}, {
{"AirlineCode", type text},
{"Name", type text}
})
Ao olhar para alguns dos outros pontos de extremidade, considere as seguintes tabelas de esquema:
A tabela Airports
tem quatro campos que você deseja manter (incluindo um do tipo record
):
Airports = #table({"Name", "Type"}, {
{"IcaoCode", type text},
{"Name", type text},
{"IataCode", type text},
{"Location", type record}
})
A tabela People
tem sete campos, incluindo list
s (Emails
, AddressInfo
), uma coluna anulável (Gender
) e uma coluna com um tipo inscrito (Concurrency
):
People = #table({"Name", "Type"}, {
{"UserName", type text},
{"FirstName", type text},
{"LastName", type text},
{"Emails", type list},
{"AddressInfo", type list},
{"Gender", type nullable text},
{"Concurrency", Int64.Type}
})
Você pode colocar todas essas tabelas em uma única tabela de esquema mestre SchemaTable
:
SchemaTable = #table({"Entity", "SchemaTable"}, {
{"Airlines", Airlines},
{"Airports", Airports},
{"People", People}
})
A função auxiliar SchemaTransformTable
descrita abaixo será usada para impor esquemas em seus dados. Ele usa os seguintes parâmetros:
Parâmetro | Tipo | Descrição |
---|---|---|
tabela | tabela | A tabela de dados em que você deseja impor o esquema. |
esquema | tabela | A tabela de esquema da qual ler as informações da coluna, com o seguinte tipo: type table [Name = text, Type = type] . |
enforceSchema | número | (opcional) Uma enumeração que controla o comportamento da função. O valor padrão ( EnforceSchema.Strict = 1 ) garante que a tabela de saída corresponda à tabela de esquema fornecida adicionando colunas ausentes e removendo colunas extras. A opção EnforceSchema.IgnoreExtraColumns = 2 pode ser usada para preservar colunas extras no resultado. Quando EnforceSchema.IgnoreMissingColumns = 3 for usado, as colunas ausentes e as colunas extras serão ignoradas. |
A lógica para essa função tem esta aparência:
- Determinar se há colunas ausentes na tabela de origem.
- Determine se há colunas extras.
- Ignore colunas estruturadas (do tipo
list
,record
etable
) e colunas definidas como tipoany
. - Use
Table.TransformColumnTypes
para definir cada tipo de coluna. - Reordene colunas com base na ordem em que aparecem na tabela de esquema.
- Defina o tipo na própria tabela usando
Value.ReplaceType
.
Observação
A última etapa para definir o tipo de tabela removerá a necessidade de a interface do usuário do Power Query inferir informações de tipo ao exibir os resultados no editor de consultas, o que às vezes pode resultar em uma chamada dupla para a API.
No contexto maior de uma extensão completa, o tratamento de esquema ocorrerá quando uma tabela for retornada da API. Normalmente, essa funcionalidade ocorre no nível mais baixo da função de paginação (se existir), com informações de entidade passadas de uma tabela de navegação.
Como grande parte da implementação de tabelas de paginação e navegação é específica do contexto, o exemplo completo da implementação de um mecanismo de tratamento de esquema codificado não será mostrado aqui. Este exemplo do TripPin demonstra como uma solução de ponta a ponta pode parecer.
A implementação codificada discutida acima faz um bom trabalho de garantir que os esquemas permaneçam consistentes para respostas JSON simples, mas está limitada à análise do primeiro nível da resposta. Conjuntos de dados profundamente aninhados se beneficiariam da abordagem a seguir, que aproveita os Tipos M.
Aqui está uma atualização rápida sobre os tipos na linguagem M da Especificação de linguagem:
Um valor de tipo é um valor que classifica outros valores. Um valor classificado por um tipo obedece a esse tipo. O sistema de tipos de M é composto pelas seguintes categorias de tipos:
- Tipos primitivos, que classificam valores primitivos (
binary
,date
,datetime
,datetimezone
,duration
,list
,logical
,null
,number
,record
,text
,time
,type
) e incluem alguns tipos abstratos (function
,table
,any
enone
).- Tipos de registro, que classificam valores de registro com base em nomes de campo e em tipos de valor.
- Tipos de lista, que classificam listas usando apenas um tipo de base de item.
- Função types, que classifica valores de função com base nos tipos de seus parâmetros e valores de retorno.
- Tipos de tabela, que classificam valores de tabela com base em nomes de coluna, tipos de coluna e chaves.
- Tipos anuláveis, que classificam o valor nulo além de todos os valores classificados por um tipo base.
- Tipos de tipo, que classificam valores que são tipos.
Usando a saída JSON bruta que você obtém (e/ou pesquisando as definições no $metadata do serviço), você pode definir os seguintes tipos de registro para representar tipos complexos OData:
LocationType = type [
Address = text,
City = CityType,
Loc = LocType
];
CityType = type [
CountryRegion = text,
Name = text,
Region = text
];
LocType = type [
#"type" = text,
coordinates = {number},
crs = CrsType
];
CrsType = type [
#"type" = text,
properties = record
];
Observe como LocationType
faz referência a CityType
e LocType
para representar suas colunas estruturadas.
Para as entidades de nível superior que você deseja representar como Tabelas, é possível definir tipos de tabela:
AirlinesType = type table [
AirlineCode = text,
Name = text
];
AirportsType = type table [
Name = text,
IataCode = text,
Location = LocationType
];
PeopleType = type table [
UserName = text,
FirstName = text,
LastName = text,
Emails = {text},
AddressInfo = {nullable LocationType},
Gender = nullable text,
Concurrency Int64.Type
];
Em seguida, é possível atualizar sua variável SchemaTable
(que você pode usar como uma tabela de pesquisa para mapeamentos de entidade para tipo) para usar essas novas definições de tipo:
SchemaTable = #table({"Entity", "Type"}, {
{"Airlines", AirlinesType},
{"Airports", AirportsType},
{"People", PeopleType}
});
Você pode contar com uma função comum (Table.ChangeType
) para impor um esquema em seus dados, assim como você usou SchemaTransformTable
no exercício anterior. Ao contrário de SchemaTransformTable
, Table.ChangeType
usa um tipo de tabela M real como um argumento e aplicará seu esquema recursivamente em todos os tipos aninhados. Sua assinatura é:
Table.ChangeType = (table, tableType as type) as nullable table => ...
Observação
Para obter flexibilidade, a função pode ser usada em tabelas e em listas de registros (que é como as tabelas são representadas em um documento JSON).
Em seguida, você precisará atualizar o código do conector para alterar o parâmetro schema
de um table
para um type
e adicionar uma chamada a Table.ChangeType
. Novamente, os detalhes para fazer isso são muito específicos da implementação e, portanto, não vale a pena entrar em detalhes aqui. Este exemplo de conector TripPin estendido demonstra uma solução de ponta a ponta implementando essa abordagem mais sofisticada para lidar com o esquema.