Origem XML

Aplica-se a:SQL Server SSIS Integration Runtime no Azure Data Factory

A origem XML lê um arquivo de dados XML e preenche as colunas na saída de origem com os dados.

Os dados de arquivos XML frequentemente incluem relações hierárquicas. Por exemplo, um arquivo de dados XML pode representar catálogos e itens em catálogos. Antes de os dados serem inseridos no fluxo de dados, é necessário determinar a relação dos elementos no arquivo de dados XML e gerar uma saída para cada elemento do arquivo.

Esquemas

A origem XML usa um esquema para interpretar os dados XML. A origem XML dá suporte ao uso de um arquivo XSD (XML Schema Definition) ou de esquemas embutidos para conversão dos dados XML em um formato tabular. Se a origem XML for configurada com a caixa de diálogo Editor de Origem XML , a interface de usuário poderá gerar um XSD a partir do arquivo de dados XML especificado.

Observação

DTDs não são suportados.

Os esquemas só podem dar suporte a um único namespace; eles não dão suporte a coleções de esquema.

Observação

A origem XML não valida os dados no arquivo de XML em relação ao XSD.

Editor de Origem XML

Os dados dos arquivos XML frequentemente incluem relações hierárquicas. A caixa de diálogo Editor de Origem XML usa o esquema especificado para gerar as saídas de origem XML. É possível especificar um arquivo XSD, usar um esquema embutido ou gerar um XSD a partir do arquivo de dados XML especificado. O esquema deve estar disponível em tempo de design.

A origem XML gera estruturas tabulares a partir dos dados XML criando uma saída para cada elemento que contém outros elementos dos arquivos XML. Por exemplo, se os dados XML representarem catálogos e itens em catálogos, a origem XML criará uma saída para os catálogos e uma saída para cada tipo de item contido nos catálogos. A saída de cada item conterá colunas de saída para os atributos do item em questão.

Para fornecer informações sobre a relação hierárquica dos dados nas saídas, a origem XML adiciona uma coluna às saídas que identifica o elemento pai de cada elemento filho. Usando o exemplo de catálogos com tipos de itens diferentes, cada item teria um valor de coluna para identificar o catálogo ao qual pertence.

A origem XML cria uma saída para cada elemento, mas não é necessário usar todas as saídas. Você pode excluir todas as saídas que não deseja usar ou apenas não se conectar a um componente downstream.

A origem XML também gera os nomes de saída para assegurar que os nomes são sejam ambíguos. Esses nomes podem ser longos e talvez não identifiquem as saídas de uma maneira útil. Você pode renomear as saídas, contanto que seus nomes permaneçam exclusivos. Você também pode modificar o tipo de dados e o comprimento de colunas de saída.

A cada saída, a origem XML adiciona uma saída de erro. Por padrão, as colunas das saídas de erro têm um tipo de dados de cadeia de caracteres Unicode (DT_WSTR) com 255 caracteres, mas é possível configurar as colunas das saídas de erro modificando o tipo e o comprimento dos dados.

Se o arquivo de dados XML tiver elementos que não estão no XSD, esses elementos serão ignorados e nenhuma saída será gerada para eles. Por outro lado, se o arquivo de dados XML tiver elementos ausentes que estão representados no XSD, a saída vai conter colunas com valores nulos.

Quando os dados são extraídos do arquivo de dados XML, eles são convertidos em um tipo de dados do Integration Services. No entanto, a origem XML não pode converter os dados XML para os tipos de dados DT_TIME2 ou DT_DBTIMESTAMP2 porque ela não tem suporte a esses tipos de dados. Para obter mais informações, consulte Integration Services Data Types.

O XSD ou o esquema embutido pode especificar o tipo de dados para os elementos, mas, se não fizerem isso, a caixa de diálogo Editor de Origem XML atribuirá o tipo de dados String Unicode (DT_WSTR) à coluna na saída que contém o elemento e definirá o comprimento da coluna como 255 caracteres.

Se o esquema especificar o comprimento máximo de um elemento, o comprimento da coluna de saída será definido para esse valor. Se o comprimento máximo for maior do que o comprimento suportado pelo tipo de dados do Integration Services no qual o elemento foi convertido, os dados serão truncados no comprimento máximo do tipo de dados. Por exemplo, se o comprimento de uma cadeia de caracteres for 5000, ela será truncada em 4000 caracteres porque o comprimento máximo do tipo de dados DT_WSTR é 4000 caracteres; do mesmo modo, os dados de byte são truncados em 8000 caracteres, que é o comprimento máximo do tipo de dados DT_BYTES. Se o esquema não especificar nenhum comprimento máximo, o comprimento padrão das colunas com qualquer tipo de dados será definido como 255. O truncamento dos dados na origem XML é tratada do mesmo modo que seria em outros componentes de fluxo de dados. Para obter mais informações, consulte Tratamento de erros em dados.

Você pode modificar o tipo de dados e o comprimento da coluna. Para obter mais informações, consulte Integration Services Data Types.

Configuração da origem XML

A origem XML dá suporte a três modos diferentes de acesso aos dados. Você pode especificar o local do arquivo de dados XML, a variável que contém o local do arquivo ou a variável que contém os dados XML.

A origem XML inclui as propriedades personalizadas XMLData e XMLSchemaDefinition que podem ser atualizadas por expressões de propriedade quando o pacote é carregado. Para obter mais informações, confira Expressões do Integration Services (SSIS), Usar expressões de propriedade em pacotes e Propriedades personalizadas de origem XML.

A origem XML dá suporte a várias saídas regulares e saídas de erro.

O SQL Server Integration Services inclui a caixa de diálogo Editor de Origem XML para configurar a origem XML. Esta caixa de diálogo está disponível no Designer do SSIS.

Você pode definir propriedades pelo Designer do SSIS ou programaticamente.

A caixa de diálogo Editor Avançado reflete as propriedades que podem ser definidas programaticamente. Para obter mais informações sobre as propriedades que podem ser definidas na caixa de diálogo Editor Avançado ou programaticamente, clique em um dos seguintes tópicos:

Para obter mais informações sobre como definir as propriedades, clique em um dos tópicos a seguir:

Editor de Origem XML (página Gerenciador de Conexões)

Use a página Gerenciador de Conexões do Editor de Origem XML para especificar um arquivo XML e o XSD que transforma os dados XML.

Opções estáticas

Modo de acesso aos dados
Especifique o método para selecionar os dados da origem.

Valor Descrição
Localização do arquivo XML Recupera dados de um arquivo XML.
Arquivo XML de variável Especifica o nome de arquivo XML em uma variável.

Informações relacionadas: Usar variáveis em pacotes
Dados XML de variável Recupera dados XML de uma variável.

Usar esquema embutido
Especifique se os próprios dados de origem XML contêm o esquema XSD que define e valida sua estrutura e dados.

Local de XSD
Digite o caminho e nome de arquivo do esquema de arquivo XSD ou localize o arquivo clicando em Procurar.

Procurar
Use a caixa de diálogo Abrir para localizar o arquivo de esquema XSD.

Gerar XSD
Use a caixa de diálogo Salvar Como para selecionar um local para o arquivo de esquema XSD gerado automaticamente. O editor infere o esquema da estrutura dos dados XML.

Opções dinâmicas de modo de acesso aos dados

Modo de acesso aos dados = local de arquivo XML

Local de XML
Digite o caminho e nome de arquivo do arquivo de dados XML ou localize o arquivo clicando em Procurar.

Procurar
Use a caixa de diálogo Abrir para localizar o arquivo de dados XML.

Modo de acesso aos dados = arquivo XML de variável

Nome da variável
Selecione a variável que contém o caminho e o nome de arquivo do arquivo XML.

Modo de acesso aos dados = dados XML de variável

Nome da variável
Selecione uma variável que contenha os dados XML.

Editor de Origem XML (página Colunas)

Use o nó Colunas da caixa de diálogo do Editor de Origem XML para mapear uma coluna de saída para uma coluna externa (origem).

Opções

Colunas Externas Disponíveis
Exiba a lista de colunas externas disponíveis na fonte de dados. Você não pode usar esta tabela para adicionar ou excluir colunas.

Coluna Externa
Exiba as colunas externas (fonte) na ordem em que serão lidas pela tarefa. Você pode alterar essa ordem desmarcando as colunas selecionadas na tabela exibida no editor e selecionando colunas externas na lista em uma ordem diferente.

Coluna de Saída
Forneça um nome exclusivo para cada coluna de saída. O padrão é o nome da coluna externa (origem) selecionada; porém, é possível escolher qualquer nome descritivo exclusivo. O nome fornecido será exibido no Designer do SSIS .

Editor de Origem XML (página Saída de Erro)

Use a página Saída de Erro da caixa de diálogo Editor de Origem XML , para selecionar opções de manipulação de erros e definir propriedades em colunas de saída de erros.

Opções

Entrada/Saída
Exibe o nome da fonte de dados.

Coluna
Exiba as colunas externas (origem) que você selecionou na página Gerenciador de Conexões da caixa de diálogo Editor de Origem XML.

Erro
Especifique o que deve acontecer quando ocorre um erro: ignorar a falha, redirecionar a linha ou causar falha no componente.

Tópicos Relacionados:Tratamento de erros em dados

Truncation
Especifique o que deve acontecer quando ocorre um truncamento: ignorar a falha, redirecionar a linha ou causar falha do componente.

Descrição
Exiba a descrição do erro.

Definir este valor para células selecionadas
Especifique o que deve acontecer a todas as células selecionadas quando ocorre um erro ou um truncamento: ignorar a falha, redirecionar a linha ou causar a falha no componente.

Aplicar
Aplique a opção de tratamento de erros às células selecionadas.

Extrair dados por meio da origem XML