Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Aplica-se a:SQL Server
SSIS Integration Runtime em Azure Data Factory
Os fluxos de dados em pacotes extraem e carregam dados entre repositórios heterogéneos, que podem usar uma variedade de tipos de dados padrão e personalizados. Num fluxo de dados, as fontes dos Serviços de Integração fazem o trabalho de extrair dados, analisar dados de cadeias e converter dados para um tipo de dado dos Serviços de Integração. Transformações subsequentes podem analisar dados para os converter para outro tipo de dado ou criar cópias em colunas com diferentes tipos de dados. Expressões usadas em componentes podem também lançar argumentos e operandos para diferentes tipos de dados. Finalmente, quando os dados são carregados num armazenamento de dados, o destino pode analisar os dados para os converter num tipo de dado que o destino utiliza. Para obter mais informações, consulte Tipos de dados do Integration Services.
Dois tipos de análise sintática
Os Serviços de Integração fornecem dois tipos de análise sintática para conversão de dados: análise rápida e análise padrão (Standard parse).
A análise rápida é um conjunto rápido e simples de rotinas de análise que não suporta conversões de tipos de dados específicas por localidade, e suporta apenas os formatos de data e hora mais usados.
A análise padrão é um conjunto rico de rotinas de análise que suporta todas as conversões de tipos de dados fornecidas pelas APIs de conversão de tipos de dados de Automação disponíveis em Oleaut32.dll e Ole2dsip.dll.
Análise Rápida
A análise rápida fornece um conjunto rápido e simples de rotinas para análise de dados. Estas rotinas não são sensíveis à localização e suportam apenas um subconjunto de formatos de data, hora e inteiro.
Requisitos e limitações
Ao implementar análise sintáctica rápida, um pacote perde a capacidade de interpretar dados de data, hora e numéricos em formatos específicos de local e em muitos formatos básicos e estendidos ISO 8601 frequentemente utilizados, mas o pacote melhora o seu desempenho. Por exemplo, a análise sintática rápida suporta apenas as representações em formato de data mais usadas, como YYYYMMDD e YYYY-MM-DD, não realiza análise específica por local, não reconhece caracteres especiais em dados de moeda e não pode converter representações hexadecimais ou científicas de inteiros.
A análise rápida está disponível apenas quando se usa a fonte de ficheiro plano ou a transformação de Conversão de Dados. O aumento de desempenho pode ser significativo, e deve considerar usar análise rápida nestes componentes de fluxo de dados, se possível.
Se o fluxo de dados no pacote exigir análise sintética local, recomenda-se a análise padrão em vez da análise rápida (fast parse). Por exemplo, a análise rápida não reconhece dados sensíveis à localização que incluem símbolos decimais como vírgula, formatos de data diferentes dos formatos ano-mês-data e símbolos de moeda.
Representações truncadas que implicam uma ou mais partes de data, como um século, um ano ou um mês, não são reconhecidas por análise rápida (fast parse). Por exemplo, a análise rápida não reconhece nem o formato '-YYMM', que especifica um ano e um mês num século implícito, nem '--MM', que especifica um mês num ano implícito. No entanto, algumas representações com precisão reduzida são reconhecidas. Por exemplo, a análise rápida reconhece o formato 'hhmm;', que indica apenas hora e minuto, e 'YYYY', que indica apenas ano.
A análise rápida é especificada ao nível da coluna. Na fonte de ficheiro plano e na transformação de Conversão de Dados, pode especificar Análise Rápida nas colunas de saída. As entradas e saídas podem incluir colunas sensíveis à localização e insensíveis à localização.
Formatos de dados numéricos (Parse Rápido)
A análise rápida fornece um conjunto rápido, simples e insensível à localização de rotinas para análise de dados. A análise rápida suporta apenas um conjunto limitado de formatos para tipos de dados inteiros.
tipos de dados de números Integer
Os tipos de dados inteiros que a Integration Services fornece são DT_I1, DT_UI1, DT_I2, DT_UI2, DT_I4, DT_UI4, DT_I8 e DT_UI8. Para obter mais informações, consulte Tipos de dados do Integration Services.
A análise rápida suporta os seguintes formatos para tipos de dados inteiros:
Zero ou mais espaços à frente e à frente ou atrás, ou paradas de tabulação. Por exemplo, o valor "123" é válido. Um valor que é composto apenas por espaços avalia-se em zero.
Um sinal de mais, de menos, ou nenhum dos dois no início. Por exemplo, os valores +123, -123 e 123 são válidos.
Um ou mais algarismos hindu-arábicos (0-9). Por exemplo, o valor 345 é válido. Não são suportados os numerais de outras línguas.
Formatos de dados não suportados incluem os seguintes:
Personagens especiais. Por exemplo, o carácter de moeda $ não é suportado, e o valor $20 não pode ser analisado.
Caracteres de espaço em branco, como avanço de linha, retornos de carro e espaços sem interrupção. Por exemplo, o valor "123" não pode ser analisado.
Representações hexadecimais de inteiros. Por exemplo, o valor 2EE não pode ser analisado.
Representação em notação científica de inteiros. Por exemplo, o valor 1E+10 não pode ser analisado.
Os seguintes formatos são formatos de dados de saída para inteiros:
Um sinal menos para números negativos e nenhum sinal para números positivos.
Sem espaços em branco.
Um ou mais algarismos hindu-arábicos (0-9).
Formatos de data e hora (Análise Rápida)
A análise rápida fornece um conjunto rápido e simples de rotinas para análise de dados. A análise rápida suporta os seguintes formatos para tipos de dados de data e hora.
Tipo de dados de data
A análise rápida suporta os seguintes formatos de string para dados de data:
Formatos de datas que incluem espaços em branco iniciais. Por exemplo, o valor "2004- 02-03" é válido.
Formatos ISO 8601, conforme listado na tabela seguinte:
Formato Description YYYYMMDD
YYYY-MM-DDFormatos básicos e estendidos para um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos. No formato estendido, as partes da data são separadas por um hífen (-). YYYY-MM Formatos básicos e estendidos de precisão reduzida para um ano de quatro dígitos e um mês de dois dígitos. No formato estendido, as partes da data são separadas por um hífen (-). YYYY O formato com precisão reduzida é um ano de quatro dígitos.
A análise rápida não suporta os seguintes formatos para dados de data:
Valores mensais alfabéticos. Por exemplo, o formato de data 31-Out-2003 não é válido.
Formatos ambíguos como DD-MM-YYYY e MM-DD-YYYY. Por exemplo, as datas 03-04-1995 e 04-03-1995 não são válidas.
Formatos básicos e abreviados para um ano civil de quatro dígitos e um dia de três dígitos dentro de um ano, YYYDDD e YYYY-DDD.
Formatos básicos e alargados para um ano de quatro dígitos, um número de dois dígitos para a semana do ano e um número de um dígito para o dia da semana, YYYYWwwD e YYYY-Www-D
Os formatos básicos e truncados para um ano e uma data de semana consistem num ano de quatro dígitos e num número de dois dígitos para a semana, YYYWww e YYYY-Www
A análise rápida gera os dados como DT_DBDATE. Os valores de data em formatos truncados são preenchidos. Por exemplo, YYYY torna-se YYYY0101.
Para obter mais informações, consulte Tipos de dados do Integration Services.
Tipo de dado temporal
A análise rápida suporta os seguintes formatos de string para dados de tempo:
Formatos de tempo que incluem espaços em branco iniciais. Por exemplo, o valor "10:24" é válido.
Formato 24 horas. A análise rápida não suporta a notação AM e PM.
Formatos de tempo ISO 8601, listados na tabela seguinte:
Formato Description HHMISS
HH:MM:SSFormatos básicos e estendidos para uma hora de dois dígitos, um minuto de dois dígitos e um segundo de dois dígitos. No formato estendido, as partes do tempo são separadas por dois pontos (:). HHMI
HH:MIFormato básico e abreviado estendido para uma hora de dois dígitos e um minuto de dois dígitos. No formato estendido, as partes do tempo são separadas por dois pontos (:). HH Formato reduzido para exibição da hora com dois dígitos. 00:00:00
000000
0000
00
240000
24:00:00
2400
24O formato para a meia-noite. Formatos horários que especificam um fuso horário, conforme listado na tabela seguinte:
Formato Description +HH:MI
+HHMIFormatos básicos e estendidos que indicam o número de horas e minutos adicionados ao Tempo Universal Coordenado (UTC) para obter a hora local. -HH:MI
-HHMIFormatos básicos e estendidos que indicam o número de horas e minutos subtraídos do UTC para obter a hora local. +HH Formato truncado que indica o número de horas adicionadas ao UTC para obter a hora local. -HH Formato truncado que indica o número de horas que são subtraídas do UTC para obter a hora local. Z Um valor de 0 que indica a hora está representado em UTC. Os formatos para todos os dados de hora e data/hora podem incluir um elemento de fuso horário. No entanto, o sistema ignora o valor do fuso horário, exceto quando os dados são do tipo DT_DBTIMESTAMPOFFSET. Para obter mais informações, consulte Tipos de dados do Integration Services.
Em formatos que incluem um elemento de fuso horário, não existe espaço entre o elemento temporal e o elemento do fuso horário, como mostrado no exemplo seguinte:
HH:MI:SS[+HH:MI]
Os parênteses no exemplo anterior indicam que o valor do fuso horário é opcional.
Formatos temporais que incluem uma fração decimal, conforme listado na tabela seguinte:
Formato Description HH[.nnnnnnn] n é um valor entre 0 e 9999999 que representa uma fração de horas. Os parênteses indicam que este valor é opcional.
Por exemplo, o valor 12.750 indica 12:45.HHMI[.nnnnnnn]
HH:MI[.nnnnnnn]n é um valor entre 0 e 9999999 que representa uma fração de minutos. Os parênteses indicam que este valor é opcional.
Por exemplo, o valor 1220.500 indica 12:20:30.HHMISS[.nnnnnnn]
HH:MI:SS[.nnnnnnn]n é um valor entre 0 e 9999999 que representa uma fração de segundos. Os parênteses indicam que este valor é opcional.
Por exemplo, o valor 122040,250 indica 12:20:40,15.Observação
O separador de frações para os formatos temporais na tabela anterior pode ser um decimal ou uma vírgula.
Valores de tempo que incluem um segundo intercalar, como mostrado nos exemplos seguintes:
23:59:60[.0000000]
235960[.0000000]
A análise rápida gera as cadeias como DT_DBTIME e DT_DBTIME2. Os valores de tempo em formatos truncados são preenchidos. Por exemplo, HH:MI torna-se HH:MM:00.000.
Para obter mais informações, consulte Tipos de dados do Integration Services.
Tipo de dados Data/Hora
A análise rápida suporta os seguintes formatos de string para dados de data/hora:
Formatos que incluem espaços em branco à frente. Por exemplo, o valor "2003-01-10T203910" é válido.
Combinações de formatos de data válidos e formatos de tempo válidos separados por um T maiúsculo, e formatos de fuso horário válidos, como YYYYMMDDT[HHMISS][+HH:MI]. Os valores horários e fusos horários não são necessários. Por exemplo, "2003-10-14" é válido.
A análise rápida não suporta intervalos de tempo. Por exemplo, um intervalo de tempo identificado por uma data e hora de início e fim no formato YYYYMMDDThhss/YYYYMMDDThhmmss não pode ser analisado.
A análise rápida gera as strings como DT_DATE, DT_DBTIMESTAMP, DT_DBTIMESTAMP2 e DT_DBTIMESTAMPOFFSET. Os valores de data/hora em formatos truncados são completados. A tabela seguinte lista os valores que são adicionados para partes de data e hora em falta.
| Parte Data/Hora | Preenchimento |
|---|---|
| Segundos | Adiciona 00. |
| Minutos | Adiciona 00:00. |
| Hora | Adiciona 00:00:00. |
| Day | Adicione 01 para o dia do mês. |
| Mês | Adicione 01 para o mês do ano. |
Para obter mais informações, consulte Tipos de dados do Integration Services.
Ativar Análise Rápida
A propriedade "fast parse" deve ser definida para cada coluna da fonte ou transformação que utilize "fast parse". Para definir a propriedade, use o editor Avançado da transformação de fonte de ficheiro plano e Conversão de Dados.
Clique com o botão direito na transformação Fonte de Ficheiro Plano ou Conversão de Dados, e depois clique em Mostrar Editor Avançado.
Na caixa de diálogo do Editor Avançado , clique no separador Propriedades de Entrada e Saída .
No painel de Entradas e Saídas , clique na coluna onde quer ativar a análise rápida (fast parse).
Na janela de Propriedades, expanda o nó Propriedades Personalizadas e depois defina a propriedade FastParse para True.
Clique em OK.
Análise Sintática Padrão
A análise sintática padrão é um conjunto de rotinas de análise sensíveis à localização que suportam todas as conversões de tipos de dados fornecidas pelas APIs de conversão de tipos de dados de Automação disponíveis em Oleaut32.dll e Ole2dsip.dll. A análise sintáctica padrão é equivalente às APIs de análise OLE DB.
A análise padrão oferece suporte para a conversão de tipos de dados internacionais e deve ser usada se o formato de dados não for suportado pelo Fast parse (análise rápida).