Considerações internacionais para Integration Services
OMicrosoftSQL ServerIntegration Servicesoferece suporte a análise e manipulação de dados multilíngües, e a todas as localidades de Windows, e fornece opções de comparação especiais para classificar e comparar dados de cadeia de caracteres.
As transformações do Integration Services para mineração de texto e correspondência difusa pode não funcionar tão bem com idiomas diferentes do inglês. Entretanto, tanto a mineração de texto como a correspondência difusa podem fornecer resultados úteis quando usadas com muitos idiomas diferentes do inglês, dependendo do idioma.
Análise sem distinção de localidade
O Integration Services inclui rotinas de análise sem distinção de localidade que você pode usar para obter dados que estão em certos formatos. Estas rotinas de análise, coletivamente chamadas de análise rápida, oferece suporte somente às representações de formato de data usadas com mais freqüência, não executa análise específica de localidade, não reconhece caracteres especiais em dados de moeda e não pode converter representação hexadecimal ou científica de números inteiros. A análise rápida pode melhorar significativamente o desempenho de pacotes do Integration Services que não têm dependências de localidade. Para obter mais informações, consulte Análise de dados.
Configurações de localidade
O Integration Services oferece suporte a localidades no nível do objeto de pacote, contêiner, tarefa e componente de fluxo de dados. Você também pode definir a localidade dos manipuladores de eventos.
Um pacote pode usar várias localidades diferentes. Por exemplo, o pacote pode usar a localidade inglês (Estados Unidos), enquanto uma tarefa do pacote usa a localidade alemão (Alemanha) e outra tarefa usa a localidade japonês (Japão).
Você pode usar qualquer localidade do Windows em um pacote do Integration Services. Você define a localidade quando cria o pacote e, a menos que o pacote use configurações para atualizar propriedades de localidade, o pacote tem a garantia de se comportar da mesma forma quando implantado em computadores que podem usar opções regionais e de idiomas diferentes do ambiente de desenvolvimento.
Entretanto, se um pacote tiver que usar localidades diferentes quando implantado em servidores diferentes, você poderá criar configurações que forneçam localidades atualizadas para serem usadas quando o pacote for executado. Para obter mais informações, consulte Definindo propriedades do pacote e Configurações de pacote.
Opções de comparação
A localidade fornece as regras básicas para comparar dados de cadeia de caracteres em um fluxo de dados. Por exemplo, a localidade especifica a posição de classificação de cada letra no alfabeto. Porém, essas regras podem não ser suficientes para as comparações que você quer executar e o Integration Services oferece suporte a um conjunto de opções de comparação avançadas que vão além das regras de comparação de uma localidade. Por exemplo, se você optar por ignorar caracteres sem espaço, "a" e "á" serão equivalentes para fins de comparação. Para obter mais informações, consulte Comparando dados de cadeia de caracteres.
Mineração de texto
As transformações para mineração de texto, extração de termo e pesquisa de termo usam seu próprio dicionário. Esse dicionário está disponível somente em inglês e o uso das transformações de mineração de texto com idiomas diferentes do inglês podem gerar resultados limitados. A Microsoft oferece suporte para uso dessas transformações somente em inglês.
Porém, dependendo da semelhança lingüística entre o idioma inglês e outro idioma, você pode achar que a transformação Extração de Texto pode extrair termos em idiomas que não sejam em inglês e que a transformação Pesquisa de Termos pode ser usada para procurar e calcular a freqüência do termo. Quanto maior for a semelhança entre os idiomas, mais bem-sucedida será a mineração de texto. Por exemplo, usando a transformação Extração de Termos para mineração de texto de cadeias de caracteres suecos poderia ser efetivo porque o idioma sueco usa delimitadores de sentença e palavra semelhantes aos do inglês. Por outro lado, o uso da transformação Extração de Texto não terá tanto êxito com o japonês. Para obter mais informações, consulte Transformação Extração de Termos e Transformação Pesquisa de Termo.
Correspondência difusa
As duas transformações, agrupamento difuso e pesquisa difusa, usam correspondência difusa para agrupar registros semelhantes em um conjunto de dados ou executar pesquisas em uma tabela de referência. As duas transformações podem executar a correspondência mais eficazmente quando os dados do texto contiverem várias palavras longas separadas por espaço em branco ou por delimitadores. As transformações não podem ser tão tolerantes a erros em idiomas logográficos, como o chinês, em que as palavras consistem freqüentemente de apenas alguns caracteres e não podem ser separadas por espaço em branco. Geralmente, as transformações são menos propensas a pegar erros ortográficos, palavras extras e palavras ausentes em idiomas logográficos. Para obter mais informações, consulte Transformação Agrupamento Difuso e Transformação Pesquisa Difusa.
|