Integration Services 的国际化注意事项

Microsoft SQL Server 2005 Integration Services 支持分析和操作多语言数据,支持各种 Windows 区域设置,提供用于排序和比较字符串数据的特殊比较选项。

与使用英语相比,用于文本挖掘和模糊匹配的 Integration Services 转换可能无法很好地与非英语语言一起使用。但是,文本挖掘和模糊匹配转换在与很多非英语语言一起使用时,也可以提供非常有用的结果,具体情况将由语言决定。

不区分区域设置的分析

Integration Services 包括不区分区域设置的分析例程,可以使用这些例程处理特定格式的数据。这些例程统称为快速分析,只支持最常用的日期格式表示形式,不执行区域设置特定的分析,不能识别货币数据中的特殊字符,并且无法转换整数的十六进制或科学计数表示法。快速分析可以显著提高不具有区域设置依赖项的 Integration Services 包的性能。有关详细信息,请参阅分析数据

区域设置

Integration Services 支持包对象级、容器级、任务级和数据流组件级的区域设置。您还可以设置事件处理程序的区域设置。

一个包可以使用多个不同的区域设置。例如,包可能使用英语(美国)区域设置,而包中的一项任务使用德语(德国)区域设置,包中的另一任务使用日语(日本)区域设置。

可以在 Integration Services 包中使用任何 Windows 区域设置。在构造包时设置区域设置。除非包使用配置来更新区域设置属性,否则,需要保证包在部署到所使用的区域设置和语言选项可能与开发环境不同的计算机时,包的行为不变。

但是,如果包在部署到其他服务器时必须使用不同的区域设置,则可以创建一些配置,这些配置提供运行包时要使用的更新后的区域设置。有关详细信息,请参阅设置包属性包配置

比较选项

区域设置提供了用于比较数据流中的字符串数据的基本规则。例如,区域设置指定字母表中每个字母的排序位置。但是,对于要执行的比较来说,这些规则可能不够用,Integration Services 支持一组高级比较选项,远可以满足区域设置的比较规则的需求。例如,如果选择忽略非空格字符,对于比较目的而言,“a”和“á”是等同的。有关详细信息,请参阅比较字符串数据

文本挖掘

文本挖掘转换、字词提取转换和字词查找转换都使用它们各自的字典。此字典仅限于使用英语,如果使用英语之外的其他语言进行文本挖掘转换,那么所得到的结果可能会受到限制。Microsoft 只支持使用英语进行这些转换。

但是,根据非英语语言和英语语言之间的语言相似性,您可能发现字词提取转换可以从非英语语言中提取字词,而字词查找转换可用于查找字词和计算字词的频率。语言之间的相似性越高,文本挖掘的成功性也就越大。例如,将字词提取转换用于瑞典语字符串的文本挖掘可能会有效,因为瑞典语使用的单词和句子分隔符与英语语言中使用的单词和句子分隔符相似。而另一方面,对于日语而言,字词提取转换很可能不成功。有关详细信息,请参阅字词提取转换字词查找转换

模糊匹配

模糊分组和模糊查找这两种转换使用模糊匹配,将数据集中的相似数据分组或在引用表中执行查找。当文本数据包含由空格或分隔符分开的多个较长的单词时,这两种转换都可以有效地执行匹配。在像形文字语言(如中文)中,这些转换中可能会出现很多错误而导致无法使用,因为在这样的语言中,字词通常只包括几个字符,而且可能无法用空格分隔。通常来说,这些转换在像形文字语言中几乎不可能捕获到拼写错误、多余的字词和缺少的字词。有关详细信息,请参阅模糊分组转换模糊查找转换

请参阅

概念

SQL Server Integration Services

帮助和信息

获取 SQL Server 2005 帮助