转换自定义属性

在 SQL ServerIntegration Services 对象模型中,除了对大多数数据流对象通用的属性以外,许多数据流对象还具有特定于该对象的自定义属性。这些自定义属性仅在运行时可用,并未记录在 Integration Services 托管编程参考文档中。

本主题列出并描述了各种数据流转换的自定义属性。有关对大多数数据流对象都通用的属性的信息,请参阅通用属性

某些转换属性可以使用属性表达式进行设置。有关详细信息,请参阅使用属性表达式指定数据流对象的属性值

包含自定义属性的转换

聚合

导出列

行计数

审核

模糊分组

行抽样

缓存转换

模糊查找

脚本组件

字符映射

导入列

渐变维度

条件性拆分

查找

排序

复制列

合并联接

字词提取

数据转换

OLE DB 命令

字词查找

数据挖掘查询

百分比抽样

逆透视

派生列

透视

不包含自定义属性的转换

以下转换不包含组件级、输入级或输出级自定义属性:合并转换多播转换Union All 转换。这些转换仅使用对所有数据流组件均通用的属性。

聚合转换自定义属性

聚合转换既包含自定义属性,又包含对所有数据流组件通用的属性。

下表介绍聚合转换的自定义属性。所有属性均可读/写。

属性

数据类型

说明

AutoExtendFactor

Integer

一个介于 1 和 100 之间的值,用于指定在聚合过程中内存可扩展的百分比。此属性的默认值为 25

CountDistinctKeys

Integer

该值用于指定聚合可以写入的非重复值的精确数目。如果指定了 CountDistinctScale 值,则 CountDistinctKeys 中的值优先。

CountDistinctScale

Integer(枚举)

该值用于说明聚合可以计数的列中非重复值的大致数目。

此属性可以为下列值之一:

  • Low (1) - 指示最多 500,000 个键值

  • Medium (2) - 指示最多 500 万个键值

  • High (3) - 指示超过 2500 万个键值。

  • Unspecified (0) - 指示没有使用 CountDistinctScale 值。使用 Unspecified (0) 选项可能会影响大型数据集的性能。

Keys

Integer

该值用于指定聚合写入的分组依据键的精确数目。如果指定了 KeyScale值,则 Keys 中的值优先。

KeyScale

Integer(枚举)

该值用于说明聚合可以写入的分组依据键值的大致数目。

此属性可以为下列值之一:

  • Low (1) - 指示最多 500,000 个键值。

  • Medium (2) - 指示最多 500 万个键值。

  • High (3) - 指示超过 2500 万个键值。

  • Unspecified (0) - 指示没有使用 KeyScale 值。

下表介绍聚合转换的输出的自定义属性。所有属性均可读/写。

属性

数据类型

说明

Keys

Integer

该值用于指定聚合可以写入的分组依据键的精确数目。如果指定了 KeyScale 值,则 Keys 中的值优先。

KeyScale

Integer(枚举)

该值用于说明聚合可以写入的分组依据键值的大致数目。

此属性可以为下列值之一:

  • Low (1) - 指示最多 500,000 个键值,

  • Medium (2) - 指示最多 500 万个键值,

  • High (3) - 指示超过 2500 万个键值。

  • Unspecified (0) - 指示没有使用 KeyScale 值。

下表介绍聚合转换的输出列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

AggregationColumnId

Integer

参与 GROUP BY 或聚合函数的列的 LineageID。

AggregationComparisonFlags

Integer

该值用于指定聚合转换如何比较列中的字符串数据。有关详细信息,请参阅比较字符串数据

AggregationType

Integer(枚举)

该值用于指定要对列执行的聚合操作。

此属性可以为下列值之一:

  • Count (1)

  • Count all (2)

  • Countdistinct (3)

  • Sum (4)

  • Average (5)

  • Maximum (7)

  • Minimum (6)

  • Group by (0)

CountDistinctKeys

Integer

该值用于指定聚合类型为 Count distinct 时聚合可以写入的键的精确数目。如果指定了 CountDistinctScale 值,则 CountDistinctKeys 中的值优先。

CountDistinctScale

Integer(枚举)

该值用于指定聚合类型为 Count distinct 时聚合可以写入的键值的大致数目。

此属性可以为下列值之一:

  • Low (1) - 指示最多 500,000 个键值,

  • Medium (2) - 指示最多 500 万个键值,

  • High (3) - 指示超过 2500 万个键值。

  • Unspecified (0) - 指示没有使用 CountDistinctScale 值。

IsBig

Boolean

该值用于指示列是包含大于 40 亿的值还是精度超过双精度浮点值的值。该值可以是 0 或 1。0 指示 IsBig 为 False 并且该列不包含大值或精确值。此属性的默认值为 1。

聚合转换的输入和输入列不包含自定义属性。

有关详细信息,请参阅聚合转换

审核转换自定义属性

审核转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍审核转换的输出列的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

LineageItemSelected

Integer(枚举)

针对输出选定的审核项。

此属性可以为下列值之一:

  • Execution instance GUID (0)

  • Execution start time (4)

  • Machine name (5)

  • Package ID (1)

  • Package name (2)

  • Task ID (8)

  • Task name (7)

  • User name (6)

  • Version ID (3)

审核转换的输入、输入列和输出都不包含自定义属性。

有关详细信息,请参阅审核转换

“缓存转换”转换自定义属性

“缓存转换”转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍“缓存转换”转换的属性。所有属性均可读/写。

属性

数据类型

说明

Connectionmanager

String

指定连接管理器的名称。

ValidateExternalMetadata

Boolean

指示在设计时是否已使用外部数据源对缓存转换进行了验证。如果将该属性设置为 False,则会在运行时针对外部数据源进行验证。

默认值为 True。

AvailableInputColumns

String

可用输入列的列表。

InputColumns

String

选定输入列的列表。

CacheColumnName

String

指定映射到选定输入列的列名称。

CacheColumnName 属性中的列名称必须与“缓存连接管理器编辑器”“列”页中列出的对应列的名称相匹配。

有关详细信息,请参阅缓存连接管理器编辑器

字符映射转换自定义属性

字符映射转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍字符映射转换的输出列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

InputColumnLineageId

Integer

该值用于指定作为输出列的源的输入列的 LineageID。

MapFlags

Integer(枚举)

该值用于指定字符映射转换对列执行的字符串操作。

此属性可以为下列值之一:

  • Byte reversal (2)

  • Full width (6)

  • Half width (5)

  • Hiragana (3)

  • Katakana (4)

  • Linguistic casing (7)

  • Lowercase (0)

  • Simplified Chinese (8)

  • Traditional Chinese(9)

  • Uppercase (1)

字符映射转换的输入、输入列和输出都不包含自定义属性。

有关详细信息,请参阅字符映射表转换

条件性拆分转换自定义属性

条件性拆分转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍条件性拆分转换的输出的自定义属性。所有属性均可读/写。

属性

数据类型

说明

EvaluationOrder

Integer

该值用于指定条件性拆分转换所计算的条件列表中与某个输出关联的条件的位置。条件按值从低到高的顺序进行计算。

Expression

String

表示条件性拆分转换所计算的条件的表达式。列由沿袭标识符表示。

FriendlyExpression

String

表示条件性拆分转换所计算的条件的表达式。列由列名称表示。

此属性的值可以使用属性表达式来指定。

IsDefaultOut

Boolean

该值用于指示输出是否为默认输出。

条件性拆分转换的输入、输入列和输出列不包含自定义属性。

有关详细信息,请参阅条件性拆分转换

复制列转换自定义属性

复制列转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍复制列转换的输出列的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

copyColumnId

Integer

从中复制输出列的输入列的 LineageID。

复制列转换的输入、输入列和输出不包含自定义属性。

有关详细信息,请参阅复制列转换

数据转换自定义属性

数据转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍数据转换的输出列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

FastParse

Boolean

该值用于指示列是使用 Integration Services 提供的不区分区域设置的较快分析例程,还是使用标准的区分区域设置的分析例程。此属性的默认值为 False。有关详细信息,请参阅快速分析标准分析

注意注意
此属性在数据转换编辑器中不可用,但可通过高级编辑器进行设置。

SourceInputColumnLineageId

Integer

作为输出列的源的输入列的 LineageID。

数据转换的输入、输入列和输出不包含自定义属性。

有关详细信息,请参阅数据转换

数据挖掘查询转换自定义属性

数据挖掘查询转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍数据挖掘查询转换的自定义属性。所有属性均可读/写。

属性

数据类型

说明

ASConnectionId

String

连接对象的唯一标识符。

ASConnectionString

String

某个 Analysis Services 项目或 Analysis Services 数据库的连接字符串。

CatalogName

String

Analysis Services 数据库的名称。

ModelName

String

数据挖掘模型的名称。

ModelStructureName

String

挖掘结构的名称。

ObjectRef

String

标识转换使用的数据挖掘结构的 XML 标记。

QueryText

String

转换所使用的预测查询语句。

数据挖掘查询转换的输入、输入列、输出和输出列不包含自定义属性。

有关详细信息,请参阅数据挖掘查询转换

派生列转换自定义属性

派生列转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍派生列转换的输入列和输出列的自定义属性。如果选择将派生列添加为新列,则这些自定义属性将应用到新的输出列;如果选择将现有输入列的内容替换为派生结果,则这些自定义属性将应用到现有输入列。所有属性均可读/写。

属性

数据类型

说明

Expression

String

表示条件性拆分转换所计算的条件的表达式。列由列的 LineageID 属性表示。

FriendlyExpression

String

表示条件性拆分转换所计算的条件的表达式。列由列名称表示。

此属性的值可以使用属性表达式来指定。

派生列转换的输入和输出不包含自定义属性。

有关详细信息,请参阅派生列转换

导出列转换自定义属性

导出列转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍导出列转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

AllowAppend

Boolean

该值用于指定转换是否向现有文件追加数据。此属性的默认值为 False。

ForceTruncate

Boolean

该值用于指定转换是否在写入数据之前截断现有文件。此属性的默认值为 False。

FileDataColumnID

Integer

该值用于标识包含转换插入到文件中的数据的列。在“提取列”上,该属性的值为 0;在“文件路径列”上,该属性包含提取列的 LineageID。

WriteBOM

Boolean

该值用于指定是否将字节顺序标记 (BOM) 写入文件中。

导出列转换的输入、输出和输出列不包含自定义属性。

有关详细信息,请参阅导出列转换

导入列转换自定义属性

导入列转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍导入列转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

ExpectBOM

Boolean

该值用于指定导入列转换是否需要使用字节顺序标记 (BOM)。仅当数据为 DT_NTEXT 数据类型时才需要 BOM。

FileDataColumnID

Integer

该值用于标识包含转换插入到数据流中的数据的列。在要插入的数据列上,此属性的值为 0;在包含源文件路径的列上,此属性包含要插入的数据列的 LineageID。

导入列转换的输入、输出和输出列不包含自定义属性。

有关详细信息,请参阅导入列转换

模糊分组转换自定义属性

模糊分组转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍模糊分组转换的自定义属性。所有属性均可读/写。

属性

数据类型

说明

Delimiters

String

转换所使用的标记分隔符。默认分隔符包括以下字符:空格 ( )、逗号 (,)、句点 (.)、分号 (;)、冒号 (:)、连字符 (-)、双直引号 (")、单直引号 (')、“与”符号 (&)、斜杠 (/)、反斜杠 (\)、at 符号 (@)、感叹号 (!)、问号 (?)、左括号 (()、右括号 ())、小于号 (<)、大于号 (>)、左方括号 ([)、右方括号 (])、左大括号 ({)、右大括号 (})、竖线 (|)、数字符号 (#)、星号 (*)、插入符号 (^) 和百分号 (%)。

Exhaustive

Boolean

该值用于指定是否将每个输入记录与所有其他输入记录进行比较。值 True 主要用于调试目的。此属性的默认值为 False。

注意注意
此属性在模糊分组转换编辑器中不可用,但可通过高级编辑器进行设置。

MaxMemoryUsage

Integer

转换所使用的最大内存量。此属性的默认值为 0,该值将启用动态内存使用。

此属性的值可以使用属性表达式来指定。

注意注意
此属性在模糊分组转换编辑器中不可用,但可通过高级编辑器进行设置。

MinSimilarity

Double

转换用来标识重复值的相似性阈值,以 0 和 1 之间的值表示。此属性的默认值为 0.8。

下表介绍模糊分组转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

ExactFuzzy

Integer(枚举)

该值用于指定转换是执行模糊匹配还是完全匹配。有效值是 ExactFuzzy。此属性的默认值为 Fuzzy

FuzzyComparisonFlags

Integer(枚举)

该值用于指定转换如何比较列中的字符串数据。

此属性可以为下列值之一:

  • FullySensitive

  • IgnoreCase

  • IgnoreKanaType

  • IgnoreNonSpace

  • IgnoreSymbols

  • IgnoreWidth

有关详细信息,请参阅比较字符串数据

LeadingTrailingNumeralsSignificant

Integer(枚举)

该值用于指定数字的重要性。

此属性可以为下列值之一:

  • LeadingNumeralsSignificant (1) - 如果前导数字重要则使用。

  • TrailingNumeralsSignificant (2) - 如果尾随数字重要则使用。

  • LeadingAndTrailingNumeralsSignificant (3) - 如果前导数字和尾随数字都重要则使用。

  • NumeralsNotSpecial (0) - 如果数字不重要则使用。

MinSimilarity

Double

用于列上的联接的相似性阈值,指定为 0 和 1 之间的值。只有大于阈值的行才能作为匹配值。

ToBeCleaned

Boolean

该值用于指定是否使用列来标识重复值,即:是否存在要分组的列。此属性的默认值为 False。

下表介绍模糊分组转换的输出列的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

ColumnType

Integer(枚举)

该值用于标识输出列的类型。

此属性可以为下列值之一:

  • KeyIn (1)

  • KeyOut (2)

  • Similarity (3)

  • ColumnSimilarity (4)

  • PassThru (5)

  • Canonical (6)

  • Undefined (0)

InputID

Integer

对应输入列的 LineageID。

模糊分组转换的输入和输出不包含自定义属性。

有关详细信息,请参阅模糊分组转换

模糊查找转换自定义属性

模糊查找转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍模糊查找转换的自定义属性。除 ReferenceMetadataXML 以外的所有属性均可读写。

属性

数据类型

说明

CopyReferenceTable

Boolean

指定是否应为模糊查找索引结构和后续查找生成引用表副本。此属性的默认值为 True。

Delimiters

String

转换用来标记列值的分隔符。默认分隔符包括以下字符:空格 ( )、逗号 (,)、句点 (.)、分号 (;)、冒号 (:)、连字符 (-)、双直引号 (")、单直引号 (')、“与”符号 (&)、斜杠 (/)、反斜杠 (\)、at 符号 (@)、感叹号 (!)、问号 (?)、左括号 (()、右括号 ())、小于号 (<)、大于号 (>)、左方括号 ([)、右方括号 (])、左大括号 ({)、右大括号 (})、竖线 (|)、数字符号 (#)、星号 (*)、插入符号 (^) 和百分号 (%)。

DropExistingMatchIndex

Boolean

该值用于指定当 MatchIndexOptions 未设置为 ReuseExistingIndex 时是否删除 MatchIndexName 中指定的匹配索引。此属性的默认值为 True。

Exhaustive

Boolean

该值用于指定是否将每个输入记录与所有其他输入记录进行比较。值 True 主要用于调试目的。此属性的默认值为 False。

注意注意
此属性在模糊查找转换编辑器中不可用,但可通过高级编辑器进行设置。

MatchIndexName

String

匹配索引的名称。匹配索引是转换在其中创建和保存所使用的索引的表。如果重复使用匹配索引,MatchIndexName 将指定要重复使用的索引。MatchIndexName 必须是有效的 SQL Server 标识符名称。例如,如果名称包含空格,则必须用方括号将名称括起来。

MatchIndexOptions

Integer(枚举)

该值用于指定转换如何管理匹配索引。

此属性可以为下列值之一:

  • GenerateNewIndex (1)

  • GenerateAndPersistNewIndex (2)

  • GenerateAndMaintainNewIndex (3)

  • ReuseExistingIndex (0)

MaxMemoryUsage

Integer

查找表的最大缓存大小。此属性的默认值为 0,表示缓存没有大小限制。

此属性的值可以使用属性表达式来指定。

注意注意
此属性在模糊查找转换编辑器中不可用,但可通过高级编辑器进行设置。

MaxOutputMatchesPerInput

Integer

转换可以为每个输入行返回的最大匹配数。此属性的默认值为 1

注意注意
大于 100 的值只能使用高级编辑器来指定。

MinSimilarity

Integer

转换在组件级别使用的相似性阈值,指定为 0 和 1 之间的值。只有大于阈值的行才能作为匹配值。

ReferenceMetadataXML

String

标识为仅供参考。 不提供支持。 不保证以后的兼容性。

ReferenceTableName

String

查找表的名称。该名称必须是有效的 SQL Server 标识符名称。例如,如果名称包含空格,则必须用方括号将名称括起来。

WarmCaches

Boolean

如果该值为 True,则查找在执行开始之前会将索引和引用表部分加载到内存中。这样可以提高性能。

下表介绍模糊查找转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

FuzzyComparisonFlags

Integer

该值用于指定转换如何比较列中的字符串数据。有关详细信息,请参阅比较字符串数据

FuzzyComparisonFlagsEx

Integer(枚举)

该值用于指定转换所使用的扩展比较标志。其值包括 MapExpandLigatures、MapFoldCZoneMapFoldDigitsMapPrecomposedNoMappingNoMapping 不能与其他标志一起使用。

JoinToReferenceColumn

String

该值用于指定列所联接的引用表中的列的名称。

JoinType

Integer

该值用于指定转换是执行模糊匹配还是完全匹配。此属性的默认值为 Fuzzy。完全联接类型的整数值为 1,而模糊联接类型的值为 2

MinSimilarity

Double

转换在列级别使用的相似性阈值,指定为 0 到 1 之间的值。只有大于阈值的行才能作为匹配值。

下表介绍模糊查找转换的输出列的自定义属性。所有属性均可读/写。

注意注意

对于包含来自对应输入列的传递值的输出列,CopyFromReferenceColumn 为空,SourceInputColumnLineageID 包含对应输入列的 LineageID。对于包含查找结果的输出列,CopyFromReferenceColumn 包含查找列的名称,SourceInputColumnLineageID 为空。

属性

数据类型

说明

ColumnType

Integer(枚举)

该值用于标识转换添加到输出的列的输出列的类型。

此属性可以为下列值之一:

  • Similarity (1)

  • Confidence (2)

  • ColumnSimilarity (3)

  • Undefined (0)

CopyFromReferenceColumn

String

该值用于指定引用表中提供输出列中的值的列名称。

SourceInputColumnLineageId

Integer

该值用于标识向此输出列提供值的输入列。

模糊查找转换的输入和输出不包含自定义属性。

有关详细信息,请参阅模糊查找转换

查找转换自定义属性

查找转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍查找转换的自定义属性。除 ReferenceMetadataXML 以外的所有属性均可读写。

属性

数据类型

说明

CacheType

Integer(枚举)

查找表的缓存类型。其值包括:Full (0)、Partial (1) 和 None (2)。此属性的默认值为 Full

DefaultCodePage

Integer

当无法从数据源使用代码页信息时所使用的默认代码页。

MaxMemoryUsage

Integer

查找表的最大缓存大小。此属性的默认值为 25,表示缓存没有大小限制。

MaxMemoryUsage64

Integer

64 位计算机上的查找表的最大缓存大小。

NoMatchBehavior

Integer(枚举)

该值用于指定是否将引用数据集中不包含匹配项的行视为错误。

如果将该属性设置为 Treat rows with no matching entries as errors (0),则不包含匹配项的行将被视为错误。使用“查找转换编辑器”对话框的“错误输出”页可以指定当发生此类错误时会发生什么情况。有关详细信息,请参阅查找转换编辑器(“错误输出”页)

如果将该属性设置为 Send rows with no matching entries to the no match output (1),则不会将这些行视为错误。

默认值为 Treat rows with no matching entries as errors (0)。

ParameterMap

String

映射到 SqlCommand 语句中所使用的参数、以分号分隔的沿袭 ID 列表。

ReferenceMetaDataXML

String

转换复制到其输出的查找表中的列的元数据。

SqlCommand

String

用于填充查找表的 SELECT 语句。

SqlCommandParam

String

用于填充查找表的参数化 SQL 语句。

下表介绍查找转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

CopyFromReferenceColumn

String

从中复制列的引用表中的列的名称。

JoinToReferenceColumns

String

源列所联接的引用表中的列的名称。

下表介绍查找转换输出列的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

CopyFromReferenceColumn

String

从中复制列的引用表中的列的名称。

查找转换的输入和输出不包含自定义属性。

有关详细信息,请参阅查找转换

合并联接转换自定义属性

合并联接转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍合并联接转换的自定义属性。

属性

数据类型

说明

JoinType

Integer(枚举)

指定联接是内部联接 (2)、左外部联接 (1) 还是完整联接 (0)。

MaxBuffersPerInput

Integer

用于每个输入的最大缓冲区数。有关此属性的用法的详细信息,请参阅改进数据流的性能

NumKeyColumns

Integer

联接所使用的列数。

TreatNullsAsEqual

Boolean

该值用于指定转换是否将 null 值处理为相等的值。此属性的默认值为 True。如果属性值为 False,则转换处理 null 值的方式与 SQL Server 的处理方式相同。

下表介绍合并联接转换的输出列的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

InputColumnID

Integer

从中将数据复制到此输出列的输入列的 LineageID。

合并联接转换的输入、输入列和输出不包含自定义属性。

有关详细信息,请参阅合并联接转换

OLE DB 命令转换自定义属性

OLE DB 命令转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍 OLE DB 命令转换的自定义属性。

属性名称

数据类型

说明

CommandTimeout

Integer

SQL 命令在超时前可以运行的最大秒数。值 0 表示不限制时间。此属性的默认值为 0

DefaultCodePage

Integer

当无法从数据源使用代码页信息时所使用的代码页。

SQLCommand

String

转换针对数据流中的每一行运行的 Transact-SQL 语句。

此属性的值可以使用属性表达式来指定。

下表介绍 OLE DB 命令转换的外部列的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

DBParamInfoFlag

Integer(位掩码)

一组描述参数特征的标志。有关详细信息,请参阅 MSDN 库的 OLE DB 文档中的 DBPARAMFLAGSENUM。

OLE DB 命令转换的输入、输入列、输出和输出列不包含自定义属性。

有关详细信息,请参阅 OLE DB 命令转换

百分比抽样转换自定义属性

百分比抽样转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍百分比抽样转换的自定义属性。

属性

数据类型

说明

SamplingSeed

Integer

随机数生成器所使用的种子。此属性的默认值为 0,指示转换使用时钟周期数。

SamplingValue

Integer

以与源的百分比表示的样本大小。

此属性的值可以使用属性表达式来指定。

下表介绍百分比抽样转换的输出的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

Selected

Boolean

指定已抽样的行定向到的输出。对于选定的输出,Selected 设置为 True;对于未选定的输出,Selected 设置为 False。

百分比抽样转换的输入、输入列和输出列不包含自定义属性。

有关详细信息,请参阅百分比抽样转换

透视转换自定义属性

透视转换仅包含在组件级别对所有数据流组件通用的属性。

下表介绍透视转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

PivotUsage

Integer(枚举)

该值用于指定透视数据集时列的角色。

选项值说明
0此列未经透视,列值将传递到转换输出。
1此列为设置键的一部分,该设置键将一行或多行标识为一个集的组成部分。将所有具有同一设置键的输入行组合到一个输出行。
2列为透视列。从每个列值至少创建一列。
3将来自此列的值放入作为透视的结果而创建的列中。

下表介绍透视转换的输出列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

PivotKeyValue

String

列中由其 PivotUsage 属性的值标记为透视键的可能值之一。

此属性的值可以使用属性表达式来指定。

SourceColumn

Integer

包含透视值或 -1 的输入列的 LineageID。值 -1 表示透视操作中未使用该列。

透视转换的输入和输出不包含自定义属性。

有关详细信息,请参阅透视转换

行计数转换自定义属性

行计数转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍行计数转换的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

VariableName

String

保存行计数的变量的名称。

行计数转换的输入、输入列、输出和输出列不包含自定义属性。

有关详细信息,请参阅行计数转换

行抽样转换自定义属性

行抽样转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍行抽样转换的自定义属性。所有属性均可读/写。

属性

数据类型

说明

SamplingSeed

Integer

随机数生成器所使用的种子。此属性的默认值为 0,指示转换使用时钟周期数。

SamplingValue

Integer

样本的行计数。

此属性的值可以使用属性表达式来指定。

下表介绍行抽样转换的输出的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

Selected

Boolean

指定已抽样的行定向到的输出。对于选定的输出,Selected 设置为 True;对于未选定的输出,Selected 设置为 False。

下表介绍行抽样转换的输出列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

InputColumnLineageId

Integer

该值用于指定作为输出列的源的输入列的 LineageID。

行抽样转换的输入和输入列不包含自定义属性。

有关详细信息,请参阅行抽样转换

脚本组件自定义属性

脚本组件既包含自定义属性,也包含对所有数据流组件通用的属性。无论脚本组件用作源、转换,还是用作目标,都具有相同的自定义属性。

下表介绍脚本组件的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

ReadOnlyVariables

String

以逗号分隔的、可供脚本组件进行只读访问的变量列表。

ReadWriteVariables

String

以逗号分隔的、可供脚本组件进行读/写访问的变量列表。

脚本组件的输入、输入列、输出和输出列不包含自定义属性,除非脚本开发人员为它们创建自定义属性。

有关详细信息,请参阅脚本组件

渐变维度转换自定义属性

渐变维度转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍渐变维度转换的自定义属性。所有属性均可读/写。

属性

数据类型

说明

CurrentRowWhere

String

SELECT 语句中的 WHERE 子句,用于在具有相同业务键的行中选择当前行。

EnableInferredMember

Boolean

该值用于指定是否检测推断成员更新。此属性的默认值为 True。

FailOnFixedAttributeChange

Boolean

该值用于指定当具有固定属性的行列包含更改或维度表中的查找失败时,转换是否失败。如果期望传入的行包含新记录,请将该值设置为 True,使转换在查找失败后继续,因为转换将使用该失败来标识新记录。此属性的默认值为 False。

FailOnLookupFailure

Boolean

该值用于指定当查找现有记录失败时转换是否失败。此属性的默认值为 False。

IncomingRowChangeType

Integer

该值用于指定是否所有传入的行均为新行,或者转换是否应检测更改类型。

InferredMemberIndicator

String

推断成员的列名称。

SQLCommand

String

用于创建架构行集的 SQL 语句。

UpdateChangingAttributeHistory

Boolean

该值用于指示是否将历史属性更新定向到转换输出,以用于更改属性更新。

下表介绍渐变维度转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

ColumnType

Integer(枚举)

列的更新类型。其值包括:Changing Attribute (2)、Fixed Attribute (4)、Historical Attribute (3)、Key (1) 和 Other (0)。

渐变维度转换的输入、输出和输出列不包含自定义属性。

有关详细信息,请参阅渐变维度转换

排序转换自定义属性

排序转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍排序转换的自定义属性。所有属性均可读/写。

属性

数据类型

说明

EliminateDuplicates

Boolean

指定转换是否删除转换输出中的重复行。此属性的默认值为 False

MaximumThreads

Integer

包含转换可用于排序的最大线程数。如果值为 0,则表示不限制线程数。此属性的默认值为 0

此属性的值可以使用属性表达式来指定。

下表介绍排序转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

NewComparisonFlags

Integer(位掩码)

该值用于指定转换如何比较列中的字符串数据。有关详细信息,请参阅比较字符串数据

NewSortKeyPosition

Integer

该值用于指定列的排序顺序。如果值为 0,则表示不对该列上的数据进行排序。

下表介绍排序转换的输出列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

SortColumnID

Integer

排序列的 LineageID。

排序转换的输入和输出不包含自定义属性。

有关详细信息,请参阅排序转换

字词提取转换自定义属性

字词提取转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍字词提取转换的自定义属性。所有属性均可读/写。

属性

数据类型

说明

FrequencyThreshold

Integer

该数值指示提取某个字词之前,该字词必须出现的次数。此属性的默认值为 2

IsCaseSensitive

Boolean

该值指定提取名词和名词短语时是否区分大小写。此属性的默认值为 False。

MaxLengthOfTerm

Integer

该数值指示某个字词的最大长度。此属性只适用于短语。此属性的默认值为 12

NeedRefenceData

Boolean

该值用于指定转换是否使用引用表中存储的排除字词列表。此属性的默认值为 False。

OutTermColumn

String

包含排除字词的列的名称。

OutTermTable

String

包含具有排除字词的列的表的名称。

ScoreType

Integer

该值用于指定与字词关联的计分类型。有效值为 0 和 1:0 表示频率,1 表示 TFIDF 分数。TFIDF 分数是字词频率和文档频率倒数的乘积,其定义如下:字词 T 的 TFIDF = (T 的频率) * log( (输入中的行数) / (包含 T 的行数) )。此属性的默认值为 0

WordOrPhrase

Integer

该值用于指定字词类型。有效值包括 0、1 和 2:0 表示仅词;1 表示仅名词短语;2 表示词和名称短语。此属性的默认值为 0

字词提取转换的输入、输入列、输出和输出列不包含自定义属性。

有关详细信息,请参阅字词提取转换

字词查找转换自定义属性

字词查找转换既包含自定义属性,也包含对所有数据流组件通用的属性。

下表介绍字词查找转换的自定义属性。所有属性均可读/写。

属性

数据类型

说明

IsCaseSensitive

Boolean

该值用于指定是否将大小写区分比较应用于输入列文本与查找字词的匹配。此属性的默认值为 False。

RefTermColumn

String

包含查找字词的列的名称。

RefTermTable

String

包含具有查找字词的列的表名称。

下表介绍字词查找转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

InputColumnType

Integer

该值用于指定列的使用。有效值包括 0、1 和 2:0 表示传递列;1 表示查找列;2 表示既是传递列又是查找列的列。

下表介绍字词查找转换的输出列的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

CustomLineageID

Integer

当该列的 InputColumnType 为 0 或 2 时,对应的输入列的 LineageID。

字词查找转换的输入和输出不包含自定义属性。

有关详细信息,请参阅字词查找转换

逆透视转换自定义属性

逆透视转换仅包含在组件级别对所有数据流组件通用的属性。

注意注意

本部分围绕逆透视转换中所述的逆透视应用场景,举例说明此处介绍的各选项的用法。

下表介绍逆透视转换的输入列的自定义属性。所有属性均可读/写。

属性

数据类型

说明

DestinationColumn

Integer

输入列映射到的输出列的 LineageID。如果值为 -1,则表示输入列未映射到输出列。

PivotKeyValue

String

复制到转换输出列的值。

此属性的值可以使用属性表达式来指定。

逆透视转换中所述的逆透视应用场景中,透视值为以下文本值:Ham、Coke、Milk、Beer 和 Chips。这些值在由“透视键值列名”选项指定的新 Product 列中显示为文本值。

下表介绍逆透视转换的输出列的自定义属性。所有属性均可读/写。

属性名称

数据类型

说明

PivotKey

Boolean

指示是否将输入列的 PivotKeyValue 属性中的值写入此输出列。

逆透视转换中所述的逆透视应用场景中,透视值列名称为 Product,并指定了将 Ham、Coke、Milk、Beer 和 Chips 列逆透视到其中的新的 Product 列。

逆透视转换的输入和输出不包含自定义属性。

有关详细信息,请参阅逆透视转换

更改历史记录

更新的内容

  • 增加了以下属性的数值:

    • 聚合转换的 CountDistinctScaleKeyScaleAggregationTypeCountDistinctScale 属性。

    • 查找转换的 CacheTypeNoMatchBehavior 属性。

    • 模糊查找转换的 MatchIndexOptions 属性。

    • 合并联接转换的 JoinType 属性。

  • 增加了以下属性的有效值:

    • 审核转换的 LineageItemSelected 属性。

    • 字符映射表转换的 MapFlags 属性。

    • 模糊分组转换的 ExactFuzzyFuzzyComparisonFlagsLeadingTrailingNumeralsSignificantColumnType 属性。

    • 模糊查找转换的 ColumnType 属性。