你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

New-AzDataFactoryDataset

在数据工厂中创建数据集。

语法

New-AzDataFactoryDataset
   [-DataFactoryName] <String>
   [[-Name] <String>]
   [-File] <String>
   [-Force]
   [-ResourceGroupName] <String>
   [-DefaultProfile <IAzureContextContainer>]
   [-WhatIf]
   [-Confirm]
   [<CommonParameters>]
New-AzDataFactoryDataset
   [-DataFactory] <PSDataFactory>
   [[-Name] <String>]
   [-File] <String>
   [-Force]
   [-DefaultProfile <IAzureContextContainer>]
   [-WhatIf]
   [-Confirm]
   [<CommonParameters>]

说明

New-AzDataFactoryDataset cmdlet 在 Azure 数据工厂 中创建数据集。 如果为已存在的数据集指定名称,则此 cmdlet 会在替换数据集之前提示你进行确认。 如果指定 Force 参数,则 cmdlet 将替换现有数据集而不进行确认。 按以下顺序执行这些操作:

  • 创建数据工厂。
  • 创建链接服务。
  • 创建数据集。
  • 创建管道。 如果数据工厂中已存在同名的数据集,则此 cmdlet 会提示你确认是否使用新数据集覆盖现有数据集。 如果确认覆盖现有数据集,则还会替换数据集定义。

示例

示例 1:创建数据集

New-AzDataFactoryDataset -ResourceGroupName "ADF" -DataFactoryName "WikiADF" -Name "DAWikipediaClickEvents" -File "C:\\samples\\WikiSample\\DA_WikipediaClickEvents.json"

DatasetName         : DAWikipediaClickEvents
ResourceGroupName : ADF
DataFactoryName   : WikiADF
Availability      : Microsoft.DataFactories.Availability
Location          : Microsoft.DataFactories.AzureBlobLocation
Policy            : Microsoft.DataFactories.Policy
Structure         : {}

此命令在名为 WikiADF 的数据工厂中创建名为DA_WikipediaClickEvents的数据集。 该命令将数据集基于DAWikipediaClickEvents.json文件中的信息。

示例 2:查看新数据集的可用性

$Dataset = New-AzDataFactoryDataset -ResourceGroupName "ADF" -DataFactoryName "WikiADF" -Name "DAWikipediaClickEvents" -File "C:\\samples\\WikiSample\\DA_WikipediaClickEvents.json"
$Dataset.Availability

AnchorDateTime : 
Frequency      : Hour
Interval       : 1
Offset         : 
WaitOnExternal : Microsoft.DataFactories.WaitOnExternal

第一个命令创建一个名为DA_WikipediaClickEvents的数据集,如前面的示例所示,然后将该数据集分配给$Dataset变量。 第二个命令使用标准点表示法显示有关数据集可用性属性的详细信息。

示例 3:查看新数据集的位置

$Dataset = New-AzDataFactoryDataset -ResourceGroupName "ADF" -DataFactoryName "WikiADF" -Name "DAWikipediaClickEvents" -File "C:\\samples\\WikiSample\\DA_WikipediaClickEvents.json"
$Dataset.Location

BlobPath          : wikidatagateway/wikisampledatain/
FilenamePrefix    : 
Format            : 
LinkedServiceName : LinkedServiceWikipediaClickEvents
PartitionBy       : {}

第一个命令创建一个名为DA_WikipediaClickEvents的数据集,如前面的示例所示,然后将该数据集分配给$Dataset变量。 第二个命令显示有关数据集的 Location 属性的详细信息。

示例 4:查看新数据集的验证规则

$Dataset = New-AzDataFactoryDataset -ResourceGroupName "ADF" -DataFactoryName "WikiADF" -Name "DAWikipediaClickEvents" -File "C:\\samples\\WikiSample\\DA_WikipediaClickEvents.json"
$Dataset.Policy.Validation | Format-List $dataset.Location

BlobPath          : wikidatagateway/wikisampledatain/
FilenamePrefix    : 
Format            : 
LinkedServiceName : LinkedServiceWikipediaClickEvents
PartitionBy       : {}

MinimumRows   : 
MinimumSizeMB : 1

第一个命令创建一个名为DA_WikipediaClickEvents的数据集,如前面的示例所示,然后将该数据集分配给$Dataset变量。 第二个命令获取有关数据集的验证规则的详细信息,然后使用管道运算符将其传递给 Format-List cmdlet。 该 Windows PowerShell cmdlet 格式化结果。 要了解详情,请键入 Get-Help Format-List

参数

-Confirm

提示你在运行 cmdlet 之前进行确认。

Type:SwitchParameter
Aliases:cf
Position:Named
Default value:False
Required:False
Accept pipeline input:False
Accept wildcard characters:False

-DataFactory

指定 PSDataFactory 对象。 此 cmdlet 在此参数指定的数据工厂中创建数据集。

Type:PSDataFactory
Position:0
Default value:None
Required:True
Accept pipeline input:True
Accept wildcard characters:False

-DataFactoryName

指定数据工厂的名称。 此 cmdlet 在此参数指定的数据工厂中创建数据集。

Type:String
Position:1
Default value:None
Required:True
Accept pipeline input:True
Accept wildcard characters:False

-DefaultProfile

用于与 azure 通信的凭据、帐户、租户和订阅

Type:IAzureContextContainer
Aliases:AzContext, AzureRmContext, AzureCredential
Position:Named
Default value:None
Required:False
Accept pipeline input:False
Accept wildcard characters:False

-File

指定包含数据集说明的 JavaScript 对象表示法 (JSON) 文件的完整路径。

Type:String
Position:3
Default value:None
Required:True
Accept pipeline input:False
Accept wildcard characters:False

-Force

指示此 cmdlet 将替换现有数据集,而不提示你进行确认。

Type:SwitchParameter
Position:Named
Default value:None
Required:False
Accept pipeline input:False
Accept wildcard characters:False

-Name

指定要创建的数据集的名称。

Type:String
Position:2
Default value:None
Required:False
Accept pipeline input:True
Accept wildcard characters:False

-ResourceGroupName

指定 Azure 资源组的名称。 此 cmdlet 在此参数指定的组中创建数据集。

Type:String
Position:0
Default value:None
Required:True
Accept pipeline input:True
Accept wildcard characters:False

-WhatIf

显示运行该 cmdlet 时会发生什么情况。 cmdlet 未运行。

Type:SwitchParameter
Aliases:wi
Position:Named
Default value:False
Required:False
Accept pipeline input:False
Accept wildcard characters:False

输入

PSDataFactory

String

输出

PSDataset

备注

  • 关键字:azure, azurerm, arm, 资源, 管理, 经理, 数据, 工厂