output_dataset_config 模块

包含指定应如何将作业的输出上传和提升到数据集的配置。

有关详细信息,请参阅如何指定输出一文。

HDFSOutputDatasetConfig

表示如何输出到 HDFS 路径并提升为 FileDataset。

初始化 HDFSOutputDatasetConfig。

LinkFileOutputDatasetConfig

注意

这是一个试验性的类,随时可能更改。 有关详细信息,请参阅 https://aka.ms/azuremlexperimental

表示如何链接运行的输出并将其提升为 FileDataset。

可使用 LinkFileOutputDatasetConfig 将文件数据集链接为输出数据集


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   output = LinkFileOutputDatasetConfig('link_output')

   script_run_config = ScriptRunConfig('.', 'link.py', arguments=[output])

   # within link.py
   # from azureml.core import Run, Dataset
   # run = Run.get_context()
   # workspace = run.experiment.workspace
   # dataset = Dataset.get_by_name(workspace, name='dataset_to_link')
   # run.output_datasets['link_output'].link(dataset)

   run = experiment.submit(script_run_config)
   print(run)

初始化 LinkFileOutputDatasetConfig。

LinkTabularOutputDatasetConfig

注意

这是一个试验性的类,随时可能更改。 有关详细信息,请参阅 https://aka.ms/azuremlexperimental

表示如何链接运行的输出以及如何将其提升为 TabularDataset。

可使用 LinkTabularOutputDatasetConfig 将文件 Tabular 链接为输出数据集


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   output = LinkTabularOutputDatasetConfig('link_output')

   script_run_config = ScriptRunConfig('.', 'link.py', arguments=[output])

   # within link.py
   # from azureml.core import Run, Dataset
   # run = Run.get_context()
   # workspace = run.experiment.workspace
   # dataset = Dataset.get_by_name(workspace, name='dataset_to_link')
   # run.output_datasets['link_output'].link(dataset)

   run = experiment.submit(script_run_config)
   print(run)

初始化 LinkTabularOutputDatasetConfig。

MountOptions

特定于将要装载的输出的选项。

初始化 MountOptions。

OutputDatasetConfig

表示如何将作业的输出复制到远程存储位置并提升为数据集。

这是一个基类,用于表示如何将作业的输出复制到远程存储位置,是否将其注册为命名和版本化的数据集,以及是否对创建的数据集应用任何其他转换。

不应直接创建此类的实例,而应使用相应的子类。

初始化 OutputDatasetConfig。

OutputFileDatasetConfig

表示如何复制运行的输出并将其升级为 FileDataset。

可使用 OutputFileDatasetConfig 指定将计算目标上的特定本地路径上传到指定目标的方式。 如果未将任何参数传递给构造函数,将自动生成名称、目标和本地路径。

未传递任何参数的示例:


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   output = OutputFileDatasetConfig()

   script_run_config = ScriptRunConfig('.', 'train.py', arguments=[output])

   run = experiment.submit(script_run_config)
   print(run)

创建输出并将其升级到表格数据集,然后使用名称 foo 进行注册的示例:


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   datastore = Datastore(workspace, 'example_adls_gen2_datastore')

   # for more information on the parameters and methods, please look for the corresponding documentation.
   output = OutputFileDatasetConfig().read_delimited_files().register_on_complete('foo')

   script_run_config = ScriptRunConfig('.', 'train.py', arguments=[output])

   run = experiment.submit(script_run_config)
   print(run)

初始化 OutputFileDatasetConfig。

可使用 OutputFileDatasetConfig 指定将计算目标上的特定本地路径上传到指定目标的方式。 如果未将任何参数传递给构造函数,将自动生成名称、目标和本地路径。

未传递任何参数的示例:


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   output = OutputFileDatasetConfig()

   script_run_config = ScriptRunConfig('.', 'train.py', arguments=[output])

   run = experiment.submit(script_run_config)
   print(run)

创建输出并将其升级到表格数据集,然后使用名称 foo 进行注册的示例:


   workspace = Workspace.from_config()
   experiment = Experiment(workspace, 'output_example')

   datastore = Datastore(workspace, 'example_adls_gen2_datastore')

   # for more information on the parameters and methods, please look for the corresponding documentation.
   output = OutputFileDatasetConfig().read_delimited_files().register_on_complete('foo')

   script_run_config = ScriptRunConfig('.', 'train.py', arguments=[output])

   run = experiment.submit(script_run_config)
   print(run)
OutputTabularDatasetConfig

表示如何复制运行的输出以及如何将其提升为 TabularDataset。

初始化 OutputTabularDatasetConfig。

RegistrationConfiguration

指定如何将输出注册为 Dataset 的配置。

初始化 RegistrationConfiguration。

TransformationMixin

此类提供用于输出数据集的转换功能。

UploadOptions

特定于要上传的输出的选项。

初始化 UploadOptions。