你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

New-AzureHDInsightStreamingMapReduceJobDefinition

模块:: Azure

定义新的流式处理 MapReduce 作业。

注意

本文档中引用的 cmdlet 用于管理使用 Azure Service Manager (ASM) API 的旧式 Azure 资源。创建新资源时，建议不要使用旧的 PowerShell 模块，因为计划将停用 ASM。有关详细信息，请参阅 Azure Service Manager 停用。

Az PowerShell 模块是建议用于管理 PowerShell 的 Azure 资源管理器 (ARM) 资源的 PowerShell 模块。

语法

New-AzureHDInsightStreamingMapReduceJobDefinition
   [-Arguments <String[]>]
   [-CmdEnv <String[]>]
   [-Combiner <String>]
   [-Defines <Hashtable>]
   [-Files <String[]>]
   [-InputPath <String>]
   [-JobName <String>]
   [-Mapper <String>]
   [-OutputPath <String>]
   [-Reducer <String>]
   [-StatusFolder <String>]
   [-Profile <AzureSMProfile>]
   [<CommonParameters>]

说明

此版本的 Azure PowerShell HDInsight 已弃用。这些 cmdlet 将于 2017 年 1 月 1 日删除。请使用较新版本的 Azure PowerShell HDInsight。

有关如何使用新的 HDInsight 创建群集的信息，请参阅使用 Azure PowerShell 在 HDInsight 中创建基于 Linux 的群集。有关如何使用 Azure PowerShell 和其他方法提交作业的信息，请参阅 HDInsight 中的提交 Hadoop 作业。有关 Azure PowerShell HDInsight 的参考信息，请参阅 Azure HDInsight Cmdlet。

New-AzureHDInsightStreamingMapReduceJobDefinition cmdlet 定义一个新的作业定义对象，该对象表示 Hadoop 流式处理作业的参数。

示例

示例 1：创建流式处理 MapReduce 作业定义

PS C:\>$StreamingWordCount = New-AzureHDInsightStreamingMapReduceJobDefinition -Files "/Example/Apps/WordCount.exe", "/Example/Apps/Cat.exe" -InputPath "/Example/Data/Gutenberg/Davinci.txt" -OutputPath "/Example/Data/StreamingOutput/WordCount.txt" -Mapper "Cat.exe" -Reducer "WordCount.exe"

此命令创建指定的流式处理 MapReduce 作业定义，然后将其存储在$StreamingWordCount变量中。

参数

-Arguments

指定 Hadoop 作业的参数数组。参数以命令行参数的形式传递到每个任务。

类型:	String[]
别名:	Args
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-CmdEnv

指定在数据节点上运行作业时要设置的命令行环境变量数组。

类型:	String[]
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-Combiner

指定合并器文件名。

类型:	String
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-Defines

指定要在作业运行时设置的 Hadoop 配置值。

类型:	Hashtable
别名:	Params
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-Files

指定作业所需的文件数组。

类型:	String[]
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-InputPath

指定输入文件的 WASB 路径。

类型:	String
别名:	Input
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-JobName

指定新的 MapReduce 作业定义的名称。此参数是可选的。

类型:	String
别名:	Name
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-Mapper

指定映射器文件名。

类型:	String
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-OutputPath

指定作业输出的 WASB 路径。

类型:	String
别名:	Output
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-Profile

指定此 cmdlet 从中读取的 Azure 配置文件。如果未指定配置文件，此 cmdlet 将从本地默认配置文件中读取。

类型:	AzureSMProfile
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-Reducer

指定化简器文件名。

类型:	String
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

-StatusFolder

指定包含作业的标准输出和错误输出的文件夹，包括其退出代码和任务日志。

类型:	String
Position:	Named
默认值:	None
必需:	False
接受管道输入:	False
接受通配符:	False

通过