你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Invoke-AzureHDInsightHiveJob

将 Hive 查询提交到 HDInsight 群集,显示查询执行进度,并在一个操作中获取查询结果。

注意

本文档中引用的 cmdlet 用于管理使用 Azure Service Manager (ASM) API 的旧 Azure 资源。 创建新的资源时,不建议使用此旧版 PowerShell 模块,因为 ASM 计划停用。 有关详细信息,请参阅 Azure Service Manager 停用

Az PowerShell 模块是推荐的 PowerShell 模块,用于使用 PowerShell 管理 Azure 资源管理器 (ARM) 资源。

语法

Invoke-AzureHDInsightHiveJob
      [-Arguments <String[]>]
      [-Defines <Hashtable>]
      [-File <String>]
      [-Files <String[]>]
      [-JobName <String>]
      [-Query <String>]
      [-RunAsFileJob]
      [-StatusFolder <String>]
      [-Profile <AzureSMProfile>]
      [<CommonParameters>]

说明

此版本的 Azure PowerShell HDInsight 已弃用。 这些 cmdlet 将于 2017 年 1 月 1 日删除。 请使用较新版本的 Azure PowerShell HDInsight。

有关如何使用新的 HDInsight 创建群集的信息,请参阅 使用 Azure PowerShell 在 HDInsight 中创建基于 Linux 的群集(https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-create-linux-clusters-azure-powershell/)。 有关如何使用 Azure PowerShell 和其他方法提交作业的信息,请参阅 HDInsight 中的提交 Hadoop 作业(https://azure.microsoft.com/en-us/documentation/articles/hdinsight-submit-hadoop-jobs-programmatically/)。 有关 Azure PowerShell HDInsight 的参考信息,请参阅 Azure HDInsight Cmdlet

Invoke-AzureHDInsightHiveJob cmdlet 将 Hive 查询提交到 HDInsight 群集,显示查询执行进度,并在一个操作中获取查询结果。 在运行 Invoke-AzureHDInsightHiveJob 之前,必须运行 Use-AzureHDInsightCluster cmdlet,以指定要向其提交查询的 HDInsight 群集。

示例

示例 1:提交 Hive 查询

PS C:\>Use-AzureHDInsightCluster "Cluster01" -Subscription (Get-AzureSubscription -Current).SubscriptionId
PS C:\> Invoke-AzureHDInsightHiveJob "select * from hivesampletable limit 10"

第一个命令使用 Use-AzureHDInsightCluster cmdlet 指定要用于 Hive 查询的当前订阅中的群集。

第二个命令使用 Invoke-AzureHDInsightHiveJob cmdlet 提交 Hive 查询。

参数

-Arguments

指定 Hadoop 作业的参数数组。 参数以命令行参数的形式传递到每个任务。

类型:String[]
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-Defines

指定要在作业运行时设置的 Hadoop 配置值。

类型:Hashtable
别名:Params
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-File

指定 Azure Blob 存储中包含要运行的查询的文件的 Windows Azure 存储 Blob(WASB)路径。 可以使用此参数而不是 Query 参数。

类型:String
别名:QueryFile
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-Files

指定 Hive 作业所需的文件集合。

类型:String[]
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-JobName

指定 Hive 作业的名称。 如果未指定此参数,此 cmdlet 将使用默认值:“Hive: <Query 的前 100 个字符>”。

类型:String
别名:Name
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-Profile

指定此 cmdlet 从中读取的 Azure 配置文件。 如果未指定配置文件,此 cmdlet 将从本地默认配置文件中读取。

类型:AzureSMProfile
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-Query

指定 Hive 查询。

类型:String
别名:QueryText
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-RunAsFileJob

指示此 cmdlet 在存储查询的默认 Azure 存储帐户中创建文件。 此 cmdlet 提交将引用此文件的作业作为要运行的脚本。

可以使用此功能来处理特殊字符,例如通过 Templeton 提交作业失败的百分比符号 ≤ ,因为 Templeton 将具有百分号的查询解释为 URL 参数。

类型:SwitchParameter
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False

-StatusFolder

指定包含作业的标准输出和错误输出的文件夹的位置,包括其退出代码和任务日志。

类型:String
Position:Named
默认值:None
必需:False
接受管道输入:False
接受通配符:False