New-AzureHDInsightPigJobDefinition
Definieert een nieuwe Pig-taak voor een HDInsight-service.
Notitie
De cmdlets waarnaar in deze documentatie wordt verwezen, zijn bedoeld voor het beheren van verouderde Azure-resources die gebruikmaken van Service Management-API's. Zie de Az PowerShell-module voor cmdlets voor het beheren van Azure Resource Manager-resources.
Syntax
New-AzureHDInsightPigJobDefinition
[-Arguments <String[]>]
[-File <String>]
[-Files <String[]>]
[-Query <String>]
[-StatusFolder <String>]
[-Profile <AzureSMProfile>]
[<CommonParameters>]
Description
Deze versie van Azure PowerShell HDInsight is afgeschaft. Deze cmdlets worden verwijderd op 1 januari 2017. Gebruik de nieuwere versie van Azure PowerShell HDInsight.
Zie Op Linux gebaseerde clusters maken in HDInsight met behulp van Azure PowerShell (https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-create-linux-clusters-azure-powershell/) voor informatie over het gebruik van de nieuwe HDInsight om een cluster te maken. Zie Hadoop-taken verzenden in HDInsight (https://azure.microsoft.com/en-us/documentation/articles/hdinsight-submit-hadoop-jobs-programmatically/) voor meer informatie over het verzenden van taken met behulp van Azure PowerShell en andere benaderingen. Zie Azure HDInsight-cmdlets voor naslaginformatie over Azure PowerShell HDInsight.
De New-AzureHDInsightPigJobDefinition definieert een Pig-taak voor een Azure HDInsight-service.
Voorbeelden
Voorbeeld 1: Een nieuwe Pig-taak definiƫren
PS C:\>$0 = '$0';
PS C:\> $QueryString = "LOGS = LOAD 'wasb:///example/data/sample.log';" + "LEVELS = foreach LOGS generate REGEX_EXTRACT($0, '(TRACE|DEBUG|INFO|WARN|ERROR|FATAL)', 1) as LOGLEVEL;" + "FILTEREDLEVELS = FILTER LEVELS by LOGLEVEL is not null;" + "GROUPEDLEVELS = GROUP FILTEREDLEVELS by LOGLEVEL;" + "FREQUENCIES = foreach GROUPEDLEVELS generate group as LOGLEVEL, COUNT(FILTEREDLEVELS.LOGLEVEL) as COUNT;" + "RESULT = order FREQUENCIES by COUNT desc;" + "DUMP RESULT;"
PS C:\> $PigJobDefinition = New-AzureHDInsightPigJobDefinition -Query $QueryString
Met de eerste opdracht wordt een tekenreekswaarde gede declareerd en vervolgens opgeslagen in de variabele $0.
Met de tweede opdracht wordt een Pig-taakquery gemaakt en vervolgens opgeslagen in de $QueryString variabele.
Met de laatste opdracht maakt u een Pig-taakdefinitie die gebruikmaakt van de query in $QueryString en slaat u vervolgens de taakdefinitie op in de $PigJobDefinition variabele.
Parameters
-Arguments
Hiermee geeft u een matrix van argumenten voor een Pig-taak. De argumenten worden doorgegeven als opdrachtregelargumenten aan elke taak.
Type: | String[] |
Aliases: | Args |
Position: | Named |
Default value: | None |
Required: | False |
Accept pipeline input: | False |
Accept wildcard characters: | False |
-File
Hiermee geeft u het pad naar een bestand dat een query bevat die moet worden uitgevoerd. U kunt deze parameter gebruiken in plaats van de queryparameter .
Type: | String |
Aliases: | QueryFile |
Position: | Named |
Default value: | None |
Required: | False |
Accept pipeline input: | False |
Accept wildcard characters: | False |
-Files
Hiermee geeft u een verzameling bestanden die zijn gekoppeld aan een Pig-taak.
Type: | String[] |
Position: | Named |
Default value: | None |
Required: | False |
Accept pipeline input: | False |
Accept wildcard characters: | False |
-Profile
Hiermee geeft u het Azure-profiel op waaruit deze cmdlet wordt gelezen. Als u geen profiel opgeeft, leest deze cmdlet uit het lokale standaardprofiel.
Type: | AzureSMProfile |
Position: | Named |
Default value: | None |
Required: | False |
Accept pipeline input: | False |
Accept wildcard characters: | False |
-Query
Hiermee geeft u een Pig-taakquery op.
Type: | String |
Aliases: | QueryText |
Position: | Named |
Default value: | None |
Required: | False |
Accept pipeline input: | False |
Accept wildcard characters: | False |
-StatusFolder
Hiermee geeft u de locatie op van de map die standaarduitvoer en foutuitvoer voor een taak bevat, inclusief de afsluitcode en taaklogboeken.
Type: | String |
Position: | Named |
Default value: | None |
Required: | False |
Accept pipeline input: | False |
Accept wildcard characters: | False |