Använda Hive-metaarkiv med Apache Spark-kluster™

Viktigt!

Den här funktionen finns i förhandsgranskning. De kompletterande användningsvillkoren för Förhandsversioner av Microsoft Azure innehåller fler juridiska villkor som gäller för Azure-funktioner som är i betaversion, förhandsversion eller på annat sätt ännu inte har släppts i allmän tillgänglighet. Information om den här specifika förhandsversionen finns i Azure HDInsight på AKS-förhandsversionsinformation. Om du vill ha frågor eller funktionsförslag skickar du en begäran på AskHDInsight med informationen och följer oss för fler uppdateringar i Azure HDInsight Community.

Det är viktigt att dela data och metaarkiv över flera tjänster. Ett av de vanliga metaarkivet i HIVE-metaarkivet. HDInsight på AKS gör det möjligt för användare att ansluta till externt metaarkiv. Det här steget gör det möjligt för HDInsight-användare att sömlöst ansluta till andra tjänster i ekosystemet.

Azure HDInsight på AKS stöder anpassade metalager, som rekommenderas för produktionskluster. De viktigaste stegen är

  1. Skapa en Azure SQL-databas
  2. Skapa ett nyckelvalv för att lagra autentiseringsuppgifterna
  3. Konfigurera metaarkiv när du skapar en HDInsight på AKS-kluster med Apache Spark™
  4. Arbeta på externt metaarkiv (Visar databaser och gör en select-gräns 1).

När du skapar klustret måste HDInsight-tjänsten ansluta till det externa metaarkivet och verifiera dina autentiseringsuppgifter.

Skapa en Azure SQL-databas

  1. Skapa eller ha en befintlig Azure SQL Database innan du konfigurerar ett anpassat Hive-metaarkiv för ett HDInsight-kluster.

    Kommentar

    För närvarande stöder vi endast Azure SQL Database for HIVE-metaarkiv. På grund av Hive-begränsning stöds inte "-" (bindestreck) i metaarkivdatabasens namn.

Skapa ett nyckelvalv för att lagra autentiseringsuppgifterna

  1. Skapa ett Azure Key Vault.

    Syftet med Key Vault är att du ska kunna lagra sql Server-administratörslösenordet som angavs när SQL-databasen skapades. HDInsight på AKS-plattformen hanterar inte autentiseringsuppgifterna direkt. Därför är det nödvändigt att lagra dina viktiga autentiseringsuppgifter i Azure Key Vault. Lär dig stegen för att skapa ett Azure Key Vault.

  2. Tilldela följande roller efter skapandet av Azure Key Vault

    Objekt Roll Kommentarer
    Användartilldelad hanterad identitet (samma UAMI som används av HDInsight-klustret) Nyckelvalvshemlighetsanvändare Lär dig hur du tilldelar rollen till UAMI
    Användare (som skapar hemlighet i Azure Key Vault) Key Vault-administratör Lär dig hur du tilldelar rollen till användaren.

    Kommentar

    Utan den här rollen kan användaren inte skapa en hemlighet.

  3. Skapa en hemlighet

    Med det här steget kan du behålla ditt SQL Server-administratörslösenord som en hemlighet i Azure Key Vault. Lägg till ditt lösenord (samma lösenord som anges i SQL DB för administratör) i fältet "Värde" när du lägger till en hemlighet.

    Skärmbild som visar hur du skapar ett nyckelvalv.

    Skärmbild som visar hur du skapar en hemlighet.

    Kommentar

    Observera det hemliga namnet eftersom du behöver det när klustret skapas.

Konfigurera metaarkiv när du skapar ett HDInsight Spark-kluster

  1. Gå till HDInsight i AKS-klusterpoolen för att skapa kluster.

    Skärmbild som visar hur du skapar ett nytt kluster.

  2. Aktivera växlingsknappen för att lägga till externt hive-metaarkiv och fyll i följande information.

    Skärmbild som visar fliken Grundläggande.

  3. Resten av informationen ska fyllas i enligt reglerna för att skapa kluster för Apache Spark-kluster i HDInsight på AKS.

  4. Klicka på Granska och skapa.

    Skärmbild som visar fliken Granska och skapa.

    Kommentar

    • Livscykeln för metaarkivet är inte kopplad till en klusterlivscykel, så du kan skapa och ta bort kluster utan att förlora metadata. Metadata som dina Hive-scheman bevaras även efter att du har tagit bort och återskapat HDInsight-klustret.
    • Med ett anpassat metaarkiv kan du koppla flera kluster och klustertyper till metaarkivet.

Arbeta med externt metaarkiv

  1. Skapa en tabell

    >> spark.sql("CREATE TABLE sampleTable (number Int, word String)")

    Skärmbild som visar hur du skapar en tabell.

  2. Lägga till data i tabellen

    >> spark.sql("INSERT INTO sampleTable VALUES (123, \"HDIonAKS\")");\

    Skärmbild som visar insert-instruktionen.

  3. Läs tabellen

    >> spark.sql("select * from sampleTable").show()

    Skärmbild som visar hur du läser tabellen.

Referens

  • Apache, Apache Spark, Spark och associerade öppen källkod projektnamn är varumärkensom tillhör Apache Software Foundation (ASF).