HDInsight på AKS – Vanliga frågor och svar

Den här artikeln tar upp några vanliga frågor om Azure HDInsight på AKS.

Allmänt

Vad är HDInsight på AKS?

HDInsight på AKS är en ny HDInsight-version som ger företagsklar hanterad klustertjänst med nya analysprojekt med öppen källkod som Apache Flink (för direktuppspelning), Trino (för adhoc-analys och BI) och Apache Spark. Mer information finns i Översikt.
Vilka klusterformer stöder HDInsight på AKS?

HDInsight på AKS har stöd för Trino, Apache Flink och Apache Spark till att börja med. Andra klusterformer som Kafka, Hive osv. finns dock med i översikten.
Hur gör jag för att komma igång med HDInsight på AKS?

Kom igång genom att gå till Azure Marketplace och söka efter Azure HDInsight i AKS-tjänsten och se komma igång.
Vad händer med befintliga HDInsight på den virtuella datorn och de kluster jag kör idag?

Det finns inga ändringar i befintlig HDInsight (HDInsight på virtuell dator). Alla befintliga kluster fortsätter att köras och du kan fortsätta att skapa och skala nya HDInsight-kluster.
Vilket operativsystem stöds med HDInsight på AKS?

HDInsight på AKS baseras på Mariner OS. Mer information finns i OS-version.
I vilka regioner är HDInsight på AKS tillgängligt?

En lista över regioner som stöds finns i Regiontillgänglighet.
Vad kostar det att distribuera en HDInsight på AKS-kluster?

Mer information om priser finns i HDInsight om AKS-priser.

Kan jag köra flera kluster samtidigt?

Ja, du kan köra så många kluster som du vill per klusterpool samtidigt. Kontrollera dock att du inte är begränsning efter kvot för din prenumeration. Det maximala antalet noder som tillåts i en klusterpool är 250 (i offentlig förhandsversion).
Kan jag installera eller lägga till fler plugin-program/bibliotek i mitt kluster?

Ja, du kan installera anpassade plugin-program och bibliotek beroende på klusterformer.
- För Trino, se Installera anpassade plugin-program.
- Information om Spark finns i Bibliotekshantering i Spark.
Kan jag SSH-in i mitt kluster?

Ja, du kan SSH till klustret via webssh och köra frågor och skicka jobb direkt därifrån.

Kan jag använda ett externt metaarkiv för att ansluta till mitt kluster?

Ja, du kan använda ett externt metaarkiv. Vi stöder dock endast Azure SQL Database som ett externt anpassat metaarkiv.
Kan jag dela ett metaarkiv i flera kluster?

Ja, du kan dela ett metaarkiv över flera HDInsight av AKS.
Vilken version av Hive-metaarkivet stöds?

Hive-metaarkiv version 3.1.2

Vad är Trino?

Trino är en öppen källkod federerad och distribuerad SQL-frågemotor, som gör att du kan köra frågor mot data som finns i olika datakällor utan att flytta till ett centralt informationslager. Du kan köra frågor mot data med HJÄLP av ANSI SQL. Du behöver inte lära dig ett nytt språk. Mer information finns i Översikt över Trino.
Vad har du stöd för för alla anslutningsappar?

HDInsight på AKS Trino stöder flera anslutningsappar. Mer information finns i den här listan över Trino-anslutningsappar. Vi fortsätter att lägga till nya anslutningsappar när och när nya anslutningsappar är tillgängliga i versionen med öppen källkod.
Kan jag lägga till kataloger i ett befintligt kluster?

Ja, du kan lägga till kataloger som stöds i det befintliga klustret. Mer information finns i Lägga till kataloger i ett befintligt kluster.

Vad är Apache Flink?

Apache Flink är en analysmotor med bästa klass med öppen källkod för dataströmbearbetning och tillståndskänslig beräkning över obundna och begränsade dataströmmar. Den kan utföra beräkningar i minnesintern hastighet och i valfri skala. Flink på HDInsight på AKS erbjuder hanterad Apache Flink med öppen källkod. Mer information finns i Översikt över Flink.
Har du stöd för både sessions- och appläge i Apache Flink?

I HDInsight på AKS stöder Flink för närvarande sessionslägeskluster.
Vad är hantering av tillståndsserverdel och hur det görs i HDInsight på AKS?

Serverdelar avgör var tillståndet lagras. När kontrollpunkter aktiveras sparas tillståndet vid kontrollpunkter för att skydda mot dataförlust och återställa konsekvent. Hur tillståndet representeras internt och hur och var det sparas på kontrollpunkter beror på den valda tillståndsserverdelen. Mer information finns i Översikt över Flink

Vad är Apache Spark?

Apache Spark är ett ramverk för databehandling som snabbt kan utföra bearbetningsuppgifter på stora datamängder och som även kan distribuera databearbetningsuppgifter på flera datorer, antingen på egen hand eller tillsammans med andra distribuerade databehandlingsverktyg.
Vilka språk-API:er stöds i Spark?

Azure HDInsight på AKS stöder Python och Scala.
Stöds externt metaarkiv i HDInsight på AKS Spark?

HDInsight på AKS stöder anslutning till externa metaarkiv. För närvarande stöds endast Azure SQL DB i som externt metaarkiv.
Vilka är de olika sätten att skicka jobb i HDInsight på AKS Spark?

Du kan skicka jobb på HDInsight på AKS Spark med Hjälp av Jupyter Notebook, Zeppelin Notebook, SDK och klusterterminal. Mer information finns i Skicka och hantera jobb i ett Spark-kluster i HDInsight på AKS