HDInsight v AKS – nejčastější dotazy

Tento článek se zabývá některými běžnými dotazy ke službě Azure HDInsight v AKS.

Všeobecné

  • Co je HDInsight v AKS?

    HDInsight v AKS je nová verze HDInsight, která poskytuje službu spravovaných clusterů připravenou pro podniky s nově vznikajícími opensourcovými analytickými projekty, jako je Apache Flink (pro streamování), Trino (pro adhoc analytics a BI) a Apache Spark. Další informace najdete v tématu Přehled.

  • Jaké obrazce clusteru HDInsight v AKS podporují?

    HDInsight v AKS podporuje Trino, Apache Flink a Apache Spark, aby mohli začít. Další obrazce clusteru, jako je Kafka, Hive atd., jsou ale v plánu.

  • Návody začít se službou HDInsight v AKS?

    Začněte tím, že navštívíte Azure Marketplace a vyhledáte Službu Azure HDInsight ve službě AKS a projděte si úvodní informace.

  • Co se stane se stávající službou HDInsight na virtuálním počítači a clustery, které dnes používám?

    Neexistují žádné změny existující služby HDInsight (HDInsight na virtuálním počítači). Všechny vaše stávající clustery se budou dál spouštět a můžete dál vytvářet a škálovat nové clustery HDInsight.

  • Který operační systém se podporuje ve službě HDInsight v AKS?

    HDInsight v AKS je založen na operačním systému Mariner. Další informace najdete v tématu Verze operačního systému.

  • V jakých oblastech jsou HDInsight ve službě AKS k dispozici?

    Seznam podporovaných oblastí najdete v části Dostupnost oblastí.

  • Jaké jsou náklady na nasazení SLUŽBY HDInsight v clusteru AKS?

    Další informace o cenách najdete v tématu HDInsight o cenách AKS.

Správa clusteru

  • Můžu současně spustit více clusterů?

    Ano, na fond clusterů můžete současně spouštět tolik clusterů, kolik chcete. Ujistěte se ale, že nejste omezeni kvótou pro vaše předplatné. Maximální povolený počet uzlů ve fondu clusterů je 250 (ve verzi Public Preview).

  • Můžu do clusteru nainstalovat nebo přidat další moduly plug-in nebo knihovny?

    Ano, v závislosti na obrazcích clusteru můžete nainstalovat vlastní moduly plug-in a knihovny.

  • Můžu se ke svému clusteru připojit SSH?

    Ano, do clusteru můžete přes webssh spouštět dotazy a odesílat úlohy přímo z něj.

Metastore

  • Můžu se ke svému clusteru připojit pomocí externího metastoru?

    Ano, můžete použít externí metastore. Jako externí vlastní metastore však podporujeme pouze Službu Azure SQL Database.

  • Můžu metastor sdílet napříč několika clustery?

    Ano, metastor můžete sdílet napříč několika HDInsight a AKS.

  • Jaká je podporovaná verze metastoru Hive?

    Metastore Hive verze 3.1.2

Úlohy

Trino

  • Co je Trino?

    Trino je opensourcový federovaný a distribuovaný dotazovací modul SQL, který umožňuje dotazovat data umístěná v různých zdrojích dat bez přesunu do centrálního datového skladu. Data můžete dotazovat pomocí ANSI SQL, nemusíte se učit nový jazyk. Další informace najdete v tématu Trino – přehled.

  • Jaké všechny konektory podporujete?

    HDInsight v AKS Trino podporuje více konektorů. Další informace najdete v tomto seznamu konektorů Trino. Neustále přidáváme nové konektory jako a kdy jsou nové konektory k dispozici v opensourcové verzi.

  • Můžu přidat katalogy do existujícího clusteru?

    Ano, do existujícího clusteru můžete přidat podporované katalogy. Další informace naleznete v tématu Přidání katalogů do existujícího clusteru.

  • Co je Apache Flink?

    Apache Flink je špičkový opensourcový analytický modul pro zpracování datových proudů a výkon stavových výpočtů nad nevázanými a ohraničenými datovými proudy. Může provádět výpočty rychlostí v paměti a v libovolném měřítku. Flink ve službě HDInsight v AKS nabízí spravovaný open source Apache Flink. Další informace najdete v tématu Flink – přehled.

  • Podporujete režim relace i aplikace v Apache Flinku?

    Ve službě HDInsight v AKS Flink v současné době podporuje clustery v režimu relací.

  • Co je správa back-endu stavu a jak se provádí ve službě HDInsight v AKS?

    Back-endy určují, kde je uložený stav. Při aktivaci kontrolních bodů se stav zachová na kontrolních bodech, které chrání před ztrátou dat a konzistentně obnoví. Jak je stav reprezentován interně a jak a kde se zachová na kontrolních bodech, závisí na zvoleném back-endu státu. Další informace najdete v tématu Flink – přehled

Apache Spark

  • Co je Apache Spark?

    Apache Spark je architektura pro zpracování dat, která dokáže rychle provádět úlohy zpracování velkých sad dat a může také distribuovat úlohy zpracování dat mezi několik počítačů, a to buď samostatně, nebo společně s jinými distribuovanými výpočetními nástroji.

  • Jaká jazyková rozhraní API se podporují ve Sparku?

    Azure HDInsight v AKS podporuje Python a Scala.

  • Podporují se externí metastory ve službě HDInsight ve Službě AKS Spark?

    HDInsight v AKS podporuje připojení externího metastoru. V současné době se jako externí metastore podporuje jenom Azure SQL DATABASE.

  • Jaké jsou různé způsoby odesílání úloh ve službě HDInsight ve Službě AKS Spark?

    Úlohy ve službě HDInsight ve službě AKS Spark můžete odesílat pomocí poznámkového bloku Jupyter, poznámkového bloku Zeppelin, sady SDK a terminálu clusteru. Další informace najdete v tématu Odesílání a správa úloh v clusteru Spark ve službě HDInsight v AKS.