Rychlý start: Vytvoření bezserverového fondu Apache Sparku pomocí nástroje Synapse Studio

Azure Synapse Analytics nabízí různé analytické moduly, které vám pomůžou ingestovat, transformovat, modelovat, analyzovat a obsluhovat data. Fond Apache Spark nabízí opensourcové výpočetní funkce pro velké objemy dat. Po vytvoření fondu Apache Sparku v pracovním prostoru Synapse je možné načíst, modelovat, zpracovávat a obsluhovat data za účelem získání přehledů.

Tento rychlý start popisuje postup vytvoření fondu Apache Spark v pracovním prostoru Synapse pomocí nástroje Synapse Studio.

Důležité

Fakturace instancí Sparku se účtuje za minutu bez ohledu na to, jestli je používáte, nebo ne. Po dokončení použití nezapomeňte instanci Sparku vypnout nebo nastavit krátký časový limit. Další informace najdete v části Vyčištění prostředků tohoto článku.

Pokud ještě nemáte předplatné Azure, vytvořte si napřed bezplatný účet.

Požadavky

Přihlaste se k portálu Azure Portal.

Přihlaste se k portálu Azure Portal.

  1. Přejděte do pracovního prostoru Synapse, kde se fond Apache Sparku vytvoří zadáním názvu služby (nebo názvu prostředku přímo) do panelu hledání. Screenshot from the Azure portal of the search bar with Synapse workspaces typed in.

  2. V seznamu pracovních prostorů zadejte název (nebo část názvu) pracovního prostoru, který chcete otevřít. V tomto příkladu používáme pracovní prostor s názvem contosoanalytics. Screenshot from the Azure portal of the list of Synapse workspaces filtered to show those containing the name Contoso.

Spuštění funkce Synapse Studio

V přehledu pracovního prostoru vyberte webovou adresu URL pracovního prostoru a otevřete Synapse Studio.

Screenshot from the Azure portal of a Synapse workspace overview with Launch Synapse Studio highlighted.

Vytvoření fondu Apache Sparku v nástroji Synapse Studio

Důležité

Modul runtime Azure Synapse pro Apache Spark 2.4 se od září 2023 oficiálně nepodporuje. Vzhledem k tomu , že Spark 3.1 a Spark 3.2 jsou také oznámeny ukončení podpory, doporučujeme zákazníkům migrovat na Spark 3.3.

  1. Na domovské stránce synapse Studia přejděte do centra pro správu v levém navigačním panelu výběrem ikony Spravovat . Screenshot from the Azure portal of the Synapse Studio home page with Management Hub section highlighted.

  2. Jakmile jste v centru pro správu, přejděte do části Fondy Apache Sparku a zobrazte aktuální seznam fondů Apache Spark, které jsou dostupné v pracovním prostoru. Screenshot from the Azure portal of the Synapse Studio management hub with Apache Spark pools navigation selected.

  3. Vyberte + Nový a zobrazí se průvodce vytvořením nového fondu Apache Spark.

  4. Na kartě Základy zadejte následující podrobnosti:

    Nastavení Navrhovaná hodnota Popis
    Název fondu Apache Sparku Platný název fondu, například contosospark Toto je název, který bude mít fond Apache Spark.
    Velikost uzlu Malý (4 vCPU / 32 GB) Nastavte tuto možnost na nejmenší velikost, abyste snížili náklady na tento rychlý start.
    Automatické škálování Zakázáno V tomto rychlém startu nebudeme potřebovat automatické škálování.
    Počet uzlů 8 Použití malé velikosti k omezení nákladů v tomto rychlém startu
    Dynamicky přidělovat exekutory Zakázáno Toto nastavení se mapuje na vlastnost dynamického přidělení v konfiguraci Sparku pro přidělení exekutorů aplikací Sparku. V tomto rychlém startu nebudeme potřebovat automatické škálování.

    Screenshot from the Azure portal of the Basics for Synapse Studio new Apache Spark pool.

    Důležité

    Pro názvy, které fondy Apache Sparku můžou používat, platí určitá omezení. Názvy musí obsahovat pouze písmena nebo číslice, musí mít maximálně 15 znaků, musí začínat písmenem, nesmí obsahovat vyhrazená slova a být v pracovním prostoru jedinečná.

  5. Na další kartě Další nastavení ponechte všechna nastavení jako výchozí.

  6. Vyberte Značky. Zvažte použití značek Azure. Například značka "Owner" nebo "CreatedBy", která identifikuje, kdo prostředek vytvořil, a značku Prostředí, abyste zjistili, jestli se tento prostředek nachází v produkčním prostředí, vývoji atd. Další informace najdete v tématu Vývoj strategie vytváření názvů a označování prostředků Azure. Až budete připraveni, vyberte Zkontrolovat a vytvořit.

  7. Na kartě Revize a vytvoření se ujistěte, že podrobnosti vypadají správně podle toho, co bylo dříve zadáno, a stiskněte tlačítko Vytvořit.

    Screenshot from the Azure portal of the Create Synapse Studio new Apache Spark pool.

  8. Fond Apache Spark spustí proces zřizování.

  9. Po dokončení zřizování se nový fond Apache Sparku zobrazí v seznamu.

    Screenshot from the Azure portal of the Synapse Studio new Apache Spark pool list.

Vyčištění prostředků fondu Apache Spark pomocí nástroje Synapse Studio

Následující kroky odstraňte fond Apache Sparku z pracovního prostoru pomocí nástroje Synapse Studio.

Upozorňující

Odstraněním fondu Sparku odeberete analytický modul z pracovního prostoru. Už se nebude možné připojit k fondu a všechny dotazy, kanály a poznámkové bloky, které tento fond Sparku používají, už nebudou fungovat.

Pokud chcete odstranit fond Apache Sparku, proveďte následující kroky:

  1. Ve službě Synapse Studio přejděte do fondů Apache Sparku v centru pro správu.

  2. Výběrem tří teček vedle fondu Apache, který se má odstranit (v tomto případě contosospark), zobrazí se příkazy pro fond Apache Spark.

    Screenshot from the Azure portal of a list of Apache Spark pools, with the recently created pool selected.

  3. Vyberte Odstranit.

  4. Potvrďte odstranění a stiskněte tlačítko Delete .

  5. Po úspěšném dokončení procesu už fond Apache Spark nebude uvedený v prostředcích pracovního prostoru.