Rövid útmutató: Új kiszolgáló nélküli Apache Spark-készlet létrehozása az Azure Portal használatával

Az Azure Synapse Analytics különböző elemzési motorokat kínál az adatok betöltéséhez, átalakításához, modellezéséhez, elemzéséhez és terjesztéséhez. Az Apache Spark-készlet nyílt forráskódú big data számítási képességeket biztosít. Miután létrehozott egy Apache Spark-készletet a Synapse-munkaterületen, az adatok betölthetők, modellezhetők, feldolgozhatók és terjeszthetők a gyorsabb elemzés érdekében.

Ebben a rövid útmutatóban megtudhatja, hogyan hozhat létre Apache Spark-készletet egy Synapse-munkaterületen az Azure Portal használatával.

Fontos

A Spark-példányok számlázása percalapú, függetlenül attól, hogy ön használja-e őket. Mindenképpen állítsa le a Spark-példányt a használat befejezése után, vagy állítson be egy rövid időtúllépést. További információkért lásd a cikk Az erőforrások eltávolítása című szakaszát.

Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot.

Előfeltételek

Jelentkezzen be az Azure Portalra

Jelentkezzen be az Azure Portalra

  1. Lépjen arra a Synapse-munkaterületre, ahol az Apache Spark-készlet létrejön, ha beírja a szolgáltatás nevét (vagy közvetlenül az erőforrás nevét) a keresősávba. Screenshot of the Azure portal search bar with Synapse workspaces typed in.

  2. A munkaterületek listájából írja be a megnyitni kívánt munkaterület nevét (vagy a név egy részét). Ebben a példában egy contosoanalytics nevű munkaterületet használunk. Screenshot from the Azure portal of the list of Synapse workspaces filtered to show those containing the name Contoso.

Új Apache Spark-készlet létrehozása

Fontos

Az Apache Spark 2.4-hez készült Azure Synapse Runtime 2023 szeptembere óta elavult, és hivatalosan nem támogatott. Mivel a Spark 3.1 és a Spark 3.2 is támogatás megszűnik, javasoljuk, hogy az ügyfelek migráljanak a Spark 3.3-ra.

  1. A Synapse-munkaterületen, ahol létre szeretné hozni az Apache Spark-készletet, válassza az Új Apache Spark-készletet. Screenshot from the Azure portal of a Synapse workspace with a red box around the command to create a new Apache Spark pool.

  2. Adja meg a következő adatokat az Alapismeretek lapon:

    Beállítás Ajánlott érték Leírás
    Apache Spark-készlet neve Érvényes készletnév, például contosospark Ez az Apache Spark-készlet neve.
    Csomópont mérete Kicsi (4 vCPU / 32 GB) Állítsa ezt a legkisebb méretre a rövid útmutató költségeinek csökkentéséhez
    Automatikus méretezés Disabled (Letiltva) Ehhez a rövid útmutatóhoz nincs szükség automatikus skálázásra
    Csomópontok száma 5 Kis méret használata a rövid útmutató költségeinek korlátozásához

    Screenshot from the Azure portal of the Apache Spark pool create flow - basics tab.

    Fontos

    Az Apache Spark-készletek által használható nevekre meghatározott korlátozások vonatkoznak. A neveknek csak betűket vagy számokat kell tartalmazniuk, 15 vagy annál kevesebb karakternek kell lenniük, betűvel kell kezdődniük, nem tartalmazhatnak fenntartott szavakat, és egyedinek kell lenniük a munkaterületen.

  3. Válassza a Tovább elemet : további beállítások, és tekintse át az alapértelmezett beállításokat. Ne módosítsa az alapértelmezett beállításokat. Screenshot from the Azure portal that shows the 'Create Apache Spark pool' page with the 'Additional settings' tab selected.

  4. Válassza a Tovább: címkék lehetőséget. Fontolja meg az Azure-címkék használatát. A "Tulajdonos" vagy a "CreatedBy" címke például azonosítja, hogy ki hozta létre az erőforrást, és a "Környezet" címkével azonosíthatja, hogy ez az erőforrás éles környezetben, fejlesztésben stb. található-e. További információ: Az Azure-erőforrások elnevezési és címkézési stratégiájának fejlesztése. Screenshot from the Azure portal of Apache Spark pool create flow - additional settings tab.

  5. Válassza az Áttekintés + létrehozás lehetőséget.

  6. Győződjön meg arról, hogy a korábban megadott adatok helyesen jelennek meg, majd válassza a Létrehozás lehetőséget. Screenshot from the Azure portal of Apache Spark pool create flow - review settings tab.

  7. Ekkor elindul az erőforrás-kiépítési folyamat, amely azt jelzi, hogy a folyamat befejeződött. Screenshot from the Azure portal of that shows the 'Overview' page with a 'Your deployment is complete' message displayed.

  8. A kiépítés befejezése után a munkaterületre való visszalépéskor megjelenik egy új bejegyzés az újonnan létrehozott Apache Spark-készlethez. Screenshot from the Azure portal of Apache Spark pool create flow - resource provisioning.

  9. Jelenleg nincsenek futó erőforrások, nincsenek díjak a Sparkért, metaadatokat hozott létre a létrehozni kívánt Spark-példányokról.

Az erőforrások eltávolítása

Az alábbi lépések törlik az Apache Spark-készletet a munkaterületről.

Figyelmeztetés

Az Apache Spark-készlet törlése eltávolítja az elemzési motort a munkaterületről. A továbbiakban nem lehet csatlakozni a készlethez, és az Apache Spark-készletet használó összes lekérdezés, folyamat és jegyzetfüzet nem fog működni.

Ha törölni szeretné az Apache Spark-készletet, hajtsa végre a következő lépéseket:

  1. Lépjen az Apache Spark-készletek panelre a munkaterületen.
  2. Válassza ki a törölni kívánt Apache Spark-készletet (ebben az esetben a contososparkot).
  3. Válassza a Törlés lehetőséget. Screenshot from the Azure portal of a list of Apache Spark pools, with the recently created pool selected.
  4. Erősítse meg a törlést, és válassza a Törlés gombot. Screenshot from the Azure portal of the Confirmation dialog to delete the selected Apache Spark pool.
  5. Ha a folyamat sikeresen befejeződött, az Apache Spark-készlet már nem fog szerepelni a munkaterület erőforrásai között.