Készletkonfigurációs referencia

Ez a cikk a készlet felhasználói felülettel történő létrehozásakor elérhető beállításokat ismerteti. Ha tudni szeretné, hogyan hozhat létre készletet a Databricks parancssori felületével, tekintse meg a Példánykészletek parancssori felületét (örökölt) ismertető témakört. Ha tudni szeretné, hogyan hozhat létre készletet a REST API-val, tekintse meg a Példánykészletek API-t.

Készlet mérete és automatikus leállítása

Készlet létrehozásakor a méretének szabályozásához három paramétert állíthat be: minimális üresjárati példányokat, maximális kapacitást és inaktív példány automatikus leállítását.

Minimális tétlen példányok

A készletben lévő példányok minimális száma tétlen marad. Ezek a példányok az automatikus megszüntetési beállításoktól függetlenül nem fejeződnek be. Ha egy fürt tétlen példányokat használ fel a készletből, az Azure Databricks további példányokat is kiépít a minimális érték fenntartásához.

Maximális kapacitás

A készlet által kiosztható példányok maximális száma. Ha be van állítva, ez az érték korlátozza az összes példányt (tétlen és használt). Ha egy készletet használó fürt ennél a számnál több példányt kér az automatikus skálázás során, a kérés hiba miatt INSTANCE_POOL_MAX_CAPACITY_FAILURE meghiúsul.

Ez a konfiguráció nem kötelező. Az Azure Databricks azt javasolja, hogy csak a következő körülmények között állítsunk be értéket:

  • Van egy példánykvótája, amely alatt kell maradnia.
  • Meg szeretné védeni az egyik munkakészletet attól, hogy hatással legyen egy másik munkakészletre. Tegyük fel például, hogy a példánykvóta 100, és az A és b csapatnak feladatokat kell futtatnia. Létrehozhatja az A készletet legfeljebb 50-zel, a B készlet pedig legfeljebb 50-et, hogy a két csapat méltányosan ossza meg a 100 kvótát.
  • Le kell fednie a költségeket.

Üresjárati példány automatikus leállítása

A minimális tétlenségi példányokban beállított érték feletti percekben megadott idő, amelynél a példányok tétlenek lehetnek, mielőtt a készlet leállítja őket.

Példánytípusok

A készlet két tétlen példányból áll, és készen áll az új fürtökre és a fürtök futtatásával használt példányokra. Mindegyik példány azonos példányszolgáltatótípusú, készlet létrehozásakor kiválasztva.

A készlet példánytípusa nem szerkeszthető. A készlethez csatolt fürtök ugyanazt a példánytípust használják az illesztőprogram és a feldolgozó csomópontok esetében. A példánytípusok különböző családjai különböző használati eseteket, például memóriaigényes vagy számítási igényű számítási feladatokat illesztenek be.

Az Azure Databricks mindig egyéves elavulási értesítést biztosít, mielőtt megszüntetené egy példánytípus támogatását.

Feljegyzés

Ha a biztonsági követelmények közé tartozik a számítási elkülönítés, válasszon egy Standard_F72s_V2 példányt feldolgozótípusként. Ezek a példánytípusok azokat az izolált virtuális gépeket jelölik, amelyek a teljes fizikai gazdagépet felhasználják, és biztosítják a szükséges elkülönítési szintet, amely például az EGYESÜLT Államok Védelmi Minisztériumának 5. (IL5) szintű számítási feladatainak támogatásához szükséges.

Előre betöltött Databricks Runtime-verzió

A fürtindítások felgyorsításához válassza ki a készlet üresjárati példányaiba betöltendő Databricks Runtime-verziót. Ha egy felhasználó ezt a futtatókörnyezetet választja a készlet által támogatott fürt létrehozásakor, az a fürt még gyorsabban elindul, mint egy készlet által támogatott fürt, amely nem használ előre betöltött Databricks-futtatókörnyezet-verziót.

Ha ezt a beállítást Nincs értékre állítja, az lelassítja a fürtindításokat, mivel a Databricks Futtatókörnyezet verziója igény szerint letöltődik a készlet üresjárati példányaiba. Amikor a fürt felszabadítja a készlet példányait, a Databricks Runtime-verzió gyorsítótárazva marad ezeken a példányokon. A következő fürtlétrehozási művelet, amely ugyanazt a Databricks Runtime-verziót használja, kihasználhatja ezt a gyorsítótárazási viselkedést, de ez nem garantált.

Előre betöltött Docker-rendszerkép

A Docker-rendszerképek készletekkel támogatottak, ha a Készletkészletek API-val hozza létre a készletet.

Készletcímkék

A készletcímkék lehetővé teszik a szervezet különböző csoportjai által használt felhőerőforrások költségeinek egyszerű monitorozását. A készletek létrehozásakor kulcs-érték párként megadhatja a címkéket, és az Azure Databricks ezeket a címkéket a felhőbeli erőforrásokra, például virtuális gépekre és lemezkötetekre, valamint DBU-használati jelentésekre alkalmazza.

A kényelem érdekében az Azure Databricks három alapértelmezett címkét alkalmaz minden készletre: Vendor, DatabricksInstancePoolIdés DatabricksInstancePoolCreatorId. Készlet létrehozásakor egyéni címkéket is hozzáadhat. Legfeljebb 41 egyéni címkét adhat hozzá.

Egyéni címkék

Ha további címkéket szeretne hozzáadni a készlethez, lépjen a Lapfülek lapra a Készlet létrehozása lap alján. Kattintson a + Hozzáadás gombra, majd adja meg a kulcs-érték párot.

A készlet által támogatott fürtök öröklik az alapértelmezett és az egyéni címkéket a készletkonfigurációból. A készletcímkék és a fürtcímkék együttes működéséről további információt a használat figyelése címkékkel című témakörben talál.

Helyi tároló automatikus skálázása

Gyakran nehéz megbecsülni, hogy egy adott feladat mennyi lemezterületet fog igénybe venni. Az Azure Databricks automatikusan engedélyezi a helyi tároló automatikus skálázását az összes Azure Databricks-készleten, hogy ne kelljen megbecsülnie, hogy hány gigabájtnyi felügyelt lemezt csatoljon a készlethez a létrehozáskor.

A helyi tároló automatikus skálázásával az Azure Databricks figyeli a készlet példányaihoz elérhető szabad lemezterület mennyiségét. Ha egy példány túl kevés lemezen fut, a rendszer automatikusan csatol egy új felügyelt lemezt, mielőtt elfogy a lemezterület. A lemezek legfeljebb 5 TB lemezterületet csatolnak virtuális gépenként (beleértve a virtuális gép kezdeti helyi tárolóját is).

A virtuális géphez csatlakoztatott felügyelt lemezek csak akkor lesznek leválasztva, ha a virtuális gép visszakerül az Azure-ba. Ez azt jelzi, hogy a felügyelt lemezek soha nem lesznek leválasztva a virtuális gépekről, amíg azok egy készlet részét képezik.

Kihasználatlan példányok

A költségek megtakarításához választhatja a kihasználatlan példányok használatát a Minden kihasználatlan választógomb bejelölésével.

A készletben lévő fürtök az összes csomóponthoz, illesztőprogramhoz és feldolgozóhoz (szemben a hibrid igény szerinti illesztőprogrammal és a nem készletfürtök kihasználatlan példányainak feldolgozóival) indulnak el.

Ha a kihasználatlanság miatt a kihasználatlanság miatt kiürítik a kihasználatlan példányokat, az igény szerinti példányok nem helyettesítik az kiürített példányokat.