Készletkonfigurációs referencia
Ez a cikk a készlet felhasználói felülettel történő létrehozásakor elérhető beállításokat ismerteti. A Databricks parancssori felületének készlet létrehozásához való használatáról a Databricks parancssori felület parancsaiból tájékozódhat. Ha tudni szeretné, hogyan hozhat létre készletet a REST API-val, tekintse meg a Példánykészletek API-t.
Feljegyzés
Ha a számítási feladat támogatja a kiszolgáló nélküli számítást, a Databricks azt javasolja, hogy készletek helyett kiszolgáló nélküli számítást használjon, hogy kihasználhassa a mindig rendelkezésre álló, méretezhető számítás előnyeit. Lásd: Csatlakozás kiszolgáló nélküli számításhoz.
Készlet mérete
Készlet létrehozásakor a méretének szabályozásához három paramétert állíthat be: minimális üresjárati példányokat, maximális kapacitást és inaktív példány automatikus leállítását.
Minimális tétlen példányok
A készletben lévő példányok minimális száma tétlen marad. Ezek a példányok az automatikus megszüntetési beállításoktól függetlenül nem fejeződnek be. Ha egy fürt tétlen példányokat használ fel a készletből, az Azure Databricks további példányokat is kiépít a minimális érték fenntartásához.
Maximális kapacitás
A készlet által kiosztható példányok maximális száma. Ha be van állítva, ez az érték korlátozza az összes példányt (tétlen és használt). Ha egy készletet használó fürt ennél a számnál több példányt kér az automatikus skálázás során, a kérés hiba miatt INSTANCE_POOL_MAX_CAPACITY_FAILURE
meghiúsul.
Ez a konfiguráció nem kötelező. Az Azure Databricks azt javasolja, hogy csak a következő körülmények között állítsunk be értéket:
- Van egy példánykvótája, amely alatt kell maradnia.
- Meg szeretné védeni az egyik munkakészletet attól, hogy hatással legyen egy másik munkakészletre. Tegyük fel például, hogy a példánykvóta 100, és az A és b csapatnak feladatokat kell futtatnia. Létrehozhatja az A készletet legfeljebb 50-zel, a B készlet pedig legfeljebb 50-et, hogy a két csapat méltányosan ossza meg a 100 kvótát.
- Le kell fednie a költségeket.
Üresjárati példány automatikus leállítása
A minimális tétlenségi példányokban beállított érték feletti percekben megadott idő, amelynél a példányok tétlenek lehetnek, mielőtt a készlet leállítja őket.
Példánytípusok
A készlet két tétlen példányból áll, és készen áll az új fürtökre és a fürtök futtatásával használt példányokra. Mindegyik példány azonos példányszolgáltatótípusú, készlet létrehozásakor kiválasztva.
A készlet példánytípusa nem szerkeszthető. A készlethez csatolt fürtök ugyanazt a példánytípust használják az illesztőprogram és a feldolgozó csomópontok esetében. A példánytípusok különböző családjai különböző használati eseteket, például memóriaigényes vagy számítási igényű számítási feladatokat illesztenek be.
Az Azure Databricks mindig egyéves elavulási értesítést biztosít, mielőtt megszüntetené egy példánytípus támogatását.
Feljegyzés
Ha a biztonsági követelmények közé tartozik a számítási elkülönítés, válasszon egy Standard_F72s_V2 példányt feldolgozótípusként. Ezek a példánytípusok azokat az izolált virtuális gépeket jelölik, amelyek a teljes fizikai gazdagépet felhasználják, és biztosítják a szükséges elkülönítési szintet, amely például az EGYESÜLT Államok Védelmi Minisztériumának 5. (IL5) szintű számítási feladatainak támogatásához szükséges.
Előre betöltött Databricks Runtime-verzió
A fürtindítások felgyorsításához válassza ki a készlet üresjárati példányaiba betöltendő Databricks Runtime-verziót. Ha egy felhasználó ezt a futtatókörnyezetet választja a készlet által támogatott fürt létrehozásakor, az a fürt még gyorsabban elindul, mint egy készlet által támogatott fürt, amely nem használ előre betöltött Databricks-futtatókörnyezet-verziót.
Ha ezt a beállítást Nincs értékre állítja, az lelassítja a fürtindításokat, mivel a Databricks Futtatókörnyezet verziója igény szerint letöltődik a készlet üresjárati példányaiba. Amikor a fürt felszabadítja a készlet példányait, a Databricks Runtime-verzió gyorsítótárazva marad ezeken a példányokon. A következő fürtlétrehozási művelet, amely ugyanazt a Databricks Runtime-verziót használja, kihasználhatja ezt a gyorsítótárazási viselkedést, de ez nem garantált.
Előre betöltött Docker-rendszerkép
A Docker-rendszerképek készletekkel támogatottak, ha a Készletkészletek API-val hozza létre a készletet.
Készletcímkék
A készletcímkék lehetővé teszik a szervezet különböző csoportjai által használt felhőerőforrások költségeinek egyszerű monitorozását. A készletek létrehozásakor kulcs-érték párként megadhatja a címkéket, és az Azure Databricks ezeket a címkéket a felhőbeli erőforrásokra, például virtuális gépekre és lemezkötetekre, valamint DBU-használati jelentésekre alkalmazza.
A kényelem érdekében az Azure Databricks három alapértelmezett címkét alkalmaz minden készletre: Vendor
, DatabricksInstancePoolId
és DatabricksInstancePoolCreatorId
. Készlet létrehozásakor egyéni címkéket is hozzáadhat. Legfeljebb 41 egyéni címkét adhat hozzá.
Egyéni címkék
Ha további címkéket szeretne hozzáadni a készlethez, lépjen a Lapfülek lapra a Készlet létrehozása lap alján. Kattintson a + Hozzáadás gombra, majd adja meg a kulcs-érték párot.
A készlet által támogatott fürtök öröklik az alapértelmezett és az egyéni címkéket a készletkonfigurációból. A készletcímkék és a fürtcímkék együttes működéséről további információt a használat figyelése címkékkel című témakörben talál.
Helyi tároló automatikus skálázása
Gyakran nehéz megbecsülni, hogy egy adott feladat mennyi lemezterületet fog igénybe venni. Az Azure Databricks automatikusan engedélyezi a helyi tároló automatikus skálázását az összes Azure Databricks-készleten, hogy ne kelljen megbecsülnie, hogy hány gigabájtnyi felügyelt lemezt csatoljon a készlethez a létrehozáskor.
A helyi tároló automatikus skálázásával az Azure Databricks figyeli a készlet példányaihoz elérhető szabad lemezterület mennyiségét. Ha egy példány túl kevés lemezen fut, a rendszer automatikusan csatol egy új felügyelt lemezt, mielőtt elfogy a lemezterület. A lemezek legfeljebb 5 TB lemezterületet csatolnak virtuális gépenként (beleértve a virtuális gép kezdeti helyi tárolóját is).
A virtuális géphez csatlakoztatott felügyelt lemezek csak akkor lesznek leválasztva, ha a virtuális gép visszakerül az Azure-ba. Ez azt jelzi, hogy a felügyelt lemezek soha nem lesznek leválasztva a virtuális gépekről, amíg azok egy készlet részét képezik.
Kihasználatlan példányok
A költségek megtakarításához választhatja a kihasználatlan példányok használatát a Minden kihasználatlan választógomb bejelölésével.
A készletben lévő fürtök az összes csomóponthoz, illesztőprogramhoz és feldolgozóhoz (szemben a hibrid igény szerinti illesztőprogrammal és a nem készletfürtök kihasználatlan példányainak feldolgozóival) indulnak el.
Ha a kihasználatlanság miatt a kihasználatlanság miatt kiürítik a kihasználatlan példányokat, az igény szerinti példányok nem helyettesítik az kiürített példányokat.