Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Fontos
Az egycsomópontos feladatokhoz készült AI-futtatókörnyezet nyilvános előzetes verzióban érhető el. A több GPU-s számítási feladatok elosztott betanítási API-ja a bétaverzióban marad.
Ez a lap bemutatja, hogyan választhat és konfigurálhat Python-környezetet az AI-futtatókörnyezethez, beleértve a környezet gyorsítótárazási viselkedését, az egyéni modulimportálást és az ismert korlátozásokat.
Milyen környezetet használjon?
Az AI Runtime két felügyelt Python-környezetet kínál, az alapértelmezett alapkörnyezetet és a Databricks AI-környezetet.
| Környezet | Főbb jellemzők | Mikor érdemes használni? |
|---|---|---|
| Alapértelmezett alapkörnyezet | Minimális, csak torch, cuda, és torchvision |
Teljes körű vezérlést szeretne a függőségi verem felett, és inkább csak azt szeretné telepíteni, amire szüksége van |
| Databricks AI-környezet | Előre betöltve népszerű gépi tanulási (ML) keretrendszerekkel (PyTorch, Transformers és mások) | Teljes környezetet szeretne a betanításhoz, finomhangoláshoz és kísérletezéshez manuális függőségkezelés nélkül |
Megjegyzés:
A munkaterület alapkörnyezetei nem támogatottak az AI-futtatókörnyezetekben. Ehelyett használja az alapértelmezett vagy az AI-környezetet, és adjon meg további függőségeket közvetlenül a Környezetek oldalpanelen vagy pip install azokban.
Alapértelmezett alapkörnyezet (minimális környezet)
Minimális, stabil környezet, amely csak az AI Runtime-művelethez szükséges csomagokat tartalmazza. A környezet tartalmazza a torch, cuda, és torchvision elemeket, amelyek kompatibilitásra vannak optimalizálva. Adott csomagverziókhoz szükség szerint használja pip install vagy rögzítse a szükséges verziókat.
A legjobb megoldás: Azok a felhasználók, akik teljes mértékben szabályozni szeretnék a függőségi vermet, és csak azt szeretnék telepíteni, amire szükségük van.
Ez az alapértelmezett környezet, amikor AI-futtatókörnyezeten keresztül csatlakozik kiszolgáló nélküli GPU-hoz.
A különböző verziókban telepített csomagverziókkal kapcsolatos további részletekért tekintse meg a kibocsátási megjegyzéseket:
Databricks AI-környezet
A 4. és újabb környezetben érhető el. Az AI-környezet az alapértelmezett alapkörnyezetre épül, gyakori futtatókörnyezeti csomagokkal és a GPU-k gépi tanulására jellemző csomagokkal. Az előre telepített csomagok a következők:
- PyTorch (CUDA-támogatással)
- Transformers (Hugging Face)
- És további ML/DL-függőségek
A legjobb megoldás: olyan gépi tanulási szakembereknek, akik teljes környezetet szeretnének a számítási feladatok betanításához, a finomhangoláshoz és a kísérletezéshez manuális függőségkezelés nélkül.
A kiválasztáshoz: A Környezet oldali panelen válassza az AI v4-es verziót alapkörnyezetként.
A különböző verziókban telepített csomagverziókkal kapcsolatos további részletekért tekintse meg a kibocsátási megjegyzéseket:
Munkaterület alapkörnyezetei
A munkaterület alapkörnyezetei nem támogatottak az AI-futtatókörnyezetekben. Egyéni munkaterületszintű környezetkonfigurációk nem használhatók.
A mélytanulási környezet projekthez való konfigurálásához használja a két alapkörnyezet egyikét (alapértelmezett vagy Databricks AI), és telepítsen további csomagokat programozott módon %pip install a jegyzetfüzetben vagy a betanítási szkript tetején:
%pip install datasets accelerate peft bitsandbytes
További kódtárakat telepíthet az AI Runtime-környezetbe. Lásd: Függőségek hozzáadása a jegyzetfüzethez.
Magatartás
Mikor vannak gyorsítótárazva a környezetek?
A környezetek a munkamenetek között gyorsítótárazva vannak az indítási idők felgyorsítása érdekében. Ha ugyanazzal a környezetkonfigurációval újracsatlakozik az AI-futtatókörnyezethez, a korábban telepített csomagok elérhetők lehetnek a gyorsítótárból, ami csökkenti a beállítási időt.
A gyorsítótár működése azonban nem garantált – mindig győződjön meg arról, hogy a jegyzetfüzet tartalmazza a reprodukálhatósághoz szükséges %pip install parancsokat.
Hogyan importálhatok egyéni modulokat?
Az egyéni modulokat úgy importálhatja, hogy elhelyezi őket /Workspace/Shared és hozzáadja az elérési utat ehhez: sys.path.
import sys
sys.path.append("/Workspace/Shared/my-project/src")
from my_module import my_function
A modulfájlokat munkaterületfájlokként is feltöltheti, és közvetlenül importálhatja őket. A többfelhasználós együttműködéshez a megosztott kódot /Workspace/Shared a felhasználóspecifikus mappák helyett tárolja. Aktív fejlesztéshez használjon felhasználóspecifikus mappákat, és küldjön le egy távoli Git-adattárba a verziókövetéshez.
Korlátozások
A következő képességek nem érhetők el az AI-futtatókörnyezetben:
- Spark-függvények – A PySpark-függvényeket nem importálhatja vagy használhatja közvetlenül. Az AI-futtatókörnyezet csak Python-környezet; A Spark helyi futtatókörnyezetként nem érhető el. A Spark Connect azonban elérhető adatbetöltéshez. Lásd : Adatok betöltése az AI-futtatókörnyezetben.
- Databricks Runtime ML-kódtárak – Az előre telepített csomagok nem helyettesítik a Databricks Runtime ML-t. Előfordulhat, hogy a Databricks Runtime ML-ben elérhető egyes ML-kódtárak nincsenek előre telepítve az AI-futtatókörnyezetben.
- Munkaterületi alapkörnyezetek – Az egyéni munkaterületszintű környezetkonfigurációk nem támogatottak.
- Privát összetevők – Az AI-futtatókörnyezet bizonyos esetekben támogatja a privát összetevőket. További részletekért forduljon a fiókcsapatához.