Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Fontos
Az egycsomópontos feladatokhoz készült AI-futtatókörnyezet nyilvános előzetes verzióban érhető el. A több GPU-s számítási feladatok elosztott betanítási API-ja a bétaverzióban marad.
Az AI-futtatókörnyezet áttekintése
Az AI Runtime egy számítási ajánlat a Databricksben, amely mélytanulási számítási feladatokhoz készült, és GPU-támogatást nyújt a Databricks Serverlesshez. Az AI-futtatókörnyezettel egyéni modelleket taníthat be és finomíthat kedvenc keretrendszereivel, és a legkorszerűbb hatékonyságot, teljesítményt és minőséget érheti el. A kiszolgáló nélküli számításnak a Databricks-architektúrába való illeszkedésének áttekintéséért tekintse meg a kiszolgáló nélküli munkaterület architektúráját.
Legfontosabb funkciók
- Teljes mértékben felügyelt GPU-infrastruktúra – Kiszolgáló nélküli, rugalmas hozzáférés gpu-khoz, fürtkonfiguráció, illesztőprogram-kiválasztás vagy automatikus skálázási szabályzatok nélkül.
- A mély tanuláshoz dedikált futtatókörnyezet – Válasszon minimális alapértelmezett alapkörnyezetet a függőségekkel szemben maximális rugalmasság érdekében, vagy válasszon egy teljes funkcionalitású, népszerű ML-keretrendszerekkel előre betöltött AI-környezetet.
- Natívan integrálva van jegyzetfüzetek, feladatok, Unity Catalog és MLflow között a zökkenőmentes fejlesztés, az adathozzáférés és a kísérletkövetés érdekében.
Hardverbeállítások
| Gyorsító | Legjobb | Több GPU |
|---|---|---|
| A10 | Kis és közepes gépi tanulási és mélytanulási feladatok, például klasszikus gépi tanulási modellek vagy kisebb nyelvi modellek finomhangolása | No |
| H100 | Nagy méretű AI-számítási feladatok, beleértve a nagy méretű modellek betanítását vagy finomhangolását vagy fejlett mélytanulási feladatok futtatását | Igen (8 GPU) |
Ajánlott használati esetek
A Databricks az AI Runtime használatát javasolja minden olyan egyéni modellbetanításhoz, amely mélytanulást, nagy léptékű klasszikus számítási feladatokat vagy GPU-kat foglal magában.
Például:
- LLM finomhangolása (LoRA, QLoRA, teljes finomhangolás)
- Számítógépes látás (objektumészlelés, képbesorolás)
- Mélytanuláson alapuló ajánlórendszerek
- Megerősítő tanulás
- Mélytanuláson alapuló idősorok előrejelzése
Követelmények
- Munkaterület az Azure által támogatott régiók egyikében:
centraluseastuseastus2northcentraluswestcentraluswestuswestus3
Korlátozások
- Az AI-futtatókörnyezet csak az A10- és H100-gyorsítókat támogatja.
- A megfelelőségi biztonsági profilok munkaterületei (például a HIPAA vagy a PCI) nem támogatják az AI-futtatókörnyezetet. A szabályozott adatok feldolgozása nem támogatott.
- Az Környezetek panelen a függőségek hozzáadása nem támogatott az AI futtatókörnyezet ütemezett feladatai számára. Telepítse a függőségeket programozott módon
%pip installa jegyzetfüzetben. - Az AI-futtatókörnyezet ütemezett feladatai esetében a jegyzetfüzethez társított nem kompatibilis csomagverziók automatikus helyreállítási viselkedése nem támogatott.
- A számítási feladatok maximális futásideje hét nap. Ha a modell betanításának futási ideje meghaladja ezt a korlátot, hajtsa végre az ellenőrzőpontot, és indítsa újra a feladatot a maximális futásidő elérése után.
- Az AI-futtatókörnyezet igény szerinti hozzáférést biztosít a GPU-erőforrásokhoz. Bár ez egyszerű, rugalmas hozzáféréshez vezet a GPU-khoz, előfordulhatnak olyan időszakok, amikor a kapacitás korlátozott vagy nem érhető el a régióban.
- Az AI-futtatókörnyezet kihasználja a régiók közötti GPU-kat bizonyos esetekben a nagy igényű időszakokban. Előfordulhat, hogy az ilyen használathoz kimenő költségek tartoznak.
Csatlakozás az AI-futtatási környezethez
Az AI-futtatókörnyezethez interaktívan csatlakozhat jegyzetfüzetekből, ütemezheti a jegyzetfüzeteket ismétlődő feladatként, vagy programozott módon hozhat létre feladatokat a Jobs API és a Databricks Asset Bundles használatával. Részletes útmutatásért tekintse meg a Csatlakozás az AI-futtatókörnyezethez című témakört.
Környezet beállítása
Az AI Runtime két felügyelt Python-környezetet kínál: egy minimális alapértelmezett alapkörnyezetet és egy teljes funkcionalitású Databricks AI-környezetet, amely előre betöltve van olyan népszerű ML-keretrendszerekkel, mint a PyTorch és a Transformers. A környezet kiválasztásával, a gyorsítótárazási viselkedéssel, az egyéni modulok importálásával és az ismert korlátozásokkal kapcsolatos részletekért lásd : A környezet beállítása.
Adatokat beolvasni
A zökkenőmentes működéshez elengedhetetlen az adathozzáférés működése az AI-futtatókörnyezetben. További információ: Adatok betöltése az AI-futtatókörnyezetben.
Elosztott betanítás
Fontos
Ez a funkció bétaverzióban érhető el. A munkaterület rendszergazdái az Előnézetek lapon szabályozhatják a funkcióhoz való hozzáférést. Lásd: Az Azure Databricks előzetes verziójának kezelése.
Az AI-futtatókörnyezet támogatja az elosztott betanítást több GPU-n azon a csomóponton, amelyhez a jegyzetfüzet csatlakozik.
@distributed A Python API (bétaverzió) dekorátorával serverless_gpu több GPU-alapú számítási feladatokat indíthat el PyTorch DDP, FSDP vagy DeepSpeed használatával minimális konfigurációval. További részletekért lásd a több GPU-s számítási feladatokat.
Kísérletkövetés és megfigyelhetőség
Az MLflow-integrációval, a naplók megtekintésével és a modell ellenőrzőpont-kezelésével kapcsolatban lásd: Kísérletkövetés és megfigyelhetőség.
Genie Code a mély tanuláshoz
A Genie Code támogatja a mélytanulási számítási feladatokat az AI-futtatókörnyezetben. Segíthet a betanítási kód létrehozásában, a kódtár telepítési hibáinak megoldásában, az optimalizálásban és a gyakori problémák hibakeresésében. Lásd: Genie Code használata adatelemzéshez.
Guides
A klasszikus számítási feladatokból, például jegyzetfüzetekből és hibaelhárításból való migrálásról az AI-futtatókörnyezet felhasználói útmutatóiban olvashat.