Megosztás a következőn keresztül:


AI-futtatókörnyezet

Fontos

Az egycsomópontos feladatokhoz készült AI-futtatókörnyezet nyilvános előzetes verzióban érhető el. A több GPU-s számítási feladatok elosztott betanítási API-ja a bétaverzióban marad.

Az AI-futtatókörnyezet áttekintése

Az AI Runtime egy számítási ajánlat a Databricksben, amely mélytanulási számítási feladatokhoz készült, és GPU-támogatást nyújt a Databricks Serverlesshez. Az AI-futtatókörnyezettel egyéni modelleket taníthat be és finomíthat kedvenc keretrendszereivel, és a legkorszerűbb hatékonyságot, teljesítményt és minőséget érheti el. A kiszolgáló nélküli számításnak a Databricks-architektúrába való illeszkedésének áttekintéséért tekintse meg a kiszolgáló nélküli munkaterület architektúráját.

Legfontosabb funkciók

  • Teljes mértékben felügyelt GPU-infrastruktúra – Kiszolgáló nélküli, rugalmas hozzáférés gpu-khoz, fürtkonfiguráció, illesztőprogram-kiválasztás vagy automatikus skálázási szabályzatok nélkül.
  • A mély tanuláshoz dedikált futtatókörnyezet – Válasszon minimális alapértelmezett alapkörnyezetet a függőségekkel szemben maximális rugalmasság érdekében, vagy válasszon egy teljes funkcionalitású, népszerű ML-keretrendszerekkel előre betöltött AI-környezetet.
  • Natívan integrálva van jegyzetfüzetek, feladatok, Unity Catalog és MLflow között a zökkenőmentes fejlesztés, az adathozzáférés és a kísérletkövetés érdekében.

Hardverbeállítások

Gyorsító Legjobb Több GPU
A10 Kis és közepes gépi tanulási és mélytanulási feladatok, például klasszikus gépi tanulási modellek vagy kisebb nyelvi modellek finomhangolása No
H100 Nagy méretű AI-számítási feladatok, beleértve a nagy méretű modellek betanítását vagy finomhangolását vagy fejlett mélytanulási feladatok futtatását Igen (8 GPU)

A Databricks az AI Runtime használatát javasolja minden olyan egyéni modellbetanításhoz, amely mélytanulást, nagy léptékű klasszikus számítási feladatokat vagy GPU-kat foglal magában.

Például:

  • LLM finomhangolása (LoRA, QLoRA, teljes finomhangolás)
  • Számítógépes látás (objektumészlelés, képbesorolás)
  • Mélytanuláson alapuló ajánlórendszerek
  • Megerősítő tanulás
  • Mélytanuláson alapuló idősorok előrejelzése

Követelmények

  • Munkaterület az Azure által támogatott régiók egyikében:
    • centralus
    • eastus
    • eastus2
    • northcentralus
    • westcentralus
    • westus
    • westus3

Korlátozások

  • Az AI-futtatókörnyezet csak az A10- és H100-gyorsítókat támogatja.
  • A megfelelőségi biztonsági profilok munkaterületei (például a HIPAA vagy a PCI) nem támogatják az AI-futtatókörnyezetet. A szabályozott adatok feldolgozása nem támogatott.
  • Az Környezetek panelen a függőségek hozzáadása nem támogatott az AI futtatókörnyezet ütemezett feladatai számára. Telepítse a függőségeket programozott módon %pip install a jegyzetfüzetben.
  • Az AI-futtatókörnyezet ütemezett feladatai esetében a jegyzetfüzethez társított nem kompatibilis csomagverziók automatikus helyreállítási viselkedése nem támogatott.
  • A számítási feladatok maximális futásideje hét nap. Ha a modell betanításának futási ideje meghaladja ezt a korlátot, hajtsa végre az ellenőrzőpontot, és indítsa újra a feladatot a maximális futásidő elérése után.
  • Az AI-futtatókörnyezet igény szerinti hozzáférést biztosít a GPU-erőforrásokhoz. Bár ez egyszerű, rugalmas hozzáféréshez vezet a GPU-khoz, előfordulhatnak olyan időszakok, amikor a kapacitás korlátozott vagy nem érhető el a régióban.
  • Az AI-futtatókörnyezet kihasználja a régiók közötti GPU-kat bizonyos esetekben a nagy igényű időszakokban. Előfordulhat, hogy az ilyen használathoz kimenő költségek tartoznak.

Csatlakozás az AI-futtatási környezethez

Az AI-futtatókörnyezethez interaktívan csatlakozhat jegyzetfüzetekből, ütemezheti a jegyzetfüzeteket ismétlődő feladatként, vagy programozott módon hozhat létre feladatokat a Jobs API és a Databricks Asset Bundles használatával. Részletes útmutatásért tekintse meg a Csatlakozás az AI-futtatókörnyezethez című témakört.

Környezet beállítása

Az AI Runtime két felügyelt Python-környezetet kínál: egy minimális alapértelmezett alapkörnyezetet és egy teljes funkcionalitású Databricks AI-környezetet, amely előre betöltve van olyan népszerű ML-keretrendszerekkel, mint a PyTorch és a Transformers. A környezet kiválasztásával, a gyorsítótárazási viselkedéssel, az egyéni modulok importálásával és az ismert korlátozásokkal kapcsolatos részletekért lásd : A környezet beállítása.

Adatokat beolvasni

A zökkenőmentes működéshez elengedhetetlen az adathozzáférés működése az AI-futtatókörnyezetben. További információ: Adatok betöltése az AI-futtatókörnyezetben.

Elosztott betanítás

Fontos

Ez a funkció bétaverzióban érhető el. A munkaterület rendszergazdái az Előnézetek lapon szabályozhatják a funkcióhoz való hozzáférést. Lásd: Az Azure Databricks előzetes verziójának kezelése.

Az AI-futtatókörnyezet támogatja az elosztott betanítást több GPU-n azon a csomóponton, amelyhez a jegyzetfüzet csatlakozik. @distributed A Python API (bétaverzió) dekorátorával serverless_gpu több GPU-alapú számítási feladatokat indíthat el PyTorch DDP, FSDP vagy DeepSpeed használatával minimális konfigurációval. További részletekért lásd a több GPU-s számítási feladatokat.

Kísérletkövetés és megfigyelhetőség

Az MLflow-integrációval, a naplók megtekintésével és a modell ellenőrzőpont-kezelésével kapcsolatban lásd: Kísérletkövetés és megfigyelhetőség.

Genie Code a mély tanuláshoz

A Genie Code támogatja a mélytanulási számítási feladatokat az AI-futtatókörnyezetben. Segíthet a betanítási kód létrehozásában, a kódtár telepítési hibáinak megoldásában, az optimalizálásban és a gyakori problémák hibakeresésében. Lásd: Genie Code használata adatelemzéshez.

Guides

A klasszikus számítási feladatokból, például jegyzetfüzetekből és hibaelhárításból való migrálásról az AI-futtatókörnyezet felhasználói útmutatóiban olvashat.