Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Fontos
Ez a funkció bétaverzióban érhető el. A munkaterület rendszergazdái az Előnézetek lapon szabályozhatják a funkcióhoz való hozzáférést. Lásd: Az Azure Databricks előzetes verziójának kezelése.
Ez a cikk a Databricks kiszolgáló nélküli GPU-számítását ismerteti, és ajánlott használati eseteket, útmutatást nyújt a GPU-számítási erőforrások beállításához és a funkciók korlátozásához.
Mi a kiszolgáló nélküli GPU-számítás?
A kiszolgáló nélküli GPU-számítás a kiszolgáló nélküli számítási ajánlat része. A kiszolgáló nélküli GPU-számítás egyéni egy- és többcsomópontos mélytanulási számítási feladatokra specializálódott. A kiszolgáló nélküli GPU-számítással betaníthatja és finomhangolhatja az egyéni modelleket kedvenc keretrendszereivel, és a legszínesebb hatékonyságot, teljesítményt és minőséget érheti el.
A kiszolgáló nélküli GPU-számítás a következőket tartalmazza:
- Integrált felhasználói felület a jegyzetfüzetekben, a Unity Catalogban és az MLflow-ban: A kódot interaktívan, jegyzetfüzetek használatával fejlesztheti.
- A10 GPU-gyorsítók:Az A10 GPU-k célja a kis- és közepes gépi tanulási és mély tanulási számítási feladatok felgyorsítása, beleértve a klasszikus ML-modelleket és a kisebb nyelvi modellek finomhangolását. Az A10-ek jól alkalmazhatók közepes számítási követelményekkel rendelkező feladatokhoz.
- Több GPU és többcsomópontos támogatás: Az elosztott betanítási számítási feladatok több GPU-t és több csomópontot is futtathatnak a kiszolgáló nélküli GPU Python API-val. Lásd: Elosztott betanítás.
A kiszolgáló nélküli GPU-számítás előre telepített csomagjai nem helyettesítik a Databricks Runtime ML-t. Bár vannak gyakori csomagok, nem minden Databricks Runtime ML-függőség és -kódtár jelenik meg a kiszolgáló nélküli GPU számítási környezetben.
Python-környezetek kiszolgáló nélküli GPU-számításon
A Databricks két felügyelt környezetet biztosít a különböző használati esetek kiszolgálásához.
Megjegyzés:
A munkaterület alapkörnyezetei nem támogatottak a kiszolgáló nélküli GPU-számításhoz. Ehelyett használja az alapértelmezett vagy az AI-környezetet, és adjon meg további függőségeket közvetlenül a Környezetek oldalpanelen vagy pip install azokban.
Alapértelmezett alapkörnyezet
Ez minimális környezetet biztosít stabil ügyfél API-val az alkalmazáskompatibilitás biztosítása érdekében. Csak a szükséges Python-csomagok vannak telepítve. Ez lehetővé teszi a Databricks számára, hogy függetlenül frissítse a szervert, így fejlesztve a teljesítményt, javítva a biztonságot, és kijavítva a hibákat anélkül, hogy bármilyen kódbeli módosítást igényelne a munkaterheléseken. Ez az alapértelmezett környezet a kiszolgáló nélküli GPU-számítás kiválasztásakor. Válassza ezt a környezetet, ha teljes mértékben testre szeretné szabni a környezetet a betanításhoz.
A különböző verziókban telepített csomagverziókkal kapcsolatos további részletekért tekintse meg a kibocsátási megjegyzéseket:
AI-környezet
A Databricks AI-környezet kiszolgáló nélküli GPU-környezetben érhető el 4. Az AI-környezet az alapértelmezett alapkörnyezetre épül, gyakori futtatókörnyezeti csomagokkal és a GPU-k gépi tanulására jellemző csomagokkal. Népszerű gépi tanulási kódtárakat tartalmaz, például PyTorch, LangChain, Transformers, Ray és XGBoost modellek betanításához és következtetéséhez. Válassza ezt a környezetet a betanítási számítási feladatok futtatásához. További részletekért tekintse meg a dokumentumot.
A különböző verziókban telepített csomagverziókkal kapcsolatos további részletekért tekintse meg a kibocsátási megjegyzéseket:
Ajánlott használati esetek
A Databricks a kiszolgáló nélküli GPU-számítást javasolja minden olyan modell betanítási használati esetéhez, amely betanítási testreszabásokat és GPU-kat igényel.
Például:
- LLM finomhangolása
- Számítógépes látás
- Ajánló rendszerek
- Megerősítő tanulás
- Mélytanuláson alapuló idősorok előrejelzése
Követelmények
- Munkaterület az Azure által támogatott régiók egyikében:
eastuseastus2centralusnorthcentraluswestcentraluswestus
Kiszolgáló nélküli GPU-számítás beállítása
A jegyzetfüzet kiszolgáló nélküli GPU-számításhoz való csatlakoztatásához és a környezet konfigurálásához:
- Egy jegyzetfüzetben kattintson a felül található Connect legördülő menüre, és válassza a Kiszolgáló nélküli GPU lehetőséget.
- Kattintson a
A Környezet oldalpanel megnyitásához.
- A Gyorsító mezőből válassza az A10-et.
- Válassza a Nincs lehetőséget az alapértelmezett környezethez vagy az AI v4-et az AI-környezethez az Alapkörnyezet mezőben.
- Kattintson az Alkalmaz gombra, majd erősítse meg , hogy a kiszolgáló nélküli GPU-számítást a jegyzetfüzet-környezetre szeretné alkalmazni.
Megjegyzés:
A számítási kapcsolat 60 perc inaktivitás után automatikusan leáll.
Könyvtárak hozzáadása a környezethez
További kódtárakat is telepíthet a kiszolgáló nélküli GPU számítási környezetbe. Lásd: Függőségek hozzáadása a jegyzetfüzethez.
Megjegyzés:
A függőségek hozzáadása a Környezetek panelen látható módon, ahogyan az a "Függőségek hozzáadása a jegyzetfüzethez" részben szerepel, nem támogatott kiszolgáló nélküli GPU számítási ütemezett feladatokhoz.
Feladat létrehozása és ütemezése
Az alábbi lépések bemutatják, hogyan hozhat létre és ütemezhet feladatokat kiszolgáló nélküli GPU számítási feladatokhoz. További részletekért lásd: Ütemezett jegyzetfüzet-feladatok létrehozása és kezelése .
A használni kívánt jegyzetfüzet megnyitása után:
- Kattintson a jobb felső sarokban található Ütemezés gombra.
- Válassza az Ütemezés hozzáadása lehetőséget.
- Töltse ki az Új ütemezés űrlapot a feladat nevével, ütemezésével és számításával.
- Válassza a Create gombot.
Feladatokat a Feladatok és folyamatok felhasználói felületéről is létrehozhat és ütemezhet. Részletes útmutatásért tekintse meg az Új feladat létrehozása című témakört.
Elosztott betanítás
Lásd: Elosztott betanítás.
Korlátozások
- A kiszolgáló nélküli GPU-számítás csak az A10-gyorsítókat támogatja.
- A Private Link nem támogatott. A Private Link mögötti tároló- vagy pip-adattárak nem támogatottak.
- A kiszolgáló nélküli GPU-számítás nem támogatott a megfelelőségi biztonsági profilok munkaterületei (például a HIPAA vagy a PCI) esetében. A szabályozott adatok feldolgozása jelenleg nem támogatott.
- A kiszolgáló nélküli GPU-számítás ütemezett feladatai esetén a jegyzetfüzethez társított nem kompatibilis csomagverziók automatikus helyreállítási viselkedése nem támogatott.
- A számítási feladatok maximális futásideje hét nap. Amennyiben a modell betanítási feladatai túllépik ezt a korlátot, kérjük, alkalmazzon ellenőrzőpontokat, és indítsa újra a feladatot a maximális futásidő elérése után.
Adatbetöltés
Lásd : Adatok betöltése kiszolgáló nélküli GPU-számításon.
Ajánlott eljárások
Tekintse meg a kiszolgáló nélküli GPU-számítás ajánlott eljárásait.
Kiszolgáló nélküli GPU-számítással kapcsolatos problémák elhárítása
Ha problémákat tapasztal a számítási feladatok kiszolgáló nélküli GPU-számításon való futtatásával kapcsolatban, tekintse meg a gyakori problémákat, kerülő megoldásokat és támogatási erőforrásokat ismertető hibaelhárítási útmutatót .
Jegyzetfüzet példák
Az alábbiakban különböző jegyzetfüzet-példákat láthat, amelyek bemutatják, hogyan használható a kiszolgáló nélküli GPU-számítás a különböző feladatokhoz.
| Feladatok | Description |
|---|---|
| Nagy nyelvi modellek (LLM-ek) | Példák a nagy nyelvi modellek finomhangolására, beleértve a paraméter-hatékony módszereket, például a Low-Rank Adaptációt (LoRA) és a felügyelt finomhangolási módszereket. |
| Számítógépes látás | Példák számítógépes látási feladatokra, beleértve az objektumészlelést és a képbesorolást. |
| Mélytanuláson alapuló ajánlórendszerek | Példák javaslati rendszerek létrehozására modern mélytanulási megközelítésekkel, például kéttornyú modellekkel. |
| Klasszikus ML | Példák a hagyományos gépi tanulási feladatokra, beleértve az XGBoost modell betanítását és az idősor-előrejelzést. |
| Több GPU- és többcsomópontos elosztott betanítás | Példák a betanítás több GPU-n és csomóponton történő skálázására a kiszolgáló nélküli GPU API használatával, beleértve az elosztott finomhangolást is. |
Több GPU-s betanítási példák
Tekintse meg a jegyzetfüzeteket, amelyek bemutatják a több GPU-s és több csomópontos elosztott betanítást különböző elosztott betanítási könyvtárak segítségével.