Több GPU- és többcsomópontos elosztott betanítás

Fontos

Ez a funkció bétaverzióban érhető el. A munkaterület rendszergazdái az Előnézetek lapon szabályozhatják a funkcióhoz való hozzáférést. Lásd: Az Azure Databricks előzetes verziójának kezelése.

Ezen a lapon jegyzetfüzet-példákat talál többcsomópontos és több GPU-s elosztott betanításhoz kiszolgáló nélküli GPU-számítással. Ezek a példák bemutatják, hogyan méretezhetők a betanítások több GPU-n és csomóponton a jobb teljesítmény érdekében.

Válassza ki a párhuzamossági technikát

Ha a modell betanítását több GPU-n skálázza, a megfelelő párhuzamossági technika kiválasztása a modell méretétől, a rendelkezésre álló GPU-memóriától és a teljesítménykövetelményektől függ.

Technika	Mikor érdemes használni?
DDP (Elosztott adatok párhuzamos feldolgozása)	A teljes modell egyetlen GPU-memóriába illeszkedik; az adatok átviteli sebességének skálázására van szükség
FSDP (teljesen szeletelt adatok párhuzamos feldolgozása)	Nagyon nagy modellek, amelyek nem férnek el egyetlen GPU-memóriában
DeepSpeed ZeRO	Nagy méretű modellek fejlett memóriaoptimalizálási igényekkel

Az egyes technikákról részletes információt a DDP, az FSDP és a DeepSpeed című témakörben talál.

Példajegyzetfüzetek technika és keretrendszer szerint

Az alábbi táblázat a példajegyzetfüzeteket a használt keretrendszer/tár és a párhuzamossági technika alapján rendezi. Egyetlen cellában több jegyzetfüzet is megjelenhet.

Keretrendszer/könyvtár	DDP-példák	FSDP-példák	DeepSpeed-példák
PyTorch (natív)	Egyszerű MLP neurális hálózat RetinaNet-képészlelés	10M paraméterátalakító	—
Huggingface TRL	Gpt OSS 20B finomhangolása	Gpt OSS 120B finomhangolása	Láma finomhangolása 3.2 1B
Unsloth	Llama 3.2 3B finomhangolása	—	—
Axolotl	Olmo3 7B finomhangolása	—	—
Mozaik LLM Foundry	Llama 3.2 8B finomhangolása	—	—
Ray Train	ResNet18 a FashionMNIST-en (számítógépes látás) XGBoost hiperparaméter finomhangolása	—	—
Villám	Kéttornyú ajánlórendszer	—	—

Első lépések

Az alábbi jegyzetfüzet egy egyszerű példát mutat be arra, hogyan lehet a kiszolgáló nélküli GPU Python API-val több A10 GPU-t elindítani elosztott betanításhoz.

Kiszolgáló nélküli GPU API: A10 starter

Jegyzetfüzet szerezz

Visszacsatolás

Hasznos volt ez az oldal?

Last updated on 2025-12-24