Elosztott képzés a DeepSpeed forgalmazóval

Cikk
03/01/2024

Ez a cikk azt ismerteti, hogyan végezhet elosztott betanítást PyTorch ML-modelleken a DeepSpeed forgalmazó használatával.

A DeepSpeed forgalmazó a TorchDistributorra épül, és ajánlott megoldás olyan modellekhez, amelyek nagyobb számítási teljesítményt igényelnek, de a memóriakorlátok korlátozzák őket.

A DeepSpeed-kódtár a Microsoft által fejlesztett nyílt forráskódú kódtár, amely a Databricks Runtime 14.0 ML-es vagy újabb verziójában érhető el. Optimalizált memóriahasználatot, csökkent kommunikációs többletterhelést és fejlett folyamat-párhuzamosságot biztosít, amely lehetővé teszi a modellek és a betanítási eljárások skálázását, amelyek egyébként elérhetetlenek lennének a standard hardvereken.

Az alábbi példaforgatókönyvek hasznosak a DeepSpeed-terjesztő számára:

Alacsony GPU-memória.
Nagy modell betanítása.
Nagy bemeneti adatok, például kötegelt következtetés során.

Példajegyzetfüzet elosztott betanításhoz a DeepSpeed használatával

Az alábbi jegyzetfüzet-példa bemutatja, hogyan végezhet elosztott betanítást a DeepSpeed-terjesztővel.

Llama 2 7B csevegés finomhangolása jegyzetfüzettel `DeepspeedTorchDistributor`

Jegyzetfüzet lekérése

Megosztás a következőn keresztül:

Elosztott képzés a DeepSpeed forgalmazóval

Példajegyzetfüzet elosztott betanításhoz a DeepSpeed használatával

Llama 2 7B csevegés finomhangolása jegyzetfüzettel `DeepspeedTorchDistributor`

További források

Megosztás a következőn keresztül:

Elosztott képzés a DeepSpeed forgalmazóval

Példajegyzetfüzet elosztott betanításhoz a DeepSpeed használatával

Llama 2 7B csevegés finomhangolása jegyzetfüzettel DeepspeedTorchDistributor

További források

Llama 2 7B csevegés finomhangolása jegyzetfüzettel `DeepspeedTorchDistributor`