Velké jazykové modely (LLM)

Důležité

Modul runtime AI pro úlohy s jedním uzlem je ve verzi Public Preview. Distribuované trénovací rozhraní API pro úlohy s více GPU zůstává v beta verzi.

Tato stránka obsahuje příklady poznámkových bloků pro vyladění velkých jazykových modelů (LLM) pomocí modulu runtime AI. Tyto příklady ukazují různé přístupy k jemnému naladění, včetně metod účinných z hlediska parametrů, jako je Low-Rank Adaptation (LoRA) a úplné doladění s plným dohledem.

Tutoriál Description
Vyladění modelu Qwen2-0.5B Efektivně vylaďte model Qwen2-0.5B pomocí posilovaného učení v rámci transformátoru (TRL), Liger Kernels pro paměťově efektivní trénování a LoRA pro paměťově efektivní ladění parametrů.
Vyladění Llama-3.2-3B pomocí Unsloth Jemně vylaďte Llama-3.2-3B pomocí knihovny Unsloth.
Supervizované jemné ladění s využitím DeepSpeed a TRL Pomocí bezserverového Python API GPU můžete provádět řízené doladění (SFT) za použití knihovny TRL (Transformer Reinforcement Learning) s využitím DeepSpeed ZeRO Stage 3.
Jemné ladění LORA pomocí Axolotl Pomocí bezserverového rozhraní API GPU v Pythonu LORA vylaďte model Olmo3 7B pomocí knihovny Axolotl.
Distribuované doladění Qwen2-0.5B Dolaďte model Qwen2-0.5B pomocí technologií LoRA a Liger pro paměťově efektivní distribuované trénování s redukcí parametrů.
Distribuované doladění Llama-3.2-3B s Unsloth Doladění modelu Llama-3.2-3B pomocí distribuovaného trénování na více GPU s knihovnou Unsloth pro optimalizované trénování efektivní z hlediska parametrů.
Vyladění Llama 3.1 8B pomocí LLM Foundry Jemně vylaďte model Llama 3.1 8B s využitím aplikace Mosaic LLM Foundry s distribuovanými trénovacími strategiemi a vyhodnocením modelu.
Jemné doladění GPT-OSS 120B pomocí DDP a FSDP Vyladění modelu OpenAI GPT-OSS 120B prostřednictvím řízeného jemného doladění na grafických procesorech H100 s využitím distribuovaných trénovacích strategií DDP a FSDP.
Distribuované trénování pomocí PyTorch FSDP Trénování modelů Transformer pomocí PyTorch plně uspořádaného dělení dat paralelně (FSDP) k úplnému rozdělení parametrů modelu napříč několika GPU.

Ukázka videa

Toto video vás provede podrobným příkladem ladění Llama-3.2-3B pomocí ukázkového poznámkového bloku Unsloth (12 minut).