Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Důležité
Modul runtime AI pro úlohy s jedním uzlem je ve verzi Public Preview. Distribuované trénovací rozhraní API pro úlohy s více GPU zůstává v beta verzi.
Tato stránka obsahuje příklady poznámkových bloků pro vyladění velkých jazykových modelů (LLM) pomocí modulu runtime AI. Tyto příklady ukazují různé přístupy k jemnému naladění, včetně metod účinných z hlediska parametrů, jako je Low-Rank Adaptation (LoRA) a úplné doladění s plným dohledem.
| Tutoriál | Description |
|---|---|
| Vyladění modelu Qwen2-0.5B | Efektivně vylaďte model Qwen2-0.5B pomocí posilovaného učení v rámci transformátoru (TRL), Liger Kernels pro paměťově efektivní trénování a LoRA pro paměťově efektivní ladění parametrů. |
| Vyladění Llama-3.2-3B pomocí Unsloth | Jemně vylaďte Llama-3.2-3B pomocí knihovny Unsloth. |
| Supervizované jemné ladění s využitím DeepSpeed a TRL | Pomocí bezserverového Python API GPU můžete provádět řízené doladění (SFT) za použití knihovny TRL (Transformer Reinforcement Learning) s využitím DeepSpeed ZeRO Stage 3. |
| Jemné ladění LORA pomocí Axolotl | Pomocí bezserverového rozhraní API GPU v Pythonu LORA vylaďte model Olmo3 7B pomocí knihovny Axolotl. |
| Distribuované doladění Qwen2-0.5B | Dolaďte model Qwen2-0.5B pomocí technologií LoRA a Liger pro paměťově efektivní distribuované trénování s redukcí parametrů. |
| Distribuované doladění Llama-3.2-3B s Unsloth | Doladění modelu Llama-3.2-3B pomocí distribuovaného trénování na více GPU s knihovnou Unsloth pro optimalizované trénování efektivní z hlediska parametrů. |
| Vyladění Llama 3.1 8B pomocí LLM Foundry | Jemně vylaďte model Llama 3.1 8B s využitím aplikace Mosaic LLM Foundry s distribuovanými trénovacími strategiemi a vyhodnocením modelu. |
| Jemné doladění GPT-OSS 120B pomocí DDP a FSDP | Vyladění modelu OpenAI GPT-OSS 120B prostřednictvím řízeného jemného doladění na grafických procesorech H100 s využitím distribuovaných trénovacích strategií DDP a FSDP. |
| Distribuované trénování pomocí PyTorch FSDP | Trénování modelů Transformer pomocí PyTorch plně uspořádaného dělení dat paralelně (FSDP) k úplnému rozdělení parametrů modelu napříč několika GPU. |
Ukázka videa
Toto video vás provede podrobným příkladem ladění Llama-3.2-3B pomocí ukázkového poznámkového bloku Unsloth (12 minut).