Vyladění modelů Meta Llama v Azure AI Studiu

Článek
10/16/2024

Důležité

Některé funkce popsané v tomto článku můžou být dostupné jenom ve verzi Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Azure AI Studio umožňuje přizpůsobit velké jazykové modely vašim osobním datovým sadám pomocí procesu označovaného jako jemné ladění.

Jemné ladění poskytuje významnou hodnotu tím, že umožňuje přizpůsobení a optimalizaci pro konkrétní úlohy a aplikace. Vede ke zlepšení výkonu, efektivity nákladů, snížení latence a přizpůsobených výstupů.

V tomto článku se dozvíte, jak v Azure AI Studiu doladit modely Meta Llama.

Meta Llama rodina velkých jazykových modelů (LLMs) je kolekce předem natrénovaných a jemně vyladěných generovacích textových modelů v rozsahu od 7 miliard do 70 miliard parametrů. Řada modelů obsahuje také jemně vyladěné verze optimalizované pro případy použití dialogu s výztuží učením z lidské zpětné vazby (RLHF), které se nazývá Llama-Instruct.

Následující modely jsou k dispozici na Azure Marketplace pro Llama 3.1 při vyladění služby s průběžnými platbami:

Meta-Llama-3.1-70B-Instruct (Preview)
Meta-LLama-3.1-8b-Instruct (Preview)

Jemné ladění modelů Llama 3.1 je v současné době podporováno v projektech umístěných v oblasti USA – západ 3.

Důležité

V tuto chvíli nemůžeme provést jemné ladění pro Llama 3.1 s délkou sekvence 128 K.

Požadavky

Meta Llama 3.1
Meta Llama 2

Předplatné Azure s platným způsobem platby. Bezplatná nebo zkušební předplatná Azure nebudou fungovat. Pokud nemáte předplatné Azure, vytvořte si placený účet Azure, abyste mohli začít.

Centrum Azure AI Studio.

Důležité

U modelů Meta Llama 3.1 je nabídka vyladění modelu s průběžnými platbami dostupná pouze u center vytvořených v oblastech USA – západ 3 .
Projekt Azure AI Studio v Azure AI Studiu
Řízení přístupu na základě role v Azure (Azure RBAC) se používá k udělení přístupu k operacím v Azure AI Studiu. Pokud chcete provést kroky v tomto článku, musí mít váš uživatelský účet přiřazenou roli vlastníka nebo přispěvatele pro dané předplatné Azure. Případně můžete svému účtu přiřadit vlastní roli, která má následující oprávnění:
- V předplatném Azure – pokud chcete předplatit projekt AI Studio k nabídce Azure Marketplace, jednou pro každý projekt na jednu nabídku:
  - Microsoft.MarketplaceOrdering/agreements/offers/plans/read
  - Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
  - Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
  - Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
  - Microsoft.SaaS/register/action
- Ve skupině prostředků – vytvoření a použití prostředku SaaS:
  - Microsoft.SaaS/resources/read
  - Microsoft.SaaS/resources/write
- V projektu AI Studio – nasazení koncových bodů (role Vývojáře Azure AI už obsahuje tato oprávnění):
  - Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
  - Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Další informace o oprávněních najdete v tématu Řízení přístupu na základě role v nástroji Azure AI Studio.

Centrum AI Studio.

Důležité

U modelů Meta Llama 2 je nabídka s průběžnými platbami k dispozici pouze u center vytvořených v oblasti USA – západ 3 .
Projekt AI Studio v Azure AI Studiu
Řízení přístupu na základě role v Azure (Azure RBAC) se používá k udělení přístupu k operacím v Azure AI Studiu. Pokud chcete provést kroky v tomto článku, musí mít váš uživatelský účet přiřazenou roli vlastníka nebo přispěvatele pro dané předplatné Azure. Případně můžete svému účtu přiřadit vlastní roli, která má následující oprávnění:
- V předplatném Azure – pokud chcete předplatit projekt AI Studio k nabídce Azure Marketplace, jednou pro každý projekt na jednu nabídku:
  - Microsoft.MarketplaceOrdering/agreements/offers/plans/read
  - Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
  - Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
  - Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
  - Microsoft.SaaS/register/action
- Ve skupině prostředků – vytvoření a použití prostředku SaaS:
  - Microsoft.SaaS/resources/read
  - Microsoft.SaaS/resources/write
- V projektu AI Studio – nasazení koncových bodů (role Vývojáře Azure AI už obsahuje tato oprávnění):
  - Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
  - Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Další informace o oprávněních najdete v tématu Řízení přístupu na základě role v nástroji Azure AI Studio.

Registrace poskytovatele předplatného

Ověřte, že je předplatné zaregistrované u Microsoft.Network poskytovatele prostředků.

Přihlaste se k portálu Azure.
V nabídce vlevo vyberte Předplatná .
Vyberte předplatné, které chcete použít.
V nabídce vlevo vyberte zprostředkovatele prostředků nastavení>.
Ověřte, že microsoft.Network je v seznamu poskytovatelů prostředků. V opačném případě ho přidejte.

Příprava dat

Připravte trénovací a ověřovací data pro vyladění modelu. Vaše cvičební data a sady ověřovacích dat se skládají ze vstupních a výstupních příkladů toho, jak se má model provádět.

Ujistěte se, že všechny trénovací příklady dodržují očekávaný formát pro odvozování. Pokud chcete modely efektivně vyladit, zajistěte vyváženou a různorodou datovou sadu.

To zahrnuje udržování rovnováhy dat, včetně různých scénářů, a pravidelné zpřesnění trénovacích dat tak, aby odpovídala očekáváním reálného světa, což nakonec vede k přesnějším a vyváženějším odpovědím modelu.

Různé typy modelů vyžadují jiný formát trénovacích dat.

Dokončení chatu
Generování textu

Použitá trénovací a ověřovací data musí být naformátovaná jako dokument JSON Lines (JSONL). Pro Meta-Llama-3.1-70B-Instruct jemně vyladěnou datovou sadu musí být formátovaná v konverzačním formátu, který používá rozhraní API pro dokončování chatu.

Příklad formátu souboru

    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Is Xbox better than PlayStation?"}, {"role": "assistant", "content": "I apologize, but I cannot provide personal opinions. My primary job is to assist you with any issues related to your Xbox device. Do you have any Xbox-related issues that need addressing?"}]}
    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Can I play PC games on my Xbox?"}, {"role": "assistant", "content": "While Xbox consoles don't natively support PC games, they can play an array of Xbox games, many of which are also available on PC. Can I assist you with finding games compatible with your Xbox device?"}]}
    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "I'm having trouble connecting my Xbox to the Wi-Fi."}, {"role": "assistant", "content": "No worries, let's go through the network settings on your Xbox. Can you please tell me what happens when you try to connect it to the Wi-Fi?"}]}

Podporovaný typ souboru je řádky JSON. Soubory se nahrají do výchozího úložiště dat a zpřístupní se v projektu.

Použitá trénovací a ověřovací data musí být naformátovaná jako dokument JSON Lines (JSONL), ve kterém každý řádek představuje jeden pár dokončení výzvy.

Příklad formátu souboru

{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}

Tady je několik ukázkových datových sad pro Hugging Face, které můžete použít k jemnému ladění modelu:

Jedna klasifikace textu vyžaduje, aby trénovací data obsahovala alespoň dvě pole, například text1 a label. Klasifikace páru textu vyžaduje, aby trénovací data obsahovala alespoň tři pole, například text1, text2a label.

Podporovaný typ souboru je řádky JSON. Soubory se nahrají do výchozího úložiště dat a zpřístupní se v projektu.

Vyladění modelu Meta Llama

Meta Llama 3.1
Meta Llama 2

Vyladění modelu LLama 3.1:

Přihlaste se k Azure AI Studiu.
Vyberte model, který chcete vyladit z katalogu modelů Azure AI Studio.
Na stránce Podrobnosti modelu vyberte jemně vyladit.
Vyberte projekt, ve kterém chcete modely vyladit. Pokud chcete použít nabídku pro vyladění modelu průběžných plateb, musí váš pracovní prostor patřit do oblasti USA – západ 3 .
V průvodci doladěním vyberte odkaz na podmínky Azure Marketplace, kde najdete další informace o podmínkách použití. Můžete také vybrat kartu Podrobnosti nabídky Marketplace, kde se dozvíte o cenách vybraného modelu.
Pokud model v projektu poprvé vyladíte, musíte se přihlásit k odběru konkrétní nabídky (například Meta-Llama-3.1-70B-Instruct) z Azure Marketplace. Tento krok vyžaduje, aby váš účet má oprávnění předplatného Azure a oprávnění skupiny prostředků uvedená v požadavcích. Každý projekt má vlastní předplatné konkrétní nabídky Azure Marketplace, která umožňuje řídit a monitorovat útraty. Vyberte Přihlásit se k odběru a dolaďte je.

Poznámka:

Přihlášení k odběru projektu konkrétní nabídce Azure Marketplace (v tomto případě Meta-Llama-3.1-70B-Instruct) vyžaduje, aby váš účet získal přístup přispěvatele nebo vlastníka na úrovni předplatného, kde se projekt vytvoří. Případně můžete svému uživatelskému účtu přiřadit vlastní roli, která má oprávnění předplatného Azure a oprávnění skupiny prostředků uvedená v požadavcích.
Jakmile si zaregistrujete projekt pro konkrétní nabídku Azure Marketplace, následné vyladění stejné nabídky ve stejném projektu už nevyžaduje opětovné přihlášení k odběru. Proto nemusíte mít oprávnění na úrovni předplatného pro následné úlohy vyladit. Pokud se tento scénář týká vás, vyberte Pokračovat a vyladit ho.
Zadejte název jemně vyladěného modelu a volitelné značky a popis.
Výběrem trénovacích dat model vyladíte. Další informace najdete v přípravě dat.

Poznámka:

Pokud máte v úložišti dat méně přihlašovacích údajů trénovací/ověřovací soubory, budete muset povolit přístup spravované identity pracovního prostoru k úložišti dat, aby bylo možné pokračovat v jemném ladění MaaS s méně přihlašovacími údaji. Na stránce Úložiště dat po kliknutí na Aktualizovat ověřování > vyberte následující možnost:

Ujistěte se, že všechny trénovací příklady dodržují očekávaný formát pro odvozování. Pokud chcete modely efektivně vyladit, zajistěte vyváženou a různorodou datovou sadu. To zahrnuje udržování rovnováhy dat, včetně různých scénářů, a pravidelné zpřesnění trénovacích dat tak, aby odpovídala očekáváním reálného světa, což nakonec vede k přesnějším a vyváženějším odpovědím modelu.
- Velikost dávky, která se má použít pro trénování. Při nastavení na hodnotu -1 se batch_size vypočítá jako 0,2 % příkladů v trénovací sadě a maximální hodnota je 256.
- Mírná míra učení je původní míra učení používaná pro předtrénování vynásobenou tímto násobitelem. Doporučujeme experimentovat s hodnotami mezi 0,5 a 2. Empiricky jsme zjistili, že větší míry učení často fungují lépe s většími velikostmi dávek. Musí být v rozsahu 0,0 až 5.0.
- Počet epoch trénování. Epocha odkazuje na jeden úplný cyklus prostřednictvím datové sady.
Parametry úloh jsou volitelný krok a pokročilá možnost – Ladění hyperparametrů je nezbytné pro optimalizaci velkých jazykových modelů (LLM) v reálných aplikacích. Umožňuje zvýšit výkon a efektivní využití prostředků. Výchozí nastavení se dají použít nebo pokročilí uživatelé můžou přizpůsobit parametry, jako jsou epochy nebo rychlost učení.
Zkontrolujte výběry a pokračujte v trénování modelu.

Jakmile je model jemně vyladěný, můžete ho nasadit a použít ho ve vlastní aplikaci, na hřišti nebo v příkazovém toku. Další informace najdete v tématu Nasazení řady Llama 3.1 velkých jazykových modelů pomocí nástroje Azure AI Studio.

Čištění jemně vyladěných modelů

Jemně vyladěný model můžete odstranit ze seznamu jemně vyladěných modelů v Azure AI Studiu nebo na stránce s podrobnostmi modelu. Vyberte jemně vyladěný model, který chcete odstranit ze stránky Jemné ladění, a pak výběrem tlačítka Odstranit odstraňte jemně vyladěný model.

Poznámka:

Pokud má existující nasazení, nemůžete odstranit vlastní model. Před odstraněním vlastního modelu musíte nejprve odstranit nasazení modelu.

Náklady a kvóty

Důležité informace o nákladech a kvótách pro modely Meta Llama vyladěné jako služba

Meta llama modely jemně vyladěné jako služba jsou nabízeny meta prostřednictvím Azure Marketplace a integrované s Azure AI Studio pro použití. Ceny za Azure Marketplace najdete při nasazování nebo vyladění modelů.

Pokaždé, když si projekt předplatí danou nabídku z tržiště Azure Marketplace, vytvoří se nový prostředek pro sledování nákladů spojených s jeho spotřebou. Ke sledování nákladů spojených s odvozováním a dolaďováním se používá stejný zdroj, nicméně ke sledování každého scénáře je k dispozici více měřidel nezávisle.

Další informace o sledování nákladů naleznete v části Sledování nákladů na modely nabízené prostřednictvím služby Azure Marketplace.

Filtrování obsahu

Modely nasazené jako služba s průběžnými platbami jsou chráněné službou Azure AI Content Safety. Když se nasadí do koncových bodů v reálném čase, můžete se z této funkce odhlásit. S povolenou bezpečností obsahu Azure AI prochází výzva i dokončení souborem klasifikačních modelů určených k detekci a zabránění výstupu škodlivého obsahu. Systém filtrování obsahu zjistí a provede akce s konkrétními kategoriemi potenciálně škodlivého obsahu ve vstupních výzev i dokončení výstupu. Přečtěte si další informace o bezpečnosti obsahu Azure AI.

Sdílet prostřednictvím

Vyladění modelů Meta Llama v Azure AI Studiu

Modely

Požadavky

Registrace poskytovatele předplatného

Příprava dat

Příklad formátu souboru

Příklad formátu souboru

Vyladění modelu Meta Llama

Čištění jemně vyladěných modelů

Náklady a kvóty

Důležité informace o nákladech a kvótách pro modely Meta Llama vyladěné jako služba

Filtrování obsahu

Další kroky

Váš názor

Další materiály