Dostrajanie modeli Meta Llama w portalu usługi Azure AI Foundry

Artykuł
12/16/2024

Ważne

Elementy oznaczone (wersja zapoznawcza) w tym artykule są obecnie dostępne w publicznej wersji zapoznawczej. Ta wersja zapoznawcza jest udostępniana bez umowy dotyczącej poziomu usług i nie zalecamy korzystania z niej w przypadku obciążeń produkcyjnych. Niektóre funkcje mogą być nieobsługiwane lub ograniczone. Aby uzyskać więcej informacji, zobacz Uzupełniające warunki korzystania z wersji zapoznawczych platformy Microsoft Azure.

Usługa Azure AI Foundry umożliwia dostosowanie dużych modeli językowych do osobistych zestawów danych przy użyciu procesu znanego jako dostrajanie.

Dostrajanie zapewnia znaczącą wartość dzięki włączeniu dostrajania i optymalizacji dla określonych zadań i aplikacji. Prowadzi to do zwiększenia wydajności, wydajności kosztów, mniejszego opóźnienia i dostosowanych danych wyjściowych.

Z tego artykułu dowiesz się, jak dostosować modele Meta Llama w usłudze Azure AI Foundry.

Rodzina Meta Llama dużych modeli językowych (LLMs) to kolekcja wstępnie wytrenowanych i dostrojonych modeli tekstowych generujących w skali od 7 miliardów do 70 miliardów parametrów. Rodzina modeli zawiera również dostosowane wersje zoptymalizowane pod kątem przypadków użycia dialogu z wzmacniania uczenia się od opinii człowieka (RLHF), o nazwie Llama-Instruct.

Ważne

Modele, które są w wersji zapoznawczej, są oznaczone jako wersja zapoznawcza na kartach modeli w wykazie modeli.

Następujące modele są dostępne w witrynie Azure Marketplace dla llama 3.1 podczas dostosowywania jako usługi z rozliczeniami płatności zgodnie z rzeczywistym użyciem:

Meta-Llama-3.1-70B-Instruct (wersja zapoznawcza)
Meta-LLama-3.1-8b-Instruct (wersja zapoznawcza)

Dostrajanie modeli Llama 3.1 jest obecnie obsługiwane w projektach znajdujących się w regionie Zachodnie stany USA 3.

Ważne

W tej chwili nie jesteśmy w stanie dostrajać llama 3.1 z długością sekwencji 128K.

Następujące modele są dostępne w witrynie Azure Marketplace dla Llama 2, gdy dostrajanie jako usługa z rozliczeniami płatności zgodnie z rzeczywistym użyciem:

Meta Llama-2-70b (wersja zapoznawcza)
Meta Llama-2-13b (wersja zapoznawcza)
Meta Llama-2-7b (wersja zapoznawcza)

Dostrajanie modeli Llama 2 jest obecnie obsługiwane w projektach znajdujących się w regionie Zachodnie stany USA 3.

Wymagania wstępne

Meta Llama 3.1
Meta Llama 2

Subskrypcja platformy Azure z prawidłową formą płatności. Subskrypcje platformy Azure w wersji bezpłatnej lub próbnej nie będą działać. Jeśli nie masz subskrypcji platformy Azure, utwórz płatne konto platformy Azure, aby rozpocząć.

Centrum usługi Azure AI Foundry.

Ważne

W przypadku modeli Meta Llama 3.1 model płatności zgodnie z rzeczywistym użyciem jest dostępny tylko w przypadku centrów utworzonych w regionach Zachodnie stany USA 3 .
Projekt usługi Azure AI Foundry w portalu usługi Azure AI Foundry.
Kontrola dostępu oparta na rolach platformy Azure (RBAC) platformy Azure służy do udzielania dostępu do operacji w portalu usługi Azure AI Foundry. Aby wykonać kroki opisane w tym artykule, konto użytkownika musi mieć przypisaną rolę Właściciela lub Współpracownika dla subskrypcji platformy Azure. Możesz też przypisać rolę niestandardową, która ma następujące uprawnienia:
- W subskrypcji platformy Azure — aby zasubskrybować projekt Azure AI Foundry w ofercie witryny Azure Marketplace, raz dla każdego projektu, na ofertę:
  - Microsoft.MarketplaceOrdering/agreements/offers/plans/read
  - Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
  - Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
  - Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
  - Microsoft.SaaS/register/action
- W grupie zasobów — do tworzenia zasobu SaaS i jego użycia:
  - Microsoft.SaaS/resources/read
  - Microsoft.SaaS/resources/write
- W projekcie azure AI Foundry — w celu wdrożenia punktów końcowych (rola dewelopera usługi Azure AI zawiera już następujące uprawnienia):
  - Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
  - Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Aby uzyskać więcej informacji na temat uprawnień, zobacz Kontrola dostępu oparta na rolach w portalu usługi Azure AI Foundry.

Centrum usługi Azure AI Foundry.

Ważne

W przypadku modeli Meta Llama 2 model płatności zgodnie z rzeczywistym użyciem jest dostępny tylko w przypadku centrów utworzonych w regionie Zachodnie stany USA 3 .
Projekt usługi Azure AI Foundry w portalu usługi Azure AI Foundry.
Kontrola dostępu oparta na rolach platformy Azure (RBAC) platformy Azure służy do udzielania dostępu do operacji w portalu usługi Azure AI Foundry. Aby wykonać kroki opisane w tym artykule, konto użytkownika musi mieć przypisaną rolę Właściciela lub Współpracownika dla subskrypcji platformy Azure. Możesz też przypisać rolę niestandardową, która ma następujące uprawnienia:
- W subskrypcji platformy Azure — aby zasubskrybować projekt Azure AI Foundry w ofercie witryny Azure Marketplace, raz dla każdego projektu, na ofertę:
  - Microsoft.MarketplaceOrdering/agreements/offers/plans/read
  - Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
  - Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
  - Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
  - Microsoft.SaaS/register/action
- W grupie zasobów — do tworzenia zasobu SaaS i jego użycia:
  - Microsoft.SaaS/resources/read
  - Microsoft.SaaS/resources/write
- W projekcie azure AI Foundry — w celu wdrożenia punktów końcowych (rola dewelopera usługi Azure AI zawiera już następujące uprawnienia):
  - Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
  - Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Aby uzyskać więcej informacji na temat uprawnień, zobacz Kontrola dostępu oparta na rolach w portalu usługi Azure AI Foundry.

Rejestracja dostawcy subskrypcji

Sprawdź, czy subskrypcja jest zarejestrowana u dostawcy Microsoft.Network zasobów.

Zaloguj się w witrynie Azure Portal.
Wybierz pozycję Subskrypcje z menu po lewej stronie.
Wybierz subskrypcję, której chcesz użyć.
Wybierz pozycję Ustawienia>Dostawcy zasobów z menu po lewej stronie.
Upewnij się, że aplikacja Microsoft.Network znajduje się na liście dostawców zasobów. W przeciwnym razie dodaj go.

Przygotowywanie danych

Przygotuj dane szkoleniowe i weryfikacyjne, aby dostroić model. Dane szkoleniowe i zestawy danych do walidacji składają się z przykładów wejściowych i wyjściowych pokazujących, jak ma działać model.

Upewnij się, że wszystkie przykłady trenowania są zgodne z oczekiwanym formatem wnioskowania. Aby efektywnie dostroić modele, upewnij się, że zestaw danych jest zrównoważony i zróżnicowany.

Obejmuje to utrzymywanie równowagi danych, w tym różnych scenariuszy i okresowe udoskonalanie danych treningowych w celu dopasowania ich do rzeczywistych oczekiwań, co ostatecznie prowadzi do dokładniejszej i zrównoważonej odpowiedzi modelu.

Różne typy modeli wymagają innego formatu danych treningowych.

Uzupełnianie czatu
Generowanie tekstu

Używane dane trenowania i walidacji muszą być sformatowane jako dokument JSON Lines (JSONL). W przypadku Meta-Llama-3.1-70B-Instruct zestawu danych dostrajania należy sformatować w formacie konwersacyjnym, który jest używany przez interfejs API uzupełniania czatów.

Przykładowy format pliku

    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Is Xbox better than PlayStation?"}, {"role": "assistant", "content": "I apologize, but I cannot provide personal opinions. My primary job is to assist you with any issues related to your Xbox device. Do you have any Xbox-related issues that need addressing?"}]}
    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Can I play PC games on my Xbox?"}, {"role": "assistant", "content": "While Xbox consoles don't natively support PC games, they can play an array of Xbox games, many of which are also available on PC. Can I assist you with finding games compatible with your Xbox device?"}]}
    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "I'm having trouble connecting my Xbox to the Wi-Fi."}, {"role": "assistant", "content": "No worries, let's go through the network settings on your Xbox. Can you please tell me what happens when you try to connect it to the Wi-Fi?"}]}

Obsługiwany typ pliku to Linie JSON. Pliki są przesyłane do domyślnego magazynu danych i udostępniane w projekcie.

Używane dane trenowania i walidacji muszą być sformatowane jako dokument JSON Lines (JSONL), w którym każdy wiersz reprezentuje jedną parę uzupełniania monitów.

Przykładowy format pliku

{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}

Oto kilka przykładowych zestawów danych z Hugging Face, których można użyć do dostrojenia modelu:

Klasyfikacja pojedynczego tekstu wymaga, aby dane szkoleniowe zawierały co najmniej dwa pola, takie jak text1 i label. Klasyfikacja par tekstowych wymaga, aby dane szkoleniowe zawierały co najmniej trzy pola, takie jak text1, text2i label.

Obsługiwany typ pliku to Linie JSON. Pliki są przesyłane do domyślnego magazynu danych i udostępniane w projekcie.

Dostrajanie modelu Meta Llama

Meta Llama 3.1
Meta Llama 2

Aby dostosować model LLama 3.1:

Zaloguj się do usługi Azure AI Foundry.
Wybierz model, który chcesz dostosować z katalogu modeli portalu usługi Azure AI Foundry.
Na stronie Szczegóły modelu wybierz pozycję Dostosuj.
Wybierz projekt, w którym chcesz dostosować modele. Aby korzystać z oferty modelu płatności zgodnie z rzeczywistym użyciem, obszar roboczy musi należeć do regionu Zachodnie stany USA 3 .
W kreatorze dostrajania wybierz link do warunków użytkowania witryny Azure Marketplace, aby dowiedzieć się więcej na temat warunków użytkowania. Możesz również wybrać kartę Szczegóły oferty w witrynie Marketplace, aby dowiedzieć się więcej o cenach dla wybranego modelu.
Jeśli po raz pierwszy dostrajasz model w projekcie, musisz zasubskrybować projekt dla konkretnej oferty (na przykład Meta-Llama-3.1-70B-Poinstruowanie) z witryny Azure Marketplace. Ten krok wymaga, aby Twoje konto ma uprawnienia subskrypcji platformy Azure i uprawnienia grupy zasobów wymienione w wymaganiach wstępnych. Każdy projekt ma własną subskrypcję konkretnej oferty witryny Azure Marketplace, która umożliwia kontrolowanie i monitorowanie wydatków. Wybierz pozycję Subskrybuj i dostosuj.

Uwaga

Subskrybowanie projektu do określonej oferty witryny Azure Marketplace (w tym przypadku Meta-Llama-3.1-70B-Poinstruowanie) wymaga, aby Twoje konto ma dostęp Współautor lub Właściciel na poziomie subskrypcji, na którym został utworzony projekt. Alternatywnie konto użytkownika może mieć przypisaną rolę niestandardową, która ma uprawnienia subskrypcji platformy Azure i uprawnienia grupy zasobów wymienione w wymaganiach wstępnych.
Po zarejestrowaniu projektu dla konkretnej oferty witryny Azure Marketplace kolejne dostrajanie tej samej oferty w tym samym projekcie nie wymaga ponownego subskrybowania. W związku z tym nie musisz mieć uprawnień na poziomie subskrypcji dla kolejnych zadań dostrajania. Jeśli ten scenariusz ma zastosowanie do Ciebie, wybierz pozycję Kontynuuj, aby dostroić.
Wprowadź nazwę dostosowanego modelu oraz opcjonalne tagi i opis.
Wybierz dane szkoleniowe, aby dostosować model. Aby uzyskać więcej informacji, zobacz przygotowywanie danych.

Uwaga

Jeśli masz pliki trenowania/walidacji w magazynie danych mniejszej niż poświadczenia, musisz zezwolić na dostęp tożsamości zarządzanej obszaru roboczego do ich magazynu danych, aby kontynuować dostosowywanie usługi MaaS przy użyciu mniej magazynu poświadczeń. Na stronie "Magazyn danych" po kliknięciu pozycji "Aktualizuj uwierzytelnianie" > Wybierz następującą opcję:

Upewnij się, że wszystkie przykłady trenowania są zgodne z oczekiwanym formatem wnioskowania. Aby efektywnie dostroić modele, upewnij się, że zestaw danych jest zrównoważony i zróżnicowany. Obejmuje to utrzymywanie równowagi danych, w tym różnych scenariuszy i okresowe udoskonalanie danych treningowych w celu dopasowania ich do rzeczywistych oczekiwań, co ostatecznie prowadzi do dokładniejszej i zrównoważonej odpowiedzi modelu.
- Rozmiar partii do użycia do trenowania. W przypadku ustawienia wartości -1 batch_size jest obliczana jako 0,2% przykładów w zestawie treningowym, a maksymalna wartość to 256.
- Współczynnik dostrajania uczenia to oryginalny współczynnik uczenia używany do wstępnego trenowania pomnożonego przez ten mnożnik. Zalecamy eksperymentowanie z wartościami z zakresu od 0,5 do 2. Empirycznie okazało się, że większe wskaźniki uczenia często działają lepiej z większymi rozmiarami partii. Musi należeć do przedziału od 0,0 do 5,0.
- Liczba epok treningowych. Epoka odnosi się do jednego pełnego cyklu w zestawie danych.
Parametry zadania są opcjonalnym krokiem i zaawansowaną opcją — dostrajanie hiperparametrów jest niezbędne do optymalizacji dużych modeli językowych (LLM) w rzeczywistych aplikacjach. Umożliwia zwiększenie wydajności i wydajnego użycia zasobów. Ustawienia domyślne mogą być używane lub użytkownicy zaawansowani mogą dostosowywać parametry, takie jak epoki lub szybkość nauki.
Przejrzyj wybrane opcje i przejdź do trenowania modelu.

Po dostrojeniu modelu możesz wdrożyć model i użyć go we własnej aplikacji, na placu zabaw lub w przepływie monitu. Aby uzyskać więcej informacji, zobacz How to deploy Llama 3.1 family of large language models with Azure AI Foundry (Jak wdrożyć rodzinę dużych modeli językowych Llama za pomocą rozwiązania Azure AI Foundry).

Czyszczenie dostosowanych modeli

Możesz usunąć dostosowany model z listy modeli dostrajania w usłudze Azure AI Foundry lub na stronie szczegółów modelu. Wybierz dostosowany model do usunięcia ze strony Dostrajanie szczegółowe, a następnie wybierz przycisk Usuń, aby usunąć dostosowany model.

Uwaga

Nie można usunąć modelu niestandardowego, jeśli ma istniejące wdrożenie. Przed usunięciem modelu niestandardowego należy najpierw usunąć wdrożenie modelu.

Koszt i przydziały

Zagadnienia dotyczące kosztów i limitów przydziału modeli Meta Llama dostosowane jako usługa

Modele Meta Llama dostosowane jako usługa są oferowane przez meta za pośrednictwem witryny Azure Marketplace i zintegrowane z usługą Azure AI Foundry do użycia. Cennik witryny Azure Marketplace można znaleźć podczas wdrażania lub dostosowywania modeli.

Za każdym razem, gdy projekt subskrybuje daną ofertę z witryny Azure Marketplace, tworzony jest nowy zasób w celu śledzenia kosztów związanych z jej zużyciem. Ten sam zasób służy do śledzenia kosztów skojarzonych z wnioskowaniem i dostrajania; jednak w ramach śledzenia każdego scenariusza można niezależnie śledzić wiele mierników.

Aby uzyskać więcej informacji na temat śledzenia kosztów, zobacz Monitorowanie kosztów modeli oferowanych w witrynie Azure Marketplace.

Przykładowy notes

Możesz użyć tego przykładowego notesu , aby utworzyć autonomiczne zadanie dostrajania w celu zwiększenia możliwości podsumowania dialogów między dwiema osobami korzystającymi z zestawu danych Samsum. Wykorzystane dane treningowe to zestaw danych ultrachat_200k, który jest podzielony na cztery podziały odpowiednie do nadzorowanych dostrajania (kradzież) i klasyfikacji generowania (gen). Notes korzysta z dostępnych modeli sztucznej inteligencji platformy Azure dla zadania ukończenia czatu (jeśli chcesz użyć innego modelu niż używany w notesie, możesz zastąpić nazwę modelu). Notes zawiera konfigurowanie wymagań wstępnych, wybieranie modelu w celu dostosowania, tworzenie zestawów danych trenowania i walidacji, konfigurowanie i przesyłanie zadania dostrajania, a na koniec utworzenie wdrożenia bezserwerowego przy użyciu dostosowanego modelu na potrzeby przykładowego wnioskowania.

Filtrowanie zawartości

Modele wdrożone jako usługa z rozliczeniami płatności zgodnie z rzeczywistym użyciem są chronione przez bezpieczeństwo zawartości usługi Azure AI. Po wdrożeniu w punktach końcowych czasu rzeczywistego możesz zrezygnować z tej funkcji. Po włączeniu bezpieczeństwa zawartości sztucznej inteligencji platformy Azure zarówno monit, jak i ukończenie przechodzą przez zespół modeli klasyfikacji mających na celu wykrywanie i zapobieganie wyjściu szkodliwej zawartości. System filtrowania zawartości (wersja zapoznawcza) wykrywa i podejmuje działania dotyczące określonych kategorii potencjalnie szkodliwej zawartości zarówno w monitach wejściowych, jak i w przypadku uzupełniania danych wyjściowych. Dowiedz się więcej o bezpieczeństwie zawartości usługi Azure AI.

Udostępnij za pośrednictwem

Dostrajanie modeli Meta Llama w portalu usługi Azure AI Foundry

Modele

Wymagania wstępne

Rejestracja dostawcy subskrypcji

Przygotowywanie danych

Przykładowy format pliku

Przykładowy format pliku

Dostrajanie modelu Meta Llama

Czyszczenie dostosowanych modeli

Koszt i przydziały

Zagadnienia dotyczące kosztów i limitów przydziału modeli Meta Llama dostosowane jako usługa

Przykładowy notes

Filtrowanie zawartości

Następne kroki

Opinia

Dodatkowe zasoby