Meta Llama-modellen verfijnen in Azure AI Studio
Belangrijk
Items die in dit artikel zijn gemarkeerd (preview) zijn momenteel beschikbaar als openbare preview. Deze preview wordt aangeboden zonder een service level agreement en we raden deze niet aan voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.
Met Azure AI Studio kunt u grote taalmodellen aanpassen aan uw persoonlijke gegevenssets met behulp van een proces dat bekend staat als afstemmen.
Fijn bewerken biedt een aanzienlijke waarde door aanpassing en optimalisatie in te schakelen voor specifieke taken en toepassingen. Dit leidt tot verbeterde prestaties, kostenefficiëntie, verminderde latentie en op maat gemaakte uitvoer.
In dit artikel leert u hoe u Meta Llama-modellen kunt verfijnen in Azure AI Studio.
De Meta Llama-familie van grote taalmodellen (LLM's) is een verzameling vooraf getrainde en verfijnde tekstmodellen, variërend van 7 miljard tot 70 miljard parameters. De modelfamilie bevat ook verfijnde versies die zijn geoptimaliseerd voor gebruiksvoorbeelden voor dialoog met Reinforcement Learning from Human Feedback (RLHF), genaamd Llama-Instruct.
Belangrijk
Modellen die in preview zijn, worden gemarkeerd als voorbeeld op hun modelkaarten in de modelcatalogus.
Modellen
De volgende modellen zijn beschikbaar in Azure Marketplace voor Llama 3.1 bij het afstemmen als een service met betalen per gebruik-facturering:
Meta-Llama-3.1-70B-Instruct
(preview)Meta-LLama-3.1-8b-Instruct
(preview)
Het afstemmen van Llama 3.1-modellen wordt momenteel ondersteund in projecten die zich in US - west bevinden 3.
Belangrijk
Op dit moment kunnen we niet afstemmen voor Llama 3.1 met een reekslengte van 128.000.
Vereisten
Een Azure-abonnement met een geldige betalingswijze. Gratis of proefversie van Azure-abonnementen werkt niet. Als u geen Azure-abonnement hebt, maakt u eerst een betaald Azure-account .
Een Azure AI Studio-hub.
Belangrijk
Voor Meta Llama 3.1-modellen is het model voor betalen per gebruik alleen beschikbaar met hubs die zijn gemaakt in regio's VS - west 3 .
Een Azure AI Studio-project in Azure AI Studio.
Op rollen gebaseerd toegangsbeheer van Azure (Azure RBAC) wordt gebruikt om toegang te verlenen tot bewerkingen in Azure AI Studio. Als u de stappen in dit artikel wilt uitvoeren, moet aan uw gebruikersaccount de rol eigenaar of inzender voor het Azure-abonnement zijn toegewezen. U kunt ook een aangepaste rol aan uw account toewijzen met de volgende machtigingen:
In het Azure-abonnement: als u het AI Studio-project wilt abonneren op het Azure Marketplace-aanbod, één keer voor elk project, per aanbieding:
Microsoft.MarketplaceOrdering/agreements/offers/plans/read
Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
Microsoft.SaaS/register/action
In de resourcegroep—om de SaaS-resource te maken en te gebruiken:
Microsoft.SaaS/resources/read
Microsoft.SaaS/resources/write
In het AI Studio-project: als u eindpunten wilt implementeren (de Azure AI Developer-rol bevat deze machtigingen al):
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Zie Op rollen gebaseerd toegangsbeheer in Azure AI Studio voor meer informatie over machtigingen.
Registratie van abonnementsprovider
Controleer of het abonnement is geregistreerd bij de Microsoft.Network
resourceprovider.
Meld u aan bij het Azure-portaal.
Selecteer Abonnementen in het linkermenu.
Selecteer het abonnement dat u wilt gebruiken.
Selecteer Resourceproviders voor instellingen>in het linkermenu.
Controleer of Microsoft.Network in de lijst met resourceproviders staat. Voeg het anders toe.
Gegevensvoorbereiding
Bereid uw trainings- en validatiegegevens voor om uw model fijn te bewerken. Uw trainingsgegevens en validatiegegevenssets bestaan uit voorbeelden van invoer en uitvoer voor hoe u het model wilt laten presteren.
Zorg ervoor dat al uw trainingsvoorbeelden de verwachte indeling voor deductie volgen. Om modellen effectief af te stemmen, zorgt u voor een evenwichtige en diverse gegevensset.
Dit omvat het onderhouden van gegevensbalans, waaronder verschillende scenario's, en het periodiek verfijnen van trainingsgegevens om te voldoen aan werkelijke verwachtingen, wat uiteindelijk leidt tot nauwkeurigere en evenwichtiger modelreacties.
Voor verschillende modeltypen is een andere indeling van trainingsgegevens vereist.
De trainings- en validatiegegevens die u gebruikt , moeten worden opgemaakt als een JSON Lines-document (JSONL). De Meta-Llama-3.1-70B-Instruct
gegevensset voor het afstemmen van de gegevensset moet worden opgemaakt in de gespreksindeling die wordt gebruikt door de API voor voltooiing van chats.
Voorbeeld van bestandsindeling
{"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Is Xbox better than PlayStation?"}, {"role": "assistant", "content": "I apologize, but I cannot provide personal opinions. My primary job is to assist you with any issues related to your Xbox device. Do you have any Xbox-related issues that need addressing?"}]}
{"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Can I play PC games on my Xbox?"}, {"role": "assistant", "content": "While Xbox consoles don't natively support PC games, they can play an array of Xbox games, many of which are also available on PC. Can I assist you with finding games compatible with your Xbox device?"}]}
{"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "I'm having trouble connecting my Xbox to the Wi-Fi."}, {"role": "assistant", "content": "No worries, let's go through the network settings on your Xbox. Can you please tell me what happens when you try to connect it to the Wi-Fi?"}]}
Het ondersteunde bestandstype is JSON-regels. Bestanden worden geüpload naar het standaardgegevensarchief en beschikbaar gemaakt in uw project.
Een Meta Llama-model verfijnen
Een LLama 3.1-model verfijnen:
Meld u aan bij Azure AI Studio.
Kies het model dat u wilt verfijnen in de Azure AI Studio-modelcatalogus.
Selecteer op de pagina Details van het model de optie Afstemmen.
Selecteer het project waarin u uw modellen wilt verfijnen. Als u het model voor betalen per gebruik wilt gebruiken, moet uw werkruimte deel uitmaken van de regio VS - west 3 .
Selecteer in de wizard Verfijnen de koppeling naar azure Marketplace-voorwaarden voor meer informatie over de gebruiksvoorwaarden. U kunt ook het tabblad Details van marketplace-aanbiedingen selecteren voor meer informatie over prijzen voor het geselecteerde model.
Als dit de eerste keer is dat het model in het project wordt afgestemd, moet u zich abonneren op uw project voor het specifieke aanbod (bijvoorbeeld Meta-Llama-3.1-70B-Instruct) vanuit Azure Marketplace. Voor deze stap is vereist dat uw account beschikt over de machtigingen voor het Azure-abonnement en de resourcegroepmachtigingen die worden vermeld in de vereisten. Elk project heeft een eigen abonnement op de specifieke Azure Marketplace-aanbieding, waarmee u uitgaven kunt beheren en bewaken. Selecteer Abonneren en afstemmen.
Notitie
Als u een project abonneert op een bepaalde Azure Marketplace-aanbieding (in dit geval Meta-Llama-3.1-70B-Instruct), moet uw account inzender- of eigenaarstoegang hebben op abonnementsniveau waar het project wordt gemaakt. U kunt ook een aangepaste rol toewijzen aan uw gebruikersaccount met de machtigingen voor het Azure-abonnement en de resourcegroepmachtigingen die worden vermeld in de vereisten.
Zodra u zich hebt geregistreerd voor het specifieke Azure Marketplace-aanbod, hoeft u zich niet opnieuw te abonneren op de volgende afstemming van dezelfde aanbieding in hetzelfde project. Daarom hoeft u niet over de machtigingen op abonnementsniveau te beschikken voor volgende taken. Als dit scenario op u van toepassing is, selecteert u Doorgaan om af te stemmen.
Voer een naam in voor uw aangepaste model en de optionele tags en beschrijving.
Selecteer trainingsgegevens om uw model af te stemmen. Zie gegevensvoorbereiding voor meer informatie.
Notitie
Als u uw trainings-/validatiebestanden in een referentie minder gegevensarchief hebt, moet u beheerde identiteiten van de werkruimte toegang geven tot hun gegevensarchief om verder te gaan met MaaS-afstemming met een referentie die minder opslag nodig heeft. Selecteer op de pagina Gegevensarchief, nadat u op Verificatie bijwerken hebt > geklikt, de volgende optie:
Zorg ervoor dat al uw trainingsvoorbeelden de verwachte indeling voor deductie volgen. Om modellen effectief af te stemmen, zorgt u voor een evenwichtige en diverse gegevensset. Dit omvat het onderhouden van gegevensbalans, waaronder verschillende scenario's, en het periodiek verfijnen van trainingsgegevens om te voldoen aan werkelijke verwachtingen, wat uiteindelijk leidt tot nauwkeurigere en evenwichtiger modelreacties.
- De batchgrootte die moet worden gebruikt voor training. Als deze waarde is ingesteld op -1, wordt batch_size berekend als 0,2% van de voorbeelden in de trainingsset en is het maximum 256.
- Het afstemmen van het leerpercentage is het oorspronkelijke leerpercentage dat wordt gebruikt voor pretraining vermenigvuldigd met deze vermenigvuldiger. We raden u aan te experimenteren met waarden tussen 0,5 en 2. Empirisch gezien hebben we vastgesteld dat grotere leersnelheden vaak beter presteren met grotere batchgrootten. Moet tussen 0,0 en 5.0 zijn.
- Aantal trainingstijdvakken. Een tijdsperiode verwijst naar één volledige cyclus door de gegevensset.
Taakparameters zijn een optionele stap en een geavanceerde optie: hyperparameter afstemmen is essentieel voor het optimaliseren van grote taalmodellen (LLM's) in echte toepassingen. Hierdoor kunnen de prestaties en het efficiënte resourcegebruik worden verbeterd. De standaardinstellingen kunnen worden gebruikt of geavanceerde gebruikers kunnen parameters zoals epochs of leersnelheid aanpassen.
Controleer uw selecties en ga verder met het trainen van uw model.
Zodra uw model is afgestemd, kunt u het model implementeren en gebruiken in uw eigen toepassing, in de speeltuin of in de promptstroom. Zie Llama 3.1-serie met grote taalmodellen implementeren met Azure AI Studio voor meer informatie.
Uw verfijnde modellen opschonen
U kunt een nauwkeurig afgestemd model verwijderen uit de lijst met verfijningsmodellen in Azure AI Studio of op de pagina met modeldetails. Selecteer het aangepaste model dat u wilt verwijderen van de pagina Afstemmen en selecteer vervolgens de knop Verwijderen om het aangepaste model te verwijderen.
Notitie
U kunt een aangepast model niet verwijderen als het een bestaande implementatie heeft. U moet eerst uw modelimplementatie verwijderen voordat u uw aangepaste model kunt verwijderen.
Kosten en quota
Kosten- en quotumoverwegingen voor Meta Llama-modellen die zijn afgestemd als een service
Meta Llama-modellen die zijn afgestemd als een service, worden aangeboden door Meta via De Azure Marketplace en geïntegreerd met Azure AI Studio voor gebruik. U vindt de prijzen van Azure Marketplace bij het implementeren of verfijnen van de modellen.
Telkens wanneer een project zich abonneert op een bepaalde aanbieding vanuit Azure Marketplace, wordt er een nieuwe resource gemaakt om de kosten te traceren die zijn gekoppeld aan het verbruik. Dezelfde resource wordt gebruikt om de kosten te traceren die zijn gekoppeld aan deductie en verfijning; er zijn echter meerdere meters beschikbaar om elk scenario onafhankelijk te traceren.
Zie Monitoring van kosten voor modellen die worden aangeboden in de Azure Marketplace voor meer informatie over het traceren van kosten.
Inhoud filteren
Modellen die zijn geïmplementeerd als een service met betalen per gebruik-facturering, worden beveiligd door Azure AI Content Safety. Wanneer deze wordt geïmplementeerd op realtime-eindpunten, kunt u zich afmelden voor deze mogelijkheid. Als de veiligheid van Azure AI-inhoud is ingeschakeld, passeren zowel de prompt als de voltooiing een ensemble van classificatiemodellen die zijn gericht op het detecteren en voorkomen van de uitvoer van schadelijke inhoud. Het systeem voor inhoudsfiltering (preview) detecteert en onderneemt actie op specifieke categorieën van mogelijk schadelijke inhoud in invoerprompts en uitvoervoltooiingen. Meer informatie over Azure AI Content Safety.