Introductie

Voltooid

Taalmodellen zijn krachtige hulpprogramma's voor het bouwen van generatieve AI-toepassingen, maar een basismodel op zichzelf voldoet mogelijk niet aan al uw vereisten. De kwaliteit, nauwkeurigheid en consistentie van de antwoorden die een model genereert, is afhankelijk van hoe u het configureert en vergroot.

Stel dat u een ontwikkelaar bent die werkt voor een reisbureau. U bouwt een chattoepassing om klanten te helpen met hun reisgerelateerde vragen. Het basismodel biedt fatsoenlijke antwoorden, maar uw team heeft specifieke behoeften: de antwoorden moeten de toon van het bedrijf volgen, nauwkeurige informatie over uw hotelcatalogus bevatten en een consistente indeling behouden tussen interacties. Hoe krijg je het model zover om op dit niveau te presteren?

Er zijn verschillende complementaire strategieën die u kunt gebruiken om de prestaties van een generatief AI-model te optimaliseren. Deze strategieën variëren van snelle, goedkope aanpassingen aan meer betrokken technieken waarvoor extra tijd en resources nodig zijn.

Diagram met de verschillende strategieën om de prestaties van het model te optimaliseren, van prompt engineering tot RAG en afstemming.

In deze module verkent u elk van deze strategieën en leert u wanneer en hoe u deze afzonderlijk of in combinatie kunt toepassen.

In deze module leert u het volgende:

  • Pas prompttechnieken toe, waaronder systeemberichten, few-shot learning en modelparameters, om de uitvoer van het model te optimaliseren.
  • Begrijpen wanneer en hoe een taalmodel gegrond moet worden met behulp van Retrieval Augmented Generation (RAG).
  • Identificeren wanneer het verfijnen van een model de gedragsconsistentie verbetert.
  • Vergelijk optimalisatiestrategieën en bepaal wanneer ze moeten worden gecombineerd.

Vereiste voorwaarden

  • Bekendheid met fundamentele AI-concepten en -services in Azure.
  • Basiskennis van generatieve AI-modellen en hoe ze reacties genereren.