Aan de slag met het Python Enterprise-chatvoorbeeld met BEHULP van RAG

In dit artikel leest u hoe u het voorbeeld van de Enterprise-chat-app voor Python implementeert en uitvoert. In dit voorbeeld wordt een chat-app geïmplementeerd met behulp van Python, Azure OpenAI Service en RAG (Retrieval Augmented Generation) in Azure AI Search om antwoorden te krijgen op de voordelen van werknemers bij een fictief bedrijf. De app wordt geseed met PDF-bestanden, waaronder het handboek voor werknemers, een document met voordelen en een lijst met bedrijfsrollen en verwachtingen.

Door de instructies in dit artikel te volgen, gaat u het volgende doen:

  • Een chat-app implementeren in Azure.
  • Krijg antwoorden over werknemersvoordelen.
  • Wijzig de instellingen om het gedrag van reacties te wijzigen.

Zodra u deze procedure hebt voltooid, kunt u beginnen met het wijzigen van het nieuwe project met uw aangepaste code.

Dit artikel maakt deel uit van een verzameling artikelen die laten zien hoe u een chat-app bouwt met behulp van Azure OpenAI Service en Azure AI Search.

Andere artikelen in de verzameling zijn:

Architectuuroverzicht

In het volgende diagram ziet u een eenvoudige architectuur van de chat-app:

Diagram met architectuur van client-naar back-end-app.

Belangrijke onderdelen van de architectuur zijn:

  • Een webtoepassing voor het hosten van de interactieve chat-ervaring.
  • Een Azure AI Search-resource om antwoorden te krijgen op basis van uw eigen gegevens.
  • Een Azure OpenAI-service om het volgende te bieden:
    • Trefwoorden om de zoekopdracht over uw eigen gegevens te verbeteren.
    • Antwoorden van het OpenAI-model.
    • Insluitingen van het ada-model

Kosten

De meeste resources in deze architectuur gebruiken een prijscategorie basic of verbruik. De prijzen voor verbruik zijn gebaseerd op gebruik, wat betekent dat u alleen betaalt voor wat u gebruikt. Om dit artikel te voltooien, worden er kosten in rekening gebracht, maar dit is minimaal. Wanneer u klaar bent met het artikel, kunt u de resources verwijderen om te stoppen met het maken van kosten.

Meer informatie over kosten in de voorbeeldopslagplaats.

Vereisten

Er is een ontwikkelcontaineromgeving beschikbaar met alle afhankelijkheden die nodig zijn om dit artikel te voltooien. U kunt de ontwikkelcontainer uitvoeren in GitHub Codespaces (in een browser) of lokaal met behulp van Visual Studio Code.

Als u dit artikel wilt gebruiken, hebt u de volgende vereisten nodig:

  1. Een Azure-abonnement - Een gratis abonnement maken
  2. Azure-accountmachtigingen: uw Azure-account moet beschikken over Microsoft.Authorization/roleAssignments/write-machtigingen, zoals Gebruikerstoegang Beheer istrator of Eigenaar.
  3. Toegang verleend tot Azure OpenAI in het gewenste Azure abonnement. Op dit moment wordt alleen toegang tot deze service verleend door een aanvraag te doen. U kunt toegang tot Azure OpenAI aanvragen door het formulier in te vullen op https://aka.ms/oai/access. Open een probleem op deze opslagplaats om contact met ons op te stellen als u een probleem hebt.
  4. GitHub-account

Open ontwikkelomgeving

Begin nu met een ontwikkelomgeving waarop alle afhankelijkheden zijn geïnstalleerd om dit artikel te voltooien.

GitHub Codespaces voert een ontwikkelcontainer uit die wordt beheerd door GitHub met Visual Studio Code voor het web als de gebruikersinterface. Voor de eenvoudigste ontwikkelomgeving gebruikt u GitHub Codespaces zodat u de juiste ontwikkelhulpprogramma's en afhankelijkheden vooraf hebt geïnstalleerd om dit artikel te voltooien.

Belangrijk

Alle GitHub-accounts kunnen Codespaces elke maand maximaal 60 uur gratis gebruiken met 2 kernexemplaren. Zie GitHub Codespaces maandelijks inbegrepen opslag- en kernuren voor meer informatie.

  1. Start het proces om een nieuwe GitHub Codespace te maken op de main vertakking van de Azure-Samples/azure-search-openai-demo GitHub-opslagplaats.

  2. Klik met de rechtermuisknop op de volgende knop en selecteer De koppeling Openen in nieuwe vensters om zowel de ontwikkelomgeving als de documentatie tegelijkertijd beschikbaar te maken.

  3. Controleer op de pagina Codespace maken de configuratie-instellingen voor codespace en selecteer vervolgens Nieuwe codespace maken

    Schermopname van het bevestigingsscherm voordat u een nieuwe coderuimte maakt.

  4. Wacht tot de coderuimte is gestart. Dit opstartproces kan enkele minuten duren.

  5. Meld u in de terminal onderaan het scherm aan bij Azure met de Azure Developer CLI.

    azd auth login
    
  6. Kopieer de code uit de terminal en plak deze in een browser. Volg de instructies voor verificatie met uw Azure-account.

  7. De resterende taken in dit artikel vinden plaats in de context van deze ontwikkelingscontainer.

Implementeren en uitvoeren

De voorbeeldopslagplaats bevat alle code- en configuratiebestanden die u nodig hebt om een chat-app te implementeren in Azure. Met de volgende stappen doorloopt u het proces voor het implementeren van het voorbeeld in Azure.

Chat-app implementeren in Azure

Belangrijk

Voor Azure-resources die in deze sectie zijn gemaakt, worden directe kosten in rekening gebracht, voornamelijk op basis van de Azure AI Search-resource. Deze resources kunnen kosten genereren, zelfs als u de opdracht onderbreekt voordat deze volledig wordt uitgevoerd.

  1. Voer de volgende Azure Developer CLI-opdracht uit om de Azure-resources in te richten en de broncode te implementeren:

    azd up
    
  2. Wanneer u wordt gevraagd een omgevingsnaam in te voeren, moet u deze kort en klein houden. Bijvoorbeeld: myenv. Deze wordt gebruikt als onderdeel van de naam van de resourcegroep.

  3. Wanneer u hierom wordt gevraagd, selecteert u een abonnement waarin u de resources wilt maken.

  4. Wanneer u de eerste keer wordt gevraagd om een locatie te selecteren, selecteert u een locatie bij u in de buurt. Deze locatie wordt gebruikt voor de meeste resources, waaronder hosting.

  5. Als u wordt gevraagd om een locatie voor het OpenAI-model of voor de Document Intelligence-resource, selecteert u de locatie die het dichtst bij u in de buurt is. Als dezelfde locatie beschikbaar is als uw eerste locatie, selecteert u die.

  6. Wacht totdat de app is geïmplementeerd. Het kan 5-10 minuten duren voordat de implementatie is voltooid.

  7. Nadat de toepassing is geïmplementeerd, ziet u een URL die wordt weergegeven in de terminal.

  8. Selecteer die URL die is gelabeld (✓) Done: Deploying service webapp om de chattoepassing in een browser te openen.

    Schermopname van de chat-app in de browser met verschillende suggesties voor chatinvoer en het tekstvak voor chat om een vraag in te voeren.

Chat-app gebruiken om antwoorden te krijgen uit PDF-bestanden

De chat-app wordt vooraf geladen met informatie over werknemersvoordelen van PDF-bestanden. U kunt de chat-app gebruiken om vragen te stellen over de voordelen. Met de volgende stappen doorloopt u het proces voor het gebruik van de chat-app.

  1. Selecteer of voer in de browser in wat er gebeurt in een prestatiebeoordeling? in het chattekstvak.

    Schermopname van het eerste antwoord van de chat-app.

  2. Selecteer een bronvermelding in het antwoord.

    Schermopname van het eerste antwoord van de chat-app met de bronvermelding gemarkeerd in een rood vak.

  3. Gebruik in het rechterdeelvenster de tabbladen om te begrijpen hoe het antwoord is gegenereerd.

    Tabblad Beschrijving
    Gedachteproces Dit is een script van de interacties in chat. U kunt de systeemprompt () en uw gebruikersvraag (content) bekijken.content
    Ondersteunende inhoud Dit omvat de informatie om uw vraag en het bronmateriaal te beantwoorden. Het aantal bronmateriaalvermeldingen wordt vermeld in de instellingen voor ontwikkelaars. De standaardwaarde is 3.
    Gegevensvermelding Hiermee wordt de oorspronkelijke pagina weergegeven die de bronvermelding bevat.
  4. Wanneer u klaar bent, selecteert u het geselecteerde tabblad opnieuw om het deelvenster te sluiten.

Instellingen voor chat-apps gebruiken om het gedrag van reacties te wijzigen

De intelligentie van de chat wordt bepaald door het OpenAI-model en de instellingen die worden gebruikt om met het model te communiceren.

Schermopname van instellingen voor chatontwikkelaars.

Instelling Beschrijving
Promptsjabloon overschrijven Dit is de prompt die wordt gebruikt om het antwoord te genereren.
Temperatuur De temperatuur die wordt gebruikt voor de laatste chat-voltooiings-API-aanroep, een getal tussen 0 en 1 dat de 'creativiteit' van het model bepaalt.
Minimale zoekscore De minimale score van de zoekresultaten die worden gebruikt om het antwoord te genereren. Het bereik is afhankelijk van de gebruikte zoekmodus.
Minimale herrankerscore De minimale score van de semantische rangschikking van de zoekresultaten die worden gebruikt om het antwoord te genereren. Varieert van 0-4.
Dit aantal zoekresultaten ophalen Dit is het aantal zoekresultaten dat wordt gebruikt om het antwoord te genereren. U kunt deze bronnen zien die worden geretourneerd in het gedachtenproces en de tabbladen Ondersteunende inhoud van de bronvermelding.
Categorie uitsluiten Dit is de categorie documenten die zijn uitgesloten van de zoekresultaten.
Semantische ranker gebruiken voor ophalen Dit is een functie van Azure AI Search die machine learning gebruikt om de relevantie van zoekresultaten te verbeteren.
Querycontextuele samenvattingen gebruiken in plaats van hele documenten Wanneer beide Use semantic ranker en Use query-contextual summaries worden gecontroleerd, gebruikt de LLM onderschrift s die zijn geëxtraheerd uit belangrijke passages, in plaats van alle passages, in de hoogste gerangschikte documenten.
Vervolgvragen voorstellen Laat de chat-app opvolgende vragen voorstellen op basis van het antwoord.
Ophaalmodus Vectoren + tekst betekent dat de zoekresultaten zijn gebaseerd op de tekst van de documenten en de insluitingen van de documenten. Vectoren betekent dat de zoekresultaten zijn gebaseerd op de insluitingen van de documenten. Tekst betekent dat de zoekresultaten zijn gebaseerd op de tekst van de documenten.
Antwoorden op voltooiing van de Stream-chat Stream-antwoord in plaats van te wachten totdat het volledige antwoord beschikbaar is voor een antwoord.

Met de volgende stappen doorloopt u het proces voor het wijzigen van de instellingen.

  1. Selecteer in de browser het tabblad Ontwikkelaars Instellingen.

  2. Schakel het selectievakje Vervolgvragen voorstellen in en stel dezelfde vraag opnieuw.

    What happens in a performance review?
    

    De chat heeft voorgestelde vervolgvragen geretourneerd, zoals:

    1. What is the frequency of performance reviews?
    2. How can employees prepare for a performance review?
    3. Can employees dispute the feedback received during the performance review?
    
  3. Schakel op het tabblad Instellingen deselecteer de optie Semantische rangschikking gebruiken om op te halen.

  4. Dezelfde vraag opnieuw stellen?

    What happens in a performance review?
    
  5. Wat is het verschil in de antwoorden?

    Met de Semantische ranker: Tijdens een prestatiebeoordeling bij Contoso Electronics kunnen werknemers hun successen en uitdagingen op de werkplek bespreken (1). De beoordeling geeft positieve en constructieve feedback om werknemers te helpen bij het ontwikkelen en groeien van hun rollen (1). De werknemer ontvangt een schriftelijk overzicht van de beoordeling van de prestaties, waaronder een beoordeling van hun prestaties, feedback en doelstellingen voor het komende jaar (1). De prestatiebeoordeling is een tweerichtingsdialoog tussen managers en werknemers (1).

    Zonder de Semantische rangschikking: tijdens een prestatiebeoordeling bij Contoso Electronics hebben werknemers de mogelijkheid om hun successen en uitdagingen op de werkplek te bespreken. Positieve en constructieve feedback wordt gegeven om werknemers te helpen bij het ontwikkelen en groeien van hun rollen. Er wordt een geschreven samenvatting gegeven van de beoordeling van de prestaties, inclusief een beoordeling van prestaties, feedback en doelstellingen voor het komende jaar. De beoordeling is een tweerichtingsdialoog tussen managers en werknemers (1).

Resources opschonen

Azure-resources opschonen

De Azure-resources die in dit artikel zijn gemaakt, worden gefactureerd voor uw Azure-abonnement. Als u deze resources in de toekomst niet meer nodig hebt, verwijdert u deze om te voorkomen dat er meer kosten in rekening worden gebracht.

Voer de volgende Azure Developer CLI-opdracht uit om de Azure-resources te verwijderen en de broncode te verwijderen:

azd down --purge --force

De schakelopties bieden:

  • purge: Verwijderde resources worden onmiddellijk verwijderd. Hiermee kunt u de TPM van Azure OpenAI opnieuw gebruiken.
  • force: Het verwijderen gebeurt onhandig, zonder dat hiervoor toestemming van de gebruiker is vereist.

GitHub Codespaces opschonen

Als u de GitHub Codespaces-omgeving verwijdert, zorgt u ervoor dat u de hoeveelheid gratis rechten per kernuren kunt maximaliseren die u voor uw account krijgt.

Belangrijk

Zie GitHub Codespaces maandelijks inbegrepen opslag- en kernuren voor meer informatie over de rechten van uw GitHub-account.

  1. Meld u aan bij het GitHub Codespaces-dashboard (https://github.com/codespaces).

  2. Zoek uw momenteel uitgevoerde Codespaces die afkomstig zijn uit de Azure-Samples/azure-search-openai-demo GitHub-opslagplaats.

    Schermopname van alle actieve Codespaces, inclusief hun status en sjablonen.

  3. Open het contextmenu voor de coderuimte en selecteer Vervolgens Verwijderen.

    Schermopname van het contextmenu voor één coderuimte met de optie Verwijderen gemarkeerd.

Hulp vragen

Deze voorbeeldopslagplaats biedt informatie over probleemoplossing.

Als uw probleem niet is opgelost, meldt u het probleem aan bij de problemen van de opslagplaats.

Volgende stappen