Začínáme s ukázkou podnikového chatu v Pythonu s využitím RAG

V tomto článku se dozvíte, jak nasadit a spustit ukázku podnikové chatovací aplikace pro Python. Tato ukázka implementuje chatovací aplikaci pomocí Pythonu, služby Azure OpenAI a načítání rozšířené generace (RAG) ve službě Azure AI Search, aby získala odpovědi na výhody zaměstnanců ve fiktivní společnosti. Aplikace je oseděna soubory PDF, včetně příručky pro zaměstnance, dokumentu o výhodách a seznamu rolí a očekávání společnosti.

Postupujte podle pokynů v tomto článku:

  • Nasazení chatovací aplikace do Azure
  • Získejte odpovědi na výhody zaměstnanců.
  • Změňte nastavení a změňte chování odpovědí.

Po dokončení tohoto postupu můžete začít upravovat nový projekt pomocí vlastního kódu.

Tento článek je součástí kolekce článků, ve kterých se dozvíte, jak vytvořit chatovací aplikaci pomocí služby Azure OpenAI a azure AI Search.

Mezi další články v kolekci patří:

Přehled architektury

Jednoduchá architektura chatovací aplikace je znázorněná v následujícím diagramu:

Diagram znázorňující architekturu z klienta do back-endové aplikace

Mezi klíčové součásti architektury patří:

  • Webová aplikace pro hostování interaktivního chatu
  • Prostředek Azure AI Search, který vám umožní získat odpovědi z vašich vlastních dat.
  • Služba Azure OpenAI, která poskytuje:
    • Klíčová slova pro vylepšení hledání nad vlastními daty
    • Odpovědi od modelu OpenAI.
    • Vkládání z modelu ada

Náklady

Většina prostředků v této architektuře používá cenovou úroveň Basic nebo Consumption. Ceny spotřeby jsou založené na využití, což znamená, že platíte jenom za to, co používáte. K dokončení tohoto článku bude účtován poplatek, ale bude minimální. Až budete s článkem hotovi, můžete prostředky odstranit, abyste přestali účtovat poplatky.

Přečtěte si další informace o nákladech v ukázkovém úložišti.

Požadavky

Vývojové prostředí kontejneru je k dispozici se všemi závislostmi potřebnými k dokončení tohoto článku. Vývojový kontejner můžete spustit v GitHub Codespaces (v prohlížeči) nebo místně pomocí editoru Visual Studio Code.

Pokud chcete použít tento článek, potřebujete následující požadavky:

  1. Předplatné Azure – Vytvoření předplatného zdarma
  2. Oprávnění účtu Azure – Váš účet Azure musí mít oprávnění Microsoft.Authorization/roleAssignments/write, jako je uživatelský přístup Správa istrator nebo vlastník.
  3. Přístup k Azure OpenAI je udělován v požadovaném předplatném Azure. V současné době je přístup k této službě udělován pouze aplikací. Pokud chcete získat přístup k Azure OpenAI, vyplňte formulář na adrese https://aka.ms/oai/access. Pokud máte problém, otevřete problém v tomto úložišti a kontaktujte nás.
  4. Účet GitHub

Otevřené vývojové prostředí

Začněte teď s vývojovým prostředím, které má nainstalované všechny závislosti k dokončení tohoto článku.

GitHub Codespaces spouští vývojový kontejner spravovaný GitHubem pomocí editoru Visual Studio Code pro web jako uživatelského rozhraní. Pro nejjednodušší vývojové prostředí použijte GitHub Codespaces, abyste měli předinstalované správné vývojářské nástroje a závislosti k dokončení tohoto článku.

Důležité

Všechny účty GitHubu můžou každý měsíc používat Codespaces až 60 hodin zdarma se 2 jádrovými instancemi. Další informace najdete v tématu GitHub Codespaces měsíčně zahrnuté úložiště a hodiny jádra.

  1. Spusťte proces vytvoření nového prostředí GitHub Codespace ve main větvi Azure-Samples/azure-search-openai-demo úložiště GitHub.

  2. Klikněte pravým tlačítkem myši na následující tlačítko a vyberte Otevřít odkaz v nových oknech , abyste měli k dispozici vývojové prostředí i dokumentaci najednou.

  3. Na stránce Vytvořit kódspace zkontrolujte nastavení konfigurace codespace a pak vyberte Vytvořit nový prostor kódu.

    Snímek obrazovky s potvrzením před vytvořením nového prostoru kódu

  4. Počkejte, až se prostor kódu spustí. Tento proces spuštění může trvat několik minut.

  5. V terminálu v dolní části obrazovky se přihlaste k Azure pomocí Azure Developer CLI.

    azd auth login
    
  6. Zkopírujte kód z terminálu a vložte ho do prohlížeče. Postupujte podle pokynů k ověření pomocí účtu Azure.

  7. Zbývající úlohy v tomto článku probíhají v kontextu tohoto vývojového kontejneru.

Nasazení a spuštění

Ukázkové úložiště obsahuje všechny soubory kódu a konfigurace, které potřebujete k nasazení chatovací aplikace do Azure. Následující kroky vás provedou procesem nasazení ukázky do Azure.

Nasazení chatovací aplikace do Azure

Důležité

Prostředky Azure vytvořené v této části účtují okamžité náklady, především z prostředku Azure AI Search. Tyto prostředky můžou nabíhání nákladů i v případě, že příkaz přerušíte před jeho úplným spuštěním.

  1. Spuštěním následujícího příkazu Azure Developer CLI zřiďte prostředky Azure a nasaďte zdrojový kód:

    azd up
    
  2. Když se zobrazí výzva k zadání názvu prostředí, ponechte ho krátkým a malými písmeny. Například myenv. Používá se jako součást názvu skupiny prostředků.

  3. Po zobrazení výzvy vyberte předplatné, ve které chcete prostředky vytvořit.

  4. Když se zobrazí výzva k prvnímu výběru umístění, vyberte umístění blízko vás. Toto umístění se používá pro většinu prostředků včetně hostování.

  5. Pokud se zobrazí výzva k zadání umístění modelu OpenAI nebo prostředku Document Intelligence, vyberte umístění, které je k vám nejblíže. Pokud je stejné umístění dostupné jako vaše první umístění, vyberte ho.

  6. Počkejte, až se aplikace nasadí. Dokončení nasazení může trvat 5 až 10 minut.

  7. Po úspěšném nasazení aplikace se v terminálu zobrazí adresa URL.

  8. Výběrem této adresy URL otevřete (✓) Done: Deploying service webapp chatovací aplikaci v prohlížeči.

    Snímek obrazovky chatovací aplikace v prohlížeči s několika návrhy pro vstup chatu a textovým polem chatu pro zadání otázky

Získání odpovědí ze souborů PDF pomocí chatovací aplikace

Chatovací aplikace se předem načte s informacemi o výhodách zaměstnanců ze souborů PDF. Chatovací aplikaci můžete použít k kladení otázek ohledně výhod. Následující kroky vás provedou procesem používání chatovací aplikace.

  1. V prohlížeči vyberte nebo zadejte , co se stane v revizi výkonu? v textovém poli chatu.

    Snímek obrazovky s první odpovědí chatovací aplikace

  2. V odpovědi vyberte citaci.

    Snímek obrazovky s první odpovědí chatovací aplikace se zvýrazněnou citací v červeném poli

  3. V pravém podokně použijte karty, abyste pochopili, jak se odpověď vygenerovala.

    Tab Popis
    Myšlenkový proces Toto je skript interakcí v chatu. Můžete zobrazit výzvu systému (content) a otázku uživatele (content).
    Podpůrný obsah To zahrnuje informace pro zodpovězení vaší otázky a zdrojového materiálu. Počet zdrojových citací je uveden v nastavení pro vývojáře. Výchozí hodnota je 3.
    Citace Zobrazí se původní stránka, která obsahuje citaci.
  4. Až budete hotovi, znovu vyberte vybranou kartu a podokno zavřete.

Změna chování odpovědí pomocí nastavení chatovací aplikace

Inteligenci chatu určuje model OpenAI a nastavení, která se používají k interakci s modelem.

Snímek obrazovky s nastavením vývojáře chatu

Nastavení Popis
Přepsání šablony výzvy Toto je výzva, která slouží k vygenerování odpovědi.
Teplota Teplota používaná pro konečné volání rozhraní API pro dokončování chatu, číslo mezi 0 a 1, které řídí "kreativitu" modelu.
Minimální skóre hledání Minimální skóre výsledků hledání, které se používají k vygenerování odpovědi. Rozsah závisí na použitém režimu vyhledávání.
Minimální skóre rerankeru Minimální skóre z sémantického rankeru výsledků hledání, které se používají k vygenerování odpovědi. Pohybuje se od 0 do 4.
Načtení tohoto počtu výsledků hledání Toto je počet výsledků hledání, které se používají k vygenerování odpovědi. Tyto zdroje vrácené v myšlenkovém procesu a podpůrných kartách obsahu citace můžete vidět.
Vyloučit kategorii Toto je kategorie dokumentů, které jsou vyloučené z výsledků hledání.
Použití sémantického rankeru pro načtení Toto je funkce služby Azure AI Search , která využívá strojové učení ke zlepšení relevance výsledků hledání.
Použití kontextových souhrnů dotazu místo celých dokumentů Při kontrole Use semantic rankerUse query-contextual summaries používá LLM popis extrahované z klíčových pasáží místo všech pasáží v nejřadivějších dokumentech.
Návrhy následných otázek Požádejte chatovací aplikaci, aby na základě odpovědi navrhla následné otázky.
Režim načítání Vektory + Text znamenají, že výsledky hledání jsou založeny na textu dokumentů a vkládání dokumentů. Vektory znamenají, že výsledky hledání jsou založené na vkládání dokumentů. Text znamená, že výsledky hledání jsou založené na textu dokumentů.
Odpovědi na dokončování chatu streamu Odpověď streamu místo čekání na dokončení odpovědi.

Následující kroky vás provedou procesem změny nastavení.

  1. V prohlížeči vyberte kartu Vývojář Nastavení.

  2. Zaškrtněte políčko Navrhnout následné otázky a znovu položte stejnou otázku.

    What happens in a performance review?
    

    V chatu se vrátily navrhované následné otázky, například následující:

    1. What is the frequency of performance reviews?
    2. How can employees prepare for a performance review?
    3. Can employees dispute the feedback received during the performance review?
    
  3. Na kartě Nastavení zrušte výběr příkazu Použít sémantický ranker pro načtení.

  4. Položte stejnou otázku znovu?

    What happens in a performance review?
    
  5. Jaký je rozdíl v odpovědích?

    Se sémantickou rankerkou: Během kontroly výkonnosti ve společnosti Contoso Electronics budou mít zaměstnanci příležitost diskutovat o svých úspěchu a problémech na pracovišti (1). Hodnocení poskytne pozitivní a konstruktivní zpětnou vazbu, která zaměstnancům pomůže rozvíjet a rozvíjet se v jejich rolích (1). Zaměstnanec obdrží písemné shrnutí hodnocení výkonu, které bude zahrnovat hodnocení jejich výkonu, zpětné vazby a cílů pro nadcházející rok (1). Přezkum výkonnosti je obousměrný dialog mezi manažery a zaměstnanci (1).

    Bez sémantického rankera: Během kontroly výkonnosti ve společnosti Contoso Electronics mají zaměstnanci příležitost diskutovat o svých úspěchu a problémech na pracovišti. Pozitivní a konstruktivní zpětná vazba je poskytována, aby zaměstnancům pomohla vyvíjet a rozšiřovat své role. Zapisovaný souhrn kontroly výkonnosti, včetně hodnocení výkonu, zpětné vazby a cílů pro nadcházející rok. Přezkum je obousměrný dialog mezi manažery a zaměstnanci (1).

Vyčištění prostředků

Vyčištění prostředků Azure

Prostředky Azure vytvořené v tomto článku se fakturují k vašemu předplatnému Azure. Pokud v budoucnu tyto prostředky nepotřebujete, odstraňte je, abyste se vyhnuli účtování dalších poplatků.

Spuštěním následujícího příkazu Azure Developer CLI odstraňte prostředky Azure a odeberte zdrojový kód:

azd down --purge --force

Přepínače poskytují:

  • purge: Odstraněné prostředky se okamžitě vymažou. To vám umožní opakovaně používat čip TPM Azure OpenAI.
  • force: Odstranění probíhá silientálně bez nutnosti souhlasu uživatele.

Vyčištění služby GitHub Codespaces

Odstraněním prostředí GitHub Codespaces zajistíte, že můžete maximalizovat nárok na počet bezplatných hodin za jádro, které získáte pro svůj účet.

Důležité

Další informace o oprávněních účtu GitHub najdete v tématu GitHub Codespaces měsíčně zahrnuté hodiny úložiště a jádra.

  1. Přihlaste se k řídicímu panelu GitHub Codespaces (https://github.com/codespaces).

  2. Vyhledejte aktuálně spuštěné Codespaces zdrojové z Azure-Samples/azure-search-openai-demo úložiště GitHub.

    Snímek obrazovky se všemi spuštěnými codespaces včetně jejich stavu a šablon

  3. Otevřete místní nabídku pro codespace a pak vyberte Odstranit.

    Snímek obrazovky s místní nabídkou pro jeden prostor kódu se zvýrazněnou možností odstranit

Získání pomoci

Toto ukázkové úložiště nabízí informace o řešení potíží.

Pokud se váš problém nevyřeší, zapište problém do problémů úložiště.

Další kroky