Začínáme s ukázkou podnikového chatu v Pythonu s využitím RAG

Článek
04/06/2024

V tomto článku se dozvíte, jak nasadit a spustit ukázku podnikové chatovací aplikace pro Python. Tato ukázka implementuje chatovací aplikaci pomocí Pythonu, služby Azure OpenAI a načítání rozšířené generace (RAG) ve službě Azure AI Search, aby získala odpovědi na výhody zaměstnanců ve fiktivní společnosti. Aplikace je oseděna soubory PDF, včetně příručky pro zaměstnance, dokumentu o výhodách a seznamu rolí a očekávání společnosti.

Ukázkové video

Začít hned

Postupujte podle pokynů v tomto článku:

Nasazení chatovací aplikace do Azure
Získejte odpovědi na výhody zaměstnanců.
Změňte nastavení a změňte chování odpovědí.

Po dokončení tohoto postupu můžete začít upravovat nový projekt pomocí vlastního kódu.

Tento článek je součástí kolekce článků, ve kterých se dozvíte, jak vytvořit chatovací aplikaci pomocí služby Azure OpenAI a azure AI Search.

Mezi další články v kolekci patří:

Přehled architektury

Jednoduchá architektura chatovací aplikace je znázorněná v následujícím diagramu:

Diagram znázorňující architekturu z klienta do back-endové aplikace

Mezi klíčové součásti architektury patří:

Webová aplikace pro hostování interaktivního chatu
Prostředek Azure AI Search, který vám umožní získat odpovědi z vašich vlastních dat.
Služba Azure OpenAI, která poskytuje:
- Klíčová slova pro vylepšení hledání nad vlastními daty
- Odpovědi od modelu OpenAI.
- Vkládání z modelu ada

Náklady

Většina prostředků v této architektuře používá cenovou úroveň Basic nebo Consumption. Ceny spotřeby jsou založené na využití, což znamená, že platíte jenom za to, co používáte. K dokončení tohoto článku bude účtován poplatek, ale bude minimální. Až budete s článkem hotovi, můžete prostředky odstranit, abyste přestali účtovat poplatky.

Přečtěte si další informace o nákladech v ukázkovém úložišti.

Požadavky

Vývojové prostředí kontejneru je k dispozici se všemi závislostmi potřebnými k dokončení tohoto článku. Vývojový kontejner můžete spustit v GitHub Codespaces (v prohlížeči) nebo místně pomocí editoru Visual Studio Code.

Pokud chcete použít tento článek, potřebujete následující požadavky:

Codespaces (doporučeno)
Visual Studio Code

Předplatné Azure – Vytvoření předplatného zdarma
Oprávnění účtu Azure – Váš účet Azure musí mít oprávnění Microsoft.Authorization/roleAssignments/write, jako je uživatelský přístup Správa istrator nebo vlastník.
Přístup k Azure OpenAI je udělován v požadovaném předplatném Azure. V současné době je přístup k této službě udělován pouze aplikací. Pokud chcete získat přístup k Azure OpenAI, vyplňte formulář na adrese https://aka.ms/oai/access. Pokud máte problém, otevřete problém v tomto úložišti a kontaktujte nás.
Účet GitHub

Otevřené vývojové prostředí

Začněte teď s vývojovým prostředím, které má nainstalované všechny závislosti k dokončení tohoto článku.

Codespaces GitHubu (doporučeno)
Visual Studio Code

GitHub Codespaces spouští vývojový kontejner spravovaný GitHubem pomocí editoru Visual Studio Code pro web jako uživatelského rozhraní. Pro nejjednodušší vývojové prostředí použijte GitHub Codespaces, abyste měli předinstalované správné vývojářské nástroje a závislosti k dokončení tohoto článku.

Důležité

Všechny účty GitHubu můžou každý měsíc používat Codespaces až 60 hodin zdarma se 2 jádrovými instancemi. Další informace najdete v tématu GitHub Codespaces měsíčně zahrnuté úložiště a hodiny jádra.

Spusťte proces vytvoření nového prostředí GitHub Codespace ve main větvi Azure-Samples/azure-search-openai-demo úložiště GitHub.
Klikněte pravým tlačítkem myši na následující tlačítko a vyberte Otevřít odkaz v nových oknech , abyste měli k dispozici vývojové prostředí i dokumentaci najednou.

Otevření tohoto projektu v GitHub Codespaces
Na stránce Vytvořit kódspace zkontrolujte nastavení konfigurace codespace a pak vyberte Vytvořit nový prostor kódu.
Počkejte, až se prostor kódu spustí. Tento proces spuštění může trvat několik minut.
V terminálu v dolní části obrazovky se přihlaste k Azure pomocí Azure Developer CLI.
```
azd auth login
```
Zkopírujte kód z terminálu a vložte ho do prohlížeče. Postupujte podle pokynů k ověření pomocí účtu Azure.
Zbývající úlohy v tomto článku probíhají v kontextu tohoto vývojového kontejneru.

Rozšíření Dev Containers pro Visual Studio Code vyžaduje instalaci Dockeru na místním počítači. Rozšíření hostuje vývojový kontejner místně pomocí hostitele Dockeru se správnými vývojářskými nástroji a závislostmi předinstalovanými k dokončení tohoto článku.

Otevřete Visual Studio Code v kontextu prázdného adresáře.
Ujistěte se, že máte nainstalované rozšíření Dev Containers v editoru Visual Studio Code.
V editoru otevřete nový terminál.

Tip

Pomocí hlavní nabídky můžete přejít na možnost nabídky Terminál a pak vybrat možnost Nový terminál .
Přihlaste se k Azure pomocí Azure Developer CLI.
```
azd auth login
```
Po zobrazení výzvy zkopírujte kód z terminálu a vložte ho do prohlížeče. Postupujte podle pokynů k ověření pomocí účtu Azure.
Vytvořte složku a inicializujte ji pro použití ukázkového projektu pomocí Azure Developer CLI:
```
azd init -t azure-search-openai-demo
```
Toto úložiště nemusíte klonovat.
Otevřete paletu příkazů, vyhledejte příkazy Dev Containers a pak vyberte Dev Containers: Znovu otevřít v kontejneru.

Tip

Visual Studio Code vás může automaticky vyzvat k opětovnému otevření existující složky v rámci vývojového kontejneru. Toto je funkčně ekvivalentní použití palety příkazů k opětovnému otevření aktuálního pracovního prostoru v kontejneru.
Znovu otevřete okno terminálu (Ctrl + `) a nechte ho otevřené.
Zbývající cvičení v tomto projektu probíhají v kontextu tohoto vývojového kontejneru.

Nasazení a spuštění

Ukázkové úložiště obsahuje všechny soubory kódu a konfigurace, které potřebujete k nasazení chatovací aplikace do Azure. Následující kroky vás provedou procesem nasazení ukázky do Azure.

Nasazení chatovací aplikace do Azure

Důležité

Prostředky Azure vytvořené v této části účtují okamžité náklady, především z prostředku Azure AI Search. Tyto prostředky můžou nabíhání nákladů i v případě, že příkaz přerušíte před jeho úplným spuštěním.

Spuštěním následujícího příkazu Azure Developer CLI zřiďte prostředky Azure a nasaďte zdrojový kód:
```
azd up
```
Když se zobrazí výzva k zadání názvu prostředí, ponechte ho krátkým a malými písmeny. Například myenv. Používá se jako součást názvu skupiny prostředků.
Po zobrazení výzvy vyberte předplatné, ve které chcete prostředky vytvořit.
Když se zobrazí výzva k prvnímu výběru umístění, vyberte umístění blízko vás. Toto umístění se používá pro většinu prostředků včetně hostování.
Pokud se zobrazí výzva k zadání umístění modelu OpenAI nebo prostředku Document Intelligence, vyberte umístění, které je k vám nejblíže. Pokud je stejné umístění dostupné jako vaše první umístění, vyberte ho.
Počkejte, až se aplikace nasadí. Dokončení nasazení může trvat 5 až 10 minut.
Po úspěšném nasazení aplikace se v terminálu zobrazí adresa URL.
Výběrem této adresy URL otevřete (✓) Done: Deploying service webapp chatovací aplikaci v prohlížeči.

Získání odpovědí ze souborů PDF pomocí chatovací aplikace

Chatovací aplikace se předem načte s informacemi o výhodách zaměstnanců ze souborů PDF. Chatovací aplikaci můžete použít k kladení otázek ohledně výhod. Následující kroky vás provedou procesem používání chatovací aplikace.

V prohlížeči vyberte nebo zadejte , co se stane v revizi výkonu? v textovém poli chatu.
V odpovědi vyberte citaci.

V pravém podokně použijte karty, abyste pochopili, jak se odpověď vygenerovala.

Tab	Popis
Myšlenkový proces	Toto je skript interakcí v chatu. Můžete zobrazit výzvu systému (`content`) a otázku uživatele (`content`).
Podpůrný obsah	To zahrnuje informace pro zodpovězení vaší otázky a zdrojového materiálu. Počet zdrojových citací je uveden v nastavení pro vývojáře. Výchozí hodnota je 3.
Citace	Zobrazí se původní stránka, která obsahuje citaci.

Až budete hotovi, znovu vyberte vybranou kartu a podokno zavřete.

Změna chování odpovědí pomocí nastavení chatovací aplikace

Inteligenci chatu určuje model OpenAI a nastavení, která se používají k interakci s modelem.

Snímek obrazovky s nastavením vývojáře chatu

Nastavení	Popis
Přepsání šablony výzvy	Toto je výzva, která slouží k vygenerování odpovědi.
Teplota	Teplota používaná pro konečné volání rozhraní API pro dokončování chatu, číslo mezi 0 a 1, které řídí "kreativitu" modelu.
Minimální skóre hledání	Minimální skóre výsledků hledání, které se používají k vygenerování odpovědi. Rozsah závisí na použitém režimu vyhledávání.
Minimální skóre rerankeru	Minimální skóre z sémantického rankeru výsledků hledání, které se používají k vygenerování odpovědi. Pohybuje se od 0 do 4.
Načtení tohoto počtu výsledků hledání	Toto je počet výsledků hledání, které se používají k vygenerování odpovědi. Tyto zdroje vrácené v myšlenkovém procesu a podpůrných kartách obsahu citace můžete vidět.
Vyloučit kategorii	Toto je kategorie dokumentů, které jsou vyloučené z výsledků hledání.
Použití sémantického rankeru pro načtení	Toto je funkce služby Azure AI Search , která využívá strojové učení ke zlepšení relevance výsledků hledání.
Použití kontextových souhrnů dotazu místo celých dokumentů	Při kontrole `Use semantic rankerUse query-contextual summaries` používá LLM popis extrahované z klíčových pasáží místo všech pasáží v nejřadivějších dokumentech.
Návrhy následných otázek	Požádejte chatovací aplikaci, aby na základě odpovědi navrhla následné otázky.
Režim načítání	Vektory + Text znamenají, že výsledky hledání jsou založeny na textu dokumentů a vkládání dokumentů. Vektory znamenají, že výsledky hledání jsou založené na vkládání dokumentů. Text znamená, že výsledky hledání jsou založené na textu dokumentů.
Odpovědi na dokončování chatu streamu	Odpověď streamu místo čekání na dokončení odpovědi.

Následující kroky vás provedou procesem změny nastavení.

V prohlížeči vyberte kartu Vývojář Nastavení.

Zaškrtněte políčko Navrhnout následné otázky a znovu položte stejnou otázku.

What happens in a performance review?

V chatu se vrátily navrhované následné otázky, například následující:

1. What is the frequency of performance reviews?
2. How can employees prepare for a performance review?
3. Can employees dispute the feedback received during the performance review?

Na kartě Nastavení zrušte výběr příkazu Použít sémantický ranker pro načtení.
Položte stejnou otázku znovu?
```
What happens in a performance review?
```
Jaký je rozdíl v odpovědích?

Se sémantickou rankerkou: Během kontroly výkonnosti ve společnosti Contoso Electronics budou mít zaměstnanci příležitost diskutovat o svých úspěchu a problémech na pracovišti (1). Hodnocení poskytne pozitivní a konstruktivní zpětnou vazbu, která zaměstnancům pomůže rozvíjet a rozvíjet se v jejich rolích (1). Zaměstnanec obdrží písemné shrnutí hodnocení výkonu, které bude zahrnovat hodnocení jejich výkonu, zpětné vazby a cílů pro nadcházející rok (1). Přezkum výkonnosti je obousměrný dialog mezi manažery a zaměstnanci (1).

Bez sémantického rankera: Během kontroly výkonnosti ve společnosti Contoso Electronics mají zaměstnanci příležitost diskutovat o svých úspěchu a problémech na pracovišti. Pozitivní a konstruktivní zpětná vazba je poskytována, aby zaměstnancům pomohla vyvíjet a rozšiřovat své role. Zapisovaný souhrn kontroly výkonnosti, včetně hodnocení výkonu, zpětné vazby a cílů pro nadcházející rok. Přezkum je obousměrný dialog mezi manažery a zaměstnanci (1).

Vyčištění prostředků

Vyčištění prostředků Azure

Prostředky Azure vytvořené v tomto článku se fakturují k vašemu předplatnému Azure. Pokud v budoucnu tyto prostředky nepotřebujete, odstraňte je, abyste se vyhnuli účtování dalších poplatků.

Spuštěním následujícího příkazu Azure Developer CLI odstraňte prostředky Azure a odeberte zdrojový kód:

azd down --purge --force

Přepínače poskytují:

purge: Odstraněné prostředky se okamžitě vymažou. To vám umožní opakovaně používat čip TPM Azure OpenAI.
force: Odstranění probíhá silientálně bez nutnosti souhlasu uživatele.

Odstraněním prostředí GitHub Codespaces zajistíte, že můžete maximalizovat nárok na počet bezplatných hodin za jádro, které získáte pro svůj účet.

Důležité

Další informace o oprávněních účtu GitHub najdete v tématu GitHub Codespaces měsíčně zahrnuté hodiny úložiště a jádra.

Přihlaste se k řídicímu panelu GitHub Codespaces (https://github.com/codespaces).
Vyhledejte aktuálně spuštěné Codespaces zdrojové z Azure-Samples/azure-search-openai-demo úložiště GitHub.
Otevřete místní nabídku pro codespace a pak vyberte Odstranit.

Získání pomoci

Toto ukázkové úložiště nabízí informace o řešení potíží.

Pokud se váš problém nevyřeší, zapište problém do problémů úložiště.

Začínáme s ukázkou podnikového chatu v Pythonu s využitím RAG

Přehled architektury

Náklady

Požadavky

Otevřené vývojové prostředí

Nasazení a spuštění

Nasazení chatovací aplikace do Azure

Získání odpovědí ze souborů PDF pomocí chatovací aplikace

Změna chování odpovědí pomocí nastavení chatovací aplikace

Vyčištění prostředků

Vyčištění prostředků Azure

Vyčištění služby GitHub Codespaces

Získání pomoci

Další kroky

Váš názor

Váš názor

Další materiály