Azure OpenAI az adatokon

Cikk
10/31/2024

Ebből a cikkből megismerheti az Azure OpenAI On Your Data szolgáltatását, amely megkönnyíti a fejlesztők számára a vállalati adatok összekapcsolását, betöltését és őrzését a személyre szabott copilotok (előzetes verzió) gyors létrehozása érdekében. Javítja a felhasználók megértését, felgyorsítja a feladatok elvégzését, javítja a működési hatékonyságot, és segíti a döntéshozatalt.

Mi az Azure OpenAI az Ön adatain?

Az Azure OpenAI On Your Data lehetővé teszi fejlett AI-modellek, például a GPT-35-Turbo és a GPT-4 futtatását saját vállalati adatain anélkül, hogy be kellene tanítania vagy finomhangolnia kellene a modelleket. Cseveghet a tetején, és nagyobb pontossággal elemezheti az adatokat. A kijelölt adatforrásokban elérhető legfrissebb információk alapján megadhatja, hogy mely források támogatják a válaszokat. Az Azure OpenAI On Your Data egy REST API-val érhető el az SDK-n vagy az Azure OpenAI Studio webes felületén keresztül. Létrehozhat egy olyan webalkalmazást is, amely az adatokhoz csatlakozva lehetővé teszi a továbbfejlesztett csevegési megoldást, vagy közvetlenül a Copilot Studióban (előzetes verzió) copilotként is üzembe helyezheti.

Fejlesztés az Azure OpenAI-val az adatokon

Példa munkafolyamatot bemutató diagram.

Az Azure OpenAI On Your Data szolgáltatással használt fejlesztési folyamat általában a következő:

Betöltés: Fájlok feltöltése az Azure OpenAI Studióval vagy a betöltési API-val. Így az adatok feltörhetők, daraboltak és beágyazhatók egy Azure AI Search-példányba, amelyet az Azure Open AI-modellek használhatnak. Ha már rendelkezik támogatott adatforrással, közvetlenül is csatlakoztathatja.
Fejlesztés: Az Azure OpenAI On Your Data kipróbálása után kezdje el fejleszteni az alkalmazást az elérhető REST API-k és SDK-k használatával, amelyek több nyelven is elérhetők. A rendszer kéréseket és keresési szándékokat hoz létre az Azure OpenAI szolgáltatásnak való továbbításhoz.
Következtetés: Miután az alkalmazás üzembe lett helyezve az előnyben részesített környezetben, a rendszer kéri az Azure OpenAI-t, amely több lépést is végrehajt a válasz visszaadása előtt:
1. Szándékgenerálás: A szolgáltatás határozza meg a felhasználó kérésének szándékát a megfelelő válasz meghatározásához.
2. Lekérés: A szolgáltatás lekérdezéssel lekéri a csatlakoztatott adatforrásból az elérhető adatok releváns darabjait. Például szemantikai vagy vektoros kereséssel. A rendszer olyan paramétereket használ, mint a szigorúság és az újrapróbálkozáshoz szükséges dokumentumok száma, amelyek befolyásolják a lekérést.
3. Szűrés és reranking: A lekérési lépés keresési eredményei javulnak az adatok rangsorolásával és szűrésével a relevancia pontosítása érdekében.
4. Válaszgenerálás: Az eredményül kapott adatokat a rendszer más információkkal együtt elküldi, például a rendszerüzenetet a nagy nyelvi modellnek (LLM), és a rendszer visszaküldi a választ az alkalmazásnak.

Első lépésként csatlakoztassa az adatforrást az Azure OpenAI Studióval, és kezdjen el kérdéseket feltenni, és csevegni az adataival.

Azure Szerepköralapú hozzáférés-vezérlés (Azure RBAC) adatforrások hozzáadásához

Az Azure OpenAI teljes körű használatához be kell állítania egy vagy több Azure RBAC-szerepkört. További információkért tekintse meg az Azure OpenAI biztonságos használata az adatokon című témakört.

Adatformátumok és fájltípusok

Az Azure OpenAI On Your Data a következő fájltípusokat támogatja:

.txt
.md
.html
.docx
.pptx
.pdf

Van egy feltöltési korlát, és van néhány kikötés a dokumentumszerkezettel kapcsolatban, és hogy ez hogyan befolyásolhatja a modell válaszainak minőségét:

Ha nem támogatott formátumból konvertál adatokat támogatott formátumba, optimalizálja a modell válaszának minőségét az átalakítás biztosításával:
- Nem vezet jelentős adatvesztéshez.
- Nem ad váratlan zajt az adatokhoz.
Ha a fájlok speciális formázással, például táblákkal és oszlopokkal vagy listajelekkel rendelkeznek, készítse elő az adatokat a GitHubon elérhető adat-előkészítési szkripttel.
A hosszú szöveggel rendelkező dokumentumok és adathalmazok esetében a rendelkezésre álló adat-előkészítési szkriptet kell használnia. A szkript adattömböket hoz létre annak érdekében, hogy a modell válaszai pontosabbak legyenek. Ez a szkript a beolvasott PDF-fájlokat és képeket is támogatja.

Támogatott adatforrások

Az adatok feltöltéséhez csatlakoznia kell egy adatforráshoz. Ha egy Azure OpenAI-modellel szeretne csevegni az adataival, az adatok egy keresési indexbe kerülnek, hogy a releváns adatok a felhasználói lekérdezések alapján is megtalálhatók legyenek.

A virtuális magalapú Azure Cosmos DB for MongoDB integrált vektoradatbázisa natív módon támogatja az Azure OpenAI On Your Data integrációját.

Egyes adatforrások, például fájlok feltöltése a helyi gépről (előzetes verzió) vagy egy blobtároló-fiókban (előzetes verzió) tárolt adatok esetében az Azure AI Search lesz használatban. Az alábbi adatforrások kiválasztásakor az adatok egy Azure AI Search-indexbe kerülnek.

Az Azure AI Search szolgáltatással betöltött adatok	Leírás
Azure AI Search	Használjon egy meglévő Azure AI Search-indexet az Azure OpenAI-val az Adatain.
Fájlok feltöltése (előzetes verzió)	Töltsön fel fájlokat a helyi gépről, hogy egy Azure Blob Storage-adatbázisban tárolja, és betöltse az Azure AI Searchbe.
URL-cím/webcím (előzetes verzió)	Az URL-címekről származó webes tartalmakat az Azure Blob Storage tárolja.
Azure Blob Storage (előzetes verzió)	Töltsön fel fájlokat az Azure Blob Storage-ból, hogy betöltse őket egy Azure AI Search-indexbe.

Érdemes megfontolnia egy Azure AI Search-index használatát, ha a következőkre van szüksége:

Az indexlétrehozás folyamatának testreszabása.
Használja újra a korábban létrehozott indexet más adatforrásokból származó adatok betöltésével.

Feljegyzés

Meglévő index használatához legalább egy kereshető mezővel kell rendelkeznie.
A CORS-forrástípus engedélyezése beállítást állítsa be, all az Engedélyezett forrástípus beállítást pedig a következőre*.

Keresési típusok

Az Azure OpenAI On Your Data az alábbi keresési típusokat biztosítja, amelyek az adatforrás hozzáadásakor használhatók.

Kulcsszókeresés
Szemantikai keresés
Vektorkeresés az Ada beágyazási modelljeivel, amelyek a kijelölt régiókban érhetők el

A vektorkeresés engedélyezéséhez egy meglévő beágyazási modellre van szükség az Azure OpenAI-erőforrásban. Válassza ki a beágyazási üzembe helyezést az adatok csatlakoztatásakor, majd válasszon egy vektorkeresési típust az Adatkezelés területen. Ha az Azure AI Searcht használja adatforrásként, győződjön meg arról, hogy van vektoroszlop az indexben.

Ha saját indexet használ, testre szabhatja a mezőleképezést , amikor hozzáadja az adatforrást a kérdések megválaszolásakor leképezett mezők meghatározásához. A mezőleképezés testreszabásához válassza az Adatforrás lapon az Egyéni mezőleképezés használata lehetőséget az adatforrás hozzáadásakor.

Fontos

A szemantikai keresésre további díjszabás vonatkozik. A szemantikai keresés vagy vektorkeresés engedélyezéséhez alapszintű vagy magasabb termékváltozatot kell választania. További információkért tekintse meg a tarifacsomagok különbségeit és a szolgáltatási korlátokat .
Az információlekérés és a modellválasz minőségének javítása érdekében javasoljuk, hogy engedélyezze a szemantikai keresést a következő adatforrásnyelvek esetében: angol, francia, spanyol, portugál, olasz, német, kínai (Zh), japán, koreai, orosz és arab.

Keresés lehetőség	Lekérés típusa	További díjszabás?	Juttatások
kulcsszó	Kulcsszavas keresés	Nincs további díjszabás.	Gyors és rugalmas lekérdezési elemzést és egyeztetést végez kereshető mezőkön keresztül, bármilyen támogatott nyelven, operátorokkal vagy anélkül.
szemantikai	Szemantikai keresés	A szemantikai keresések használatának további díjszabása.	A keresési eredmények pontosságának és relevanciájának javítása rerankerrel (AI-modellekkel) a kezdeti keresési rangsoroló által visszaadott lekérdezési kifejezések és dokumentumok szemantikai jelentésének megértéséhez
vektor	Vektoros keresés	Az Azure OpenAI-fiók további díjszabása a beágyazási modell meghívásától.	Lehetővé teszi az adott lekérdezési bemenethez hasonló dokumentumok megkeresését a tartalom vektoros beágyazása alapján.
hibrid (vektor + kulcsszó)	A vektorkeresés és a kulcsszókeresés hibridje	Az Azure OpenAI-fiók további díjszabása a beágyazási modell meghívásától.	Vektoros beágyazások használatával hajtja végre a hasonlóságkeresést a vektormezők között, ugyanakkor támogatja a rugalmas lekérdezési elemzést és a teljes szöveges keresést alfanumerikus mezőkön kifejezéses lekérdezések használatával.
hibrid (vektor + kulcsszó) + szemantika	A vektorkeresés, szemantikai keresés és kulcsszókeresés hibridje.	Az Azure OpenAI-fiók további díjszabása a beágyazási modell meghívásától, valamint a szemantikus keresési használat további díjszabásától.	Vektoros beágyazásokkal, nyelvfelismeréssel és rugalmas lekérdezés-elemzéssel gazdag keresési szolgáltatásokat és összetett és változatos információlekérési forgatókönyveket kezelő generatív AI-alkalmazásokat hozhat létre.

Intelligens keresés

Az Azure OpenAI On Your Data intelligens kereséssel rendelkezik az adataihoz. A szemantikai keresés alapértelmezés szerint engedélyezve van, ha szemantikai és kulcsszókereséssel is rendelkezik. Ha rendelkezik beágyazási modellekkel, az intelligens keresés alapértelmezés szerint hibrid és szemantikai keresésre használható.

Dokumentumszintű hozzáférés-vezérlés

Feljegyzés

A dokumentumszintű hozzáférés-vezérlés akkor támogatott, ha adatforrásként az Azure AI Searcht választja.

Az Azure OpenAI On Your Data segítségével korlátozhatja a különböző felhasználók válaszaiban használható dokumentumokat az Azure AI Search biztonsági szűrőivel. A dokumentumszintű hozzáférés engedélyezésekor az Azure AI Search által visszaadott és a válasz létrehozásához használt keresési eredmények a Microsoft Entra-csoporttagság alapján lesznek levágva. A dokumentumszintű hozzáférést csak a meglévő Azure AI Search-indexeken engedélyezheti. További információkért lásd : Az Azure OpenAI használata az adatokon biztonságosan .

Indexmező-leképezés

Ha saját indexet használ, az Azure OpenAI Studióban meg kell határoznia, hogy mely mezőket szeretné megfeleltetni az adatforrás hozzáadásakor felmerülő kérdések megválaszolásához. A tartalomadatokhoz több mezőt is megadhat, és minden olyan mezőt tartalmaznia kell, amely a használati esethez kapcsolódó szövegekkel rendelkezik.

Ebben a példában a Tartalomadatok és a Cím mezői információkat adnak a modellnek a kérdések megválaszolásához. A cím az idézet szövegének címére is használható. A Fájlnévre leképezett mező létrehozza az idézetek nevét a válaszban.

Ezeknek a mezőknek a helyes leképezése segít biztosítani a modell jobb válasz- és idézetminőségét. Emellett konfigurálhatja az API-ban a fieldsMapping paraméterrel.

Ha további értékalapú feltételeket szeretne implementálni a lekérdezések végrehajtásához, beállíthat egy keresési szűrőt a filter REST API paraméterével.

Adatok betöltése az Azure AI-keresésbe

2024 szeptemberétől a betöltési API-k integrált vektorizálásra váltottak. Ez a frissítés nem módosítja a meglévő API-szerződéseket. Az Azure AI Search új ajánlata, az integrált vektorizáció előre összeállított készségeket használ a bemeneti adatok adattömbökbe való beágyazásához és beágyazásához. Az Azure OpenAI On Your Data ingestion szolgáltatás már nem alkalmaz egyéni készségeket. Az integrált vektorizálásra való migrálást követően a betöltési folyamat néhány módosításon ment keresztül, ezért csak a következő eszközök jönnek létre:

{job-id}-index
{job-id}-indexer, ha óránkénti vagy napi ütemezés van megadva, ellenkező esetben az indexelő a betöltési folyamat végén törlődik.
{job-id}-datasource

Az adattömbtároló már nem érhető el, mivel ezt a funkciót mostantól az Azure AI Search felügyeli.

Adatkapcsolat

Meg kell adnia, hogyan szeretné hitelesíteni a kapcsolatot az Azure OpenAI, az Azure AI Search és az Azure Blob Storage használatával. Választhat rendszer által hozzárendelt felügyelt identitást vagy API-kulcsot. Ha az API-kulcsot választja hitelesítési típusként, a rendszer automatikusan feltölti az API-kulcsot, hogy csatlakozzon az Azure AI Search, az Azure OpenAI és az Azure Blob Storage-erőforrásokhoz. A rendszer által hozzárendelt felügyelt identitás kiválasztásával a hitelesítés a szerepkör-hozzárendelésen alapul. A rendszer által hozzárendelt felügyelt identitás alapértelmezés szerint ki van választva a biztonság szempontjából.

Miután kiválasztotta a következő gombot, a rendszer automatikusan ellenőrzi a beállítást a kiválasztott hitelesítési módszer használatához. Ha hibát tapasztal, tekintse meg a szerepkör-hozzárendelésekről szóló cikket a beállítás frissítéséhez.

A beállítás kijavítása után a következő gombra kattintva érvényesítheti és folytathatja a műveletet. Az API-felhasználók a hitelesítést hozzárendelt felügyelt identitással és API-kulcsokkal is konfigurálhatják.

Érdemes lehet az Azure Blob Storage-t adatforrásként használni, ha meglévő Azure Blob Storage-hoz szeretne csatlakozni, és a tárolókban tárolt fájlokat szeretné használni.

Automatikus indexfrissítések ütemezése

Feljegyzés

Az automatikus indexfrissítés csak az Azure Blob Storage esetében támogatott.

Ha naprakészen szeretné tartani az Azure AI Search-indexet a legújabb adatokkal, ütemezhet automatikus indexfrissítést ahelyett, hogy minden alkalommal manuálisan frissítené az adatokat. Az automatikus indexfrissítés csak akkor érhető el, ha az Azure Blob Storage-t választja adatforrásként. Automatikus indexfrissítés engedélyezése:

Adatforrás hozzáadása az Azure OpenAI Studióval.
Az Adatforrás kiválasztása vagy hozzáadása csoportban válassza az Indexelő ütemezése lehetőséget, és válassza ki az alkalmazni kívánt frissítési gyakoriságot.

Miután az adatbetöltés nem egyszeri ütemre van állítva, az Azure AI Search indexelői az ütemezésnek 0.5 * the cadence specifiedmegfelelő ütemezéssel jönnek létre. Ez azt jelenti, hogy a megadott ütemben az indexelők lekérik, újra feldolgozzák és indexelik a tárolóból hozzáadott vagy módosított dokumentumokat. Ez a folyamat biztosítja, hogy a frissített adatok automatikusan előfeldolgozásra és indexelésre kerülnek a végső indexben a kívánt ütemben. Az adatok frissítéséhez csak a további dokumentumokat kell feltöltenie az Azure Portalról. A portálon válassza a Tárfióktárolók>lehetőséget. Válassza ki az eredeti tároló nevét, majd töltse fel. Az index automatikusan felveszi a fájlokat az ütemezett frissítési időszak után. Az Azure AI Search-erőforrásban létrehozott köztes objektumok nem lesznek megtisztítva a betöltés után a későbbi futtatások engedélyezéséhez. Ezek az eszközök a következők:

{Index Name}-index
{Index Name}-indexer
{Index Name}-datasource
{Index Name}-skillset

Az ütemezés módosításához használhatja az Azure Portalt.

A keresési erőforrás lapjának megnyitása az Azure Portalon
Indexelők kiválasztása a bal oldali panelen
Hajtsa végre az alábbi lépéseket azon a két indexelőn, amelyek előtagként az index nevét viselik.
1. Nyissa meg az indexelőt. Ezután válassza a Beállítások lapot.
2. Frissítse az ütemezést a kívánt ütemre az "Ütemezés" beállításból, vagy adjon meg egy egyéni ütemezést az "Intervallum (perc)" értékről.
3. Válassza a Mentés lehetőséget.

Adatok betöltése az Azure AI-keresésbe

{job-id}-index
{job-id}-indexer, ha óránkénti vagy napi ütemezés van megadva, ellenkező esetben az indexelő a betöltési folyamat végén törlődik.
{job-id}-datasource

Az adattömbtároló már nem érhető el, mivel ezt a funkciót mostantól az Azure AI Search felügyeli.

Adatkapcsolat

Az Azure OpenAI Studio használatával fájlokat tölthet fel a gépéről az Azure OpenAI On Your Data kipróbálásához. Lehetősége van új Azure Blob Storage-fiók és Azure AI Search-erőforrás létrehozására is. A szolgáltatás ezután egy Azure Storage-tárolóba tárolja a fájlokat, és betölti a tárolóból. A rövid útmutatóból megtudhatja, hogyan használhatja ezt az adatforrás-beállítást.

Adatok betöltése az Azure AI-keresésbe

{job-id}-index
{job-id}-indexer, ha óránkénti vagy napi ütemezés van megadva, ellenkező esetben az indexelő a betöltési folyamat végén törlődik.
{job-id}-datasource

Az adattömbtároló már nem érhető el, mivel ezt a funkciót mostantól az Azure AI Search felügyeli.

Adatkapcsolat

Beillesztheti az URL-címeket, és a szolgáltatás tárolja a weblap tartalmát a modellből érkező válaszok létrehozásakor. A használt URL-címek/webcímek tartalmainak a következő jellemzőkkel kell rendelkezniük ahhoz, hogy megfelelően betöltse őket:

Nyilvános webhely, például az adatok használata az Azure OpenAI szolgáltatással – Azure OpenAI | Microsoft Learn. Nem vehet fel URL-címet/webcímet hozzáférés-vezérléssel, például jelszóval.
HTTPS-webhely.
Az egyes URL-címek tartalma kisebb, mint 5 MB.
A webhely a támogatott fájltípusok egyikeként tölthető le.
A beágyazott hivatkozásoknak csak egy rétege támogatott. A rendszer csak legfeljebb 20 hivatkozást fog beolvasni a weblapon.

Miután hozzáadta az URL-címet/webcímet az adatbetöltéshez, a rendszer lekéri és menti az URL-címből származó weblapokat az Azure Blob Storage-ba egy tárolónévvel: webpage-<index name>. A rendszer minden URL-címet egy másik tárolóba ment a fiókon belül. Ezután a rendszer indexeli a fájlokat egy Azure AI Search-indexbe, amely lekérésre szolgál, amikor a modellel cseveg.

Adatok betöltése az Azure AI-keresésbe

{job-id}-index
{job-id}-indexer, ha óránkénti vagy napi ütemezés van megadva, ellenkező esetben az indexelő a betöltési folyamat végén törlődik.
{job-id}-datasource

Az adattömbtároló már nem érhető el, mivel ezt a funkciót mostantól az Azure AI Search felügyeli.

Adatkapcsolat

Csatlakozhat az Elasticsearch vektoradatbázisához , és cseveghet az adataival.

Előfeltételek

Elasticsearch-adatbázis
Beágyazási modell. Képes vagy:
- Meglévő Azure OpenAI-beágyazási text-embedding-ada-002 modell használata, vagy
- Saját beágyazási modellt hozhat létre az Elasticsearchen.
Készítse elő az adatokat a GitHubon elérhető Python-jegyzetfüzet használatával.

Hozzáférés kérése

Az Elasticsearch adatforrás használata egy előzetes verziójú funkció, amelyre az Azure AI-szolgáltatások szolgáltatásspecifikus feltételei vonatkoznak. Ki kell töltenie és be kell küldenie egy kéreleműrlapot , hogy hozzáférést kérjen az Elasticsearch adatforráshoz. Az űrlap információt kér a vállalatról és arról a forgatókönyvről, amelyhez az Elasticsearch adatforrást használni kívánja. Az űrlap elküldése után az Azure AI-szolgáltatások csapata 10 munkanapon belül áttekinti és e-mailben elküldi a döntést.

Az Elasticsearch csatlakoztatása az Azure OpenAI-hoz az adatokon

Állítsa be az Elasticsearch-et, és kérje le a kapcsolati adatokat.

Az Elasticsearch-adatbázishoz való csatlakozáshoz meg kell adnia az Elasticsearch-végpontot és a kódolt API-kulcsot. Ezután kattintson a kapcsolat ellenőrzésére.
Jelölje ki azt az indexet, amelyhez csatlakozni szeretne.
(nem kötelező) egyéni mezőleképezést használjon.

Az adatforrás hozzáadásakor testre szabhatja a mezőleképezést , és meghatározhatja a kérdések megválaszolásakor leképezett mezőket, vagy használhatja az alapértelmezett értékeket.
Válassza ki a keresési típust. Az Azure OpenAI On Your Data az alábbi keresési típusokat biztosítja, amelyek az adatforrás hozzáadásakor használhatók.
Folytassa a megjelenő képernyőket, és válassza a Mentés és bezárás lehetőséget.

Keresési típusok

Az Azure OpenAI On Your Data az alábbi keresési típusokat biztosítja, amelyek az adatforrás hozzáadásakor használhatók.

A vektorkeresés engedélyezéséhez egy meglévő beágyazási modellre van szükség, amelyet az Azure OpenAI-erőforrásban helyeznek üzembe, vagy az Elasticsearchben üzemeltetnek. Válassza ki a beágyazási üzembe helyezést az adatok csatlakoztatásakor, majd válasszon egy vektorkeresési típust az Adatkezelés területen.

Keresés lehetőség	Lekérés típusa	További díjszabás?	Juttatások
kulcsszó	Kulcsszavas keresés	Nincs további díjszabás.	Gyors és rugalmas lekérdezési elemzést és egyeztetést végez kereshető mezőkön keresztül, bármilyen támogatott nyelven, operátorokkal vagy anélkül.
vektor	Vektoros keresés	Az Azure OpenAI-fiók további díjszabása a beágyazási modell meghívásától.	Lehetővé teszi az adott lekérdezési bemenethez hasonló dokumentumok megkeresését a tartalom vektoros beágyazása alapján.

Indexmező-leképezés

Az adatforrás hozzáadásakor testre szabhatja a mezőleképezést , hogy meghatározza a kérdések megválaszolásakor leképezett mezőket. A mezőleképezés testreszabásához válassza az Adatforrás lapon az Egyéni mezőleképezés használata lehetőséget az adatforrás hozzáadásakor. A tartalomadatokhoz több mezőt is megadhat, és minden olyan mezőt tartalmaznia kell, amely a használati esethez kapcsolódó szövegekkel rendelkezik.

Ezeknek a mezőknek a helyes leképezése segít biztosítani a modell jobb válasz- és idézetminőségét. Ezt a paramétert az API-ban fields_mapping is konfigurálhatja.

Az Elasticsearch használata adatforrásként API-val

Az Elasticsearch-adatbázisok az Azure OpenAI Studióban való használata mellett az Elasticsearch-adatbázist is használhatja az API-val.

Üzembe helyezés egy másodpilóta (előzetes verzió), Teams-alkalmazás (előzetes verzió) vagy webalkalmazásban

Miután csatlakoztatta az Azure OpenAI-t az adataihoz, üzembe helyezheti azOkat az Azure OpenAI Studióban a Telepítés gombra kattintva.

Ez több lehetőséget is kínál a megoldás üzembe helyezésére.

A Copilot Studióban (előzetes verzió) közvetlenül az Azure OpenAI Studióban telepítheti a copilotokat, így beszélgetési élményeket hozhat létre különböző csatornákon, például a Microsoft Teamsben, webhelyeken, Dynamics 365 és más Azure Bot Service-csatornákon. Az Azure OpenAI szolgáltatásban és a Copilot Studióban (előzetes verzió) használt bérlőnek azonosnak kell lennie. További információkért lásd : Kapcsolat használata az Azure OpenAI-hez az adatokon.

Feljegyzés

A Copilot Studióban (előzetes verzió) való üzembe helyezés csak az USA régióiban érhető el.

A Teams-alkalmazásokkal beszélgetési élményt adhat a Teams felhasználóinak a működési hatékonyság javítása és az információkhoz való hozzáférés demokratizálása érdekében. Ez a Teams-alkalmazás az Azure-fiók bérlői és személyes csevegési (nem csoportos) forgatókönyveinek felhasználóihoz van konfigurálva.

Előfeltételek

A Visual Studio Code legújabb verziója telepítve van.
A Teams Toolkit legújabb verziója telepítve van. Ez egy VS Code-bővítmény, amely projektállványokat hoz létre az alkalmazás számára.
Node.js (16-os vagy 18-os verzió) telepítve van. További információ: Node.js projekttípus verziókompatibilitási táblázata.
A Microsoft Teams telepítve van.
Jelentkezzen be a Microsoft 365 fejlesztői fiókjába (ezen a hivatkozáson keresztül szerezhet be egy tesztfiókot: Fejlesztői program).
- Egyéni Teams-alkalmazások engedélyezése és egyéni alkalmazások feltöltésének bekapcsolása a fiókjában (itt található utasítások)
Az Azure parancssori felülete (CLI) telepítve van. Ez egy platformfüggetlen parancssori eszköz, amellyel csatlakozhat az Azure-hoz, és felügyeleti parancsokat hajthat végre az Azure-erőforrásokon. A környezeti változók beállításával kapcsolatos további információkért tekintse meg az Azure SDK dokumentációját.
Az Azure-fiókjához a használt Azure OpenAI-erőforrás Cognitive Services OpenAI-felhasználója vagy Cognitive Services OpenAI-közreműködői szerepköre van hozzárendelve, így a fiókja Azure OpenAI API-hívásokat kezdeményezhet. További információ: Adatok használata az Azure OpenAI-val biztonságosan és szerepkör-hozzárendelés hozzáadása egy Azure OpenAI-erőforráshoz a szerepkör Azure Portalon való beállításával kapcsolatos utasításokért.

Közvetlenül az Azure OpenAI Studióból telepítheti az önálló Teams-alkalmazásokat. Kövesse az alábbi lépéseket:

Miután hozzáadta az adatokat a csevegési modellhez, válassza az Üzembe helyezés , majd egy új Teams-alkalmazás (előzetes verzió) lehetőséget.
Adja meg a Teams-alkalmazás nevét, és töltse le az eredményként kapott .zip fájlt.
Bontsa ki a .zip fájlt, és nyissa meg a mappát a Visual Studio Code-ban.
Ha az adatkapcsolati lépésben az API-kulcsot választotta, másolja és illessze be manuálisan az Azure AI Search-kulcsot a src\prompts\chat\config.json fájlba. Az Azure AI Search-kulcs az Azure OpenAI Studio Playground-ban található, ha a Kód megtekintése gombot választja az Azure Search Erőforráskulcs alatt található kulccsal. Ha a rendszer által hozzárendelt felügyelt identitást választotta, kihagyhatja ezt a lépést. További információ az Adatkapcsolat szakaszban található különböző adatkapcsolati lehetőségekről.
Nyissa meg a Visual Studio Code terminált, és jelentkezzen be az Azure CLI-be, és válassza ki azt a fiókot, amelyhez Cognitive Service OpenAI-felhasználói szerepkört rendelt. Jelentkezzen be a az login terminálban található paranccsal.
Az alkalmazás hibakereséséhez nyomja le az F5 billentyűt, vagy válassza a Futtatás és hibakeresés lehetőséget a bal oldali panelen. Ezután válassza ki a hibakeresési környezetet a legördülő listából. Megnyílik egy weblap, ahol cseveghet egyéni társalgásával.

Feljegyzés

Az idézeti felület csak a Hibakeresés (Edge) vagy a Hibakeresés (Chrome) szolgáltatásban érhető el.
A copilot tesztelése után a Teams-alkalmazás kiépítését, üzembe helyezését és közzétételét a Visual Studio Code bal oldali panelén található Teams Toolkit-bővítmény kiválasztásával végezheti el. Futtassa a különálló kiépítési, üzembe helyezési és közzétételi fázisokat az Életciklus szakaszban. Előfordulhat, hogy a rendszer arra kéri, hogy jelentkezzen be a Microsoft 365-fiókjába, ahol rendelkezik engedéllyel az egyéni alkalmazások és az Azure-fiók feltöltéséhez.
Az alkalmazás kiépítése: (részletes utasítások a felhőbeli erőforrások kiépítéséhez)
Rendelje hozzá a Cognitive Service OpenAI felhasználói szerepkört az egyéni társpilóta üzembe helyezett felhasználó által hozzárendelt felügyelt identitás erőforrásához.
1. Nyissa meg az Azure Portalt, és válassza ki az egyéni társpilóta újonnan létrehozott , felhasználó által hozzárendelt felügyelt identitás erőforrását.
2. Nyissa meg az Azure-szerepkör-hozzárendeléseket.
3. Válassza a szerepkör-hozzárendelés hozzáadása lehetőséget. Adja meg a következő paramétereket:
  - Hatókör: erőforráscsoport
  - Előfizetés: az Azure OpenAI-erőforrás előfizetése
  - Az Azure OpenAI-erőforrás erőforráscsoportja
  - Szerepkör: Cognitive Service OpenAI-felhasználó
Az alkalmazás üzembe helyezése az Azure-ban az Üzembe helyezés a felhőben című témakör utasításait követve.
Tegye közzé az alkalmazást a Teamsben a Teams közzététele alkalmazás utasításait követve.

Fontos

A Teams-alkalmazás a telepítés során használt Azure-fiók ugyanazon bérlőjén belül használható, mivel alapértelmezés szerint biztonságosan konfigurálva van az egybérlős használathoz. Ha ezt az alkalmazást olyan Teams-fiókkal használja, amely nem a telepítés során használt Azure-bérlőhöz van társítva, hibaüzenetet fog eredményezni.

A Teams-alkalmazásban található README fájl további részleteket és tippeket tartalmaz. Lásd még: Oktatóanyag – Egyéni copilot létrehozása a Teams használatával irányított lépésekhez.

Az Azure OpenAI biztonságos használata az adatokon

Az Azure OpenAI On Your Data biztonságosan használható az adatok és erőforrások védelmével a Microsoft Entra ID szerepköralapú hozzáférés-vezérléssel, virtuális hálózatokkal és privát végpontokkal. Az Azure AI Search biztonsági szűrőivel korlátozhatja a különböző felhasználók válaszaiban használható dokumentumokat is. Lásd: Az Azure OpenAI biztonságos használata az adatokon.

Ajánlott eljárások

A következő szakaszokból megtudhatja, hogyan javíthatja a modell által adott válaszok minőségét.

Betöltési paraméter

Amikor az adatok az Azure AI Searchbe kerülnek, a következő további beállításokat módosíthatja a studióban vagy a betöltési API-ban.

Adattömb mérete (előzetes verzió)

Az Azure OpenAI On Your Data úgy dolgozza fel a dokumentumokat, hogy azokat adattömbökre osztja, mielőtt betöltené őket. Az adattömb mérete a keresési indexben lévő adattömbök tokenjeinek számát tekintve a maximális méret. Az adattömb mérete és a lekért dokumentumok száma együttesen határozza meg, hogy a modellnek küldött kérés mennyi információt (jogkivonatot) tartalmaz. Általánosságban elmondható, hogy az adattömb mérete és a lekért dokumentumok számának szorzata a modellnek küldött tokenek teljes száma.

Adattömb méretének beállítása a használati esethez

Az alapértelmezett adattömbméret 1024 token. Az adatok egyedisége miatt azonban előfordulhat, hogy egy másik adattömbméret (például 256, 512 vagy 1536 token) hatékonyabb.

Az adattömb méretének módosítása javíthatja a csevegőrobot teljesítményét. Az optimális adattömb méretének megkereséséhez próbaidőszakra és hibára van szükség, először is vegye figyelembe az adathalmaz természetét. A kisebb adattömbök általában jobbak a közvetlen tényekkel és kevesebb kontextussal rendelkező adathalmazok esetében, míg a nagyobb adattömbméret hasznos lehet a környezetfüggőbb információk esetében, bár ez befolyásolhatja a lekérési teljesítményt.

A 256-hoz hasonló kis adattömbök részletesebb adattömböket eredményeznek. Ez a méret azt is jelenti, hogy a modell kevesebb jogkivonatot használ a kimenet létrehozásához (kivéve, ha a lekért dokumentumok száma nagyon magas), ami valószínűleg kevesebbe kerül. A kisebb adattömbök azt is jelentik, hogy a modellnek nem kell feldolgoznia és értelmeznie a hosszú szövegszakaszokat, ezáltal csökkentve a zajt és a zavaró tényezőket. Ez a részletesség és a fókusz azonban potenciális problémát jelent. Előfordulhat, hogy a fontos információk nem tartoznak a legjobban lekért adattömbök közé, különösen akkor, ha a lekért dokumentumok száma alacsony értékre van állítva, például 3.

Tipp.

Ne feledje, hogy az adattömb méretének módosításához újra be kell tölteni a dokumentumokat, ezért érdemes először módosítani a futtatókörnyezet paramétereit, például a szigorúságot és a lekért dokumentumok számát. Fontolja meg az adattömb méretének módosítását, ha még mindig nem kapja meg a kívánt eredményeket:

Ha sok olyan választ talál, mint például a "Nem tudom" a dokumentumokban szereplő válaszokkal kapcsolatos kérdésekre, fontolja meg az adattömb méretének 256-ra vagy 512-re való csökkentését a részletesség javítása érdekében.
Ha a csevegőrobot helyes adatokat ad meg, de hiányoznak mások, amelyek az idézetekben nyilvánvalóvá válnak, az adattömb méretének 1536-ra való növelése segíthet a környezetfüggőbb információk rögzítésében.

Futtatókörnyezeti paraméterek

Az alábbi további beállításokat az Azure OpenAI Studio Adatparaméterek szakaszában és az API-ban módosíthatja. Ezeknek a paramétereknek a frissítésekor nem kell újból betöltenie az adatokat.

Paraméter neve	Leírás
Az adatokra adott válaszok korlátozása	Ez a jelző konfigurálja a csevegőrobot megközelítését az adatforrástól független lekérdezések kezelésére, vagy ha a keresési dokumentumok nem elegendőek a teljes válaszhoz. Ha ez a beállítás le van tiltva, a modell a dokumentumok mellett saját tudással egészíti ki a válaszokat. Ha ez a beállítás engedélyezve van, a modell csak a dokumentumokra próbál támaszkodni a válaszokhoz. Ez az `inScope` API paramétere, és alapértelmezés szerint igaz értékre van állítva.
Lekért dokumentumok	Ez a paraméter egy olyan egész szám, amely 3, 5, 10 vagy 20 értékre állítható be, és szabályozza a nagy nyelvi modellnek biztosított dokumentumtömbök számát a végső válasz megfogalmazásához. Alapértelmezés szerint ez az 5 értékre van állítva. A keresési folyamat zajos lehet, és előfordulhat, hogy az adattömbök miatt a releváns információk a keresési index több adattömbjében is el vannak osztva. Az 5-hez hasonló legfelső K-szám kiválasztása biztosítja, hogy a modell a keresés és az adattömbök eredendő korlátozásai ellenére is kinyerje a releváns információkat. A túl magas szám növelése azonban megzavarhatja a modellt. Emellett a hatékonyan használható dokumentumok maximális száma a modell verziójától függ, mivel mindegyiknek más a környezet mérete és kapacitása a dokumentumok kezeléséhez. Ha úgy találja, hogy a válaszok hiányoznak a fontos környezetből, próbálja meg növelni ezt a paramétert. Ez az `topNDocuments` API paramétere, és alapértelmezés szerint 5.
Szigorúság	Meghatározza a rendszer agresszivitását a keresési dokumentumok szűrésében a hasonlósági pontszámok alapján. A rendszer lekérdezi az Azure Searcht vagy más dokumentumtárolókat, majd eldönti, hogy mely dokumentumokat adja meg a nagy nyelvi modelleknek, például a ChatGPT-nek. Az irreleváns dokumentumok kiszűrése jelentősen javíthatja a végpontok közötti csevegőrobot teljesítményét. Egyes dokumentumok ki vannak zárva az első K eredményekből, ha alacsony hasonlósági pontszámmal rendelkeznek, mielőtt továbbítanák őket a modellnek. Ezt egy 1 és 5 közötti egész szám szabályozza. Az érték 1 értékre állítása azt jelenti, hogy a rendszer minimálisan szűri a dokumentumokat a felhasználói lekérdezéshez hasonló keresési hasonlóság alapján. Ezzel szemben az 5-ös beállítás azt jelzi, hogy a rendszer agresszíven szűri ki a dokumentumokat, és nagyon magas hasonlósági küszöbértéket alkalmaz. Ha úgy találja, hogy a csevegőrobot kihagyja a releváns információkat, csökkentse a szűrő szigorúságát (állítsa az értéket közelebb az 1-hez), hogy több dokumentumot is tartalmazzon. Ezzel szemben, ha az irreleváns dokumentumok elvonják a válaszokat, növelje a küszöbértéket (az értéket 5-höz közelebb állítsa). Ez az `strictness` API paramétere, és alapértelmezés szerint 3 értékre van állítva.

Nem hivatkozott hivatkozások

Lehetséges, hogy a modell az API helyett "TYPE":CONTENT az adatforrásból lekért, de az idézetben nem szereplő dokumentumokhoz tér vissza"TYPE":"UNCITED_REFERENCE". Ez hasznos lehet a hibakereséshez, és ezt a viselkedést a fent ismertetett szigorúsági és lekéréses dokumentumok futtatókörnyezeti paramétereinek módosításával szabályozhatja.

Rendszerüzenet

Az Azure OpenAI On Your Data használatakor megadhat egy rendszerüzenetet a modell válaszának irányításához. Ez az üzenet lehetővé teszi a válaszok testreszabását az Azure OpenAI on Your Data által használt kibővített generációs (RAG) minta alapján. A rendszerüzenet a belső alapkérésen kívül a felhasználói élmény biztosításához is használható. Ennek támogatásához egy adott számú jogkivonat után csonkítjuk a rendszerüzenetet , hogy a modell válaszolhasson az adatokkal kapcsolatos kérdésekre. Ha az alapértelmezett felületen felül további viselkedést határoz meg, győződjön meg arról, hogy a rendszerkérés részletes, és elmagyarázza a pontos elvárt testreszabást.

Miután kiválasztotta az adathalmaz hozzáadását, használhatja az Azure OpenAI Studio Rendszerüzenet szakaszát vagy az role_information API paraméterét.

Lehetséges használati minták

Szerepkör definiálása

Meghatározhat egy szerepkört, amelyet az asszisztensének szeretne. Ha például egy támogatási robotot hoz létre, felveheti a "Ön egy szakértői incidenstámogatási asszisztens, amely segít a felhasználóknak az új problémák megoldásában".

A lekérendő adatok típusának meghatározása

Az asszisztensnek megadott adatok természetét is hozzáadhatja.

Adja meg az adathalmaz témáját vagy hatókörét, például a "pénzügyi jelentést", a "tudományos tanulmányt" vagy az "incidensjelentést". Technikai támogatás esetén például felveheti a következőt: "A lekérdezéseket a lekért dokumentumok hasonló incidenseiből származó információk alapján válaszolja meg".
Ha az adatok bizonyos jellemzőkkel rendelkeznek, ezeket a részleteket hozzáadhatja a rendszerüzenethez. Ha például a dokumentumok japán nyelven vannak, hozzáadhatja a "Japán dokumentumok lekérése, és gondosan olvassa el őket japánul, és válaszoljon japánul".
Ha a dokumentumok strukturált adatokat, például táblákat tartalmaznak egy pénzügyi jelentésből, ezt a tényt a rendszer parancssorába is felveheti. Ha például az adatok táblái vannak, felveheti a következőt: "A pénzügyi eredményekhez kapcsolódó táblák formájában kap adatokat, és a felhasználói kérdések megválaszolásához sorról sorra kell olvasnia a táblázatsorokat."

A kimeneti stílus definiálása

A modell kimenetét rendszerüzenet definiálásával is módosíthatja. Ha például meg szeretné győződni arról, hogy az asszisztens válaszai franciául vannak, hozzáadhat egy olyan kérdést, mint például : "Ön egy AI-asszisztens, amely segít a franciául értő felhasználóknak az információk megtalálásában. A felhasználói kérdések lehetnek angol vagy francia nyelven. Kérjük, olvassa el figyelmesen a lekért dokumentumokat, és válaszoljon rájuk franciául. Kérjük, lefordítsa a tudást a dokumentumokból franciára, hogy minden válasz francia nyelven legyen."

Kritikus viselkedés megerősítése

Az Azure OpenAI On Your Data úgy működik, hogy utasításokat küld egy nagy nyelvi modellnek az adatok felhasználói lekérdezéseinek megválaszolására vonatkozó kérések formájában. Ha van egy bizonyos viselkedés, amely kritikus fontosságú az alkalmazás számára, megismételheti a viselkedést a rendszerüzenetben a pontosság növelése érdekében. Ha például azt szeretné, hogy a modell csak dokumentumokból válaszoljon, hozzáadhatja a "Válasz csak lekért dokumentumok használatával, a tudás használata nélkül. Hozzon létre idézeteket a válaszban szereplő összes jogcím dokumentumainak lekéréséhez. Ha a felhasználói kérdést nem lehet megválaszolni a lekért dokumentumok használatával, kérjük, magyarázza el, hogy miért relevánsak a dokumentumok a felhasználói lekérdezések szempontjából. Mindenesetre ne a saját tudása alapján válaszoljon."

Parancssori mérnöki trükkök

Számos trükk van a gyors tervezésben, amelyeket megpróbálhat javítani a kimeneten. Az egyik példa a gondolatláncra való rákérdezés, ahová felveheti a következőt: "Gondoljuk át lépésről lépésre a lekért dokumentumok információiról a felhasználói lekérdezések megválaszolásához. A dokumentumokból lépésről lépésre kinyerheti a releváns ismereteket a felhasználói lekérdezésekből, és a megfelelő dokumentumokból kinyert információkból alulról választ alkothat."

Feljegyzés

A rendszerüzenet segítségével módosíthatja, hogy a GPT-asszisztens hogyan válaszol egy felhasználói kérdésre a lekért dokumentáció alapján. Ez nem befolyásolja a lekérési folyamatot. Ha útmutatást szeretne adni a lekérési folyamathoz, jobb, ha belefoglalja őket a kérdésekbe. A rendszerüzenet csak útmutatás. Előfordulhat, hogy a modell nem tartja be az összes megadott utasítást, mert bizonyos viselkedésekkel, például az objektivitással és az ellentmondásos állítások elkerülésével lett előállítva. Váratlan viselkedés akkor fordulhat elő, ha a rendszerüzenet ellentmond ezeknek a viselkedéseknek.

Maximális válasz

Állítsa be a modellválaszonkénti jogkivonatok számának korlátját. Az Azure OpenAI on Your Data felső korlátja 1500. Ez egyenértékű a max_tokens paraméter API-ban való beállításával.

Az adatokra adott válaszok korlátozása

Ez a beállítás arra ösztönzi a modellt, hogy csak az ön adataival válaszoljon, és alapértelmezés szerint ki van választva. Ha nem választja ki ezt a beállítást, a modell könnyebben alkalmazhatja a belső tudását a válaszadáshoz. A használati eset és a forgatókönyv alapján határozza meg a megfelelő kijelölést.

A modell interakciója

A modellel folytatott csevegés során az alábbi eljárásokkal érheti el a legjobb eredményeket.

Beszélgetési előzmények

Mielőtt új beszélgetést kezdene (vagy olyan kérdést tesz fel, amely nem kapcsolódik az előzőekhez), törölje a csevegési előzményeket.
Ugyanarra a kérdésre eltérő válaszok érkeznek az első beszélgetési sor és az azt követő fordulatok között, mivel a beszélgetési előzmények megváltoztatják a modell aktuális állapotát. Ha helytelen válaszokat kap, jelentse minőségi hibaként.

Modell válasza

Ha nem elégedett egy adott kérdés modellválaszával, próbálja meg konkrétabbá vagy általánosabbá tenni a kérdést, hogy lássa, hogyan reagál a modell, és ennek megfelelően újrakeretezi a kérdést.
A gondolatlánc-rákérdezés hatékonynak bizonyult abban, hogy a modell összetett kérdésekhez/feladatokhoz kívánt kimeneteket állít elő.

Kérdés hossza

Kerülje a hosszú kérdések feltevését, és ha lehetséges, több kérdésre bontsa őket. A GPT-modellek korlátokkal rendelkeznek az elfogadható jogkivonatok számára vonatkozóan. A jogkivonatok korlátai a következőkre számítanak: a felhasználói kérdés, a rendszerüzenet, a lekért keresési dokumentumok (adattömbök), a belső kérések, a beszélgetési előzmények (ha vannak ilyenek) és a válasz. Ha a kérdés túllépi a jogkivonat korlátját, a rendszer csonkolja.

Többnyelvű támogatás

Az Azure OpenAI On Your Data szolgáltatásban jelenleg a kulcsszókeresés és a szemantikai keresés támogatja a lekérdezéseket, és az indexben lévő adatokkal azonos nyelven vannak. Ha például az adatok japán nyelvűek, akkor a bemeneti lekérdezéseket is japán nyelven kell megadni. A többnyelvű dokumentumok lekéréséhez javasoljuk, hogy az indexet engedélyezze a Vektorkeresés funkcióval.
Az információlekérés és a modellválasz minőségének javítása érdekében javasoljuk, hogy engedélyezze a szemantikai keresést a következő nyelvekre: angol, francia, spanyol, portugál, olasz, német, kínai (Zh), japán, koreai, orosz, arab
Javasoljuk, hogy egy rendszerüzenettel tájékoztassa a modellt arról, hogy az adatok más nyelven találhatóak. Példa:
*"*Ön egy AI-asszisztens, amelyet arra terveztek, hogy segítsen a felhasználóknak kinyerni az információkat a lekért japán dokumentumokból. Mielőtt választ ad, gondosan vizsgálja meg a japán dokumentumokat. A felhasználó lekérdezése japán nyelven lesz, és japánul is válaszolnia kell."
Ha több nyelven is rendelkezik dokumentumokkal, javasoljuk, hogy minden nyelvhez hozzon létre egy új indexet, és külön csatlakoztassa őket az Azure OpenAI-hoz.

Adatok streamelése

Streamelési kérést küldhet a stream paraméterrel, így az adatok növekményesen küldhetők és fogadhatók anélkül, hogy a teljes API-válaszra kellene várniuk. Ez javíthatja a teljesítményt és a felhasználói élményt, különösen a nagy vagy dinamikus adatok esetében.

{
    "stream": true,
    "dataSources": [
        {
            "type": "AzureCognitiveSearch",
            "parameters": {
                "endpoint": "'$AZURE_AI_SEARCH_ENDPOINT'",
                "key": "'$AZURE_AI_SEARCH_API_KEY'",
                "indexName": "'$AZURE_AI_SEARCH_INDEX'"
            }
        }
    ],
    "messages": [
        {
            "role": "user",
            "content": "What are the differences between Azure Machine Learning and Azure AI services?"
        }
    ]
}

Beszélgetési előzmények a jobb eredmények érdekében

Ha egy modellel cseveg, a csevegés előzményeinek megadásával a modell jobb minőségű eredményeket ad vissza. A jobb válaszminőség érdekében nem kell belefoglalnia a context segédüzenetek tulajdonságát az API-kérésekbe. Példákért tekintse meg az API referenciadokumentációját .

Függvényhívás

Egyes Azure OpenAI-modellek lehetővé teszik eszközök és tool_choice paraméterek definiálására a függvényhívás engedélyezéséhez. A rest API-val /chat/completionshívható függvények beállíthatók. Ha mind tools az adatforrások szerepelnek a kérelemben, a rendszer a következő szabályzatot alkalmazza.

Ha tool_choice igen none, a rendszer figyelmen kívül hagyja az eszközöket, és csak az adatforrások használják a választ.
Ellenkező esetben, ha tool_choice nincs megadva, vagy objektumként auto van megadva, a rendszer figyelmen kívül hagyja az adatforrásokat, és a válasz tartalmazza a kiválasztott függvények nevét és az argumentumokat, ha vannak ilyenek. Még ha a modell úgy dönt, hogy nincs kiválasztva függvény, az adatforrások továbbra is figyelmen kívül maradnak.

Ha a fenti szabályzat nem felel meg az igényeinek, fontolja meg más lehetőségeket is, például: prompt flow vagy Assistants API.

Tokenhasználat becslése az Azure OpenAI-hoz az Ön adatain

Az Azure OpenAI On Your Data Retrieveal Augmented Generation (RAG) egy olyan szolgáltatás, amely a keresési szolgáltatás (például az Azure AI Search) és a generációs (Azure OpenAI-modellek) használatával lehetővé teszi, hogy a felhasználók a megadott adatok alapján választ kaphassanak kérdéseikre.

Ennek a RAG-folyamatnak a részeként három lépés áll rendelkezésre magas szinten:

A felhasználói lekérdezés átalakítása a keresési szándékok listájára. Ezt úgy végezheti el, hogy egy utasításokat, a felhasználói kérdést és a beszélgetési előzményeket tartalmazó üzenettel hívja meg a modellt. Hívjuk ezt szándékkérésnek.
Minden szándékhoz több dokumentumtömb lesz lekérve a keresési szolgáltatásból. Miután a felhasználó által megadott szigorúsági küszöbérték alapján szűrte ki az irreleváns adattömböket, és belső logikán alapuló adattömböket adott át/összesít, a rendszer kiválasztja a felhasználó által megadott számú dokumentumtömböt.
Ezeket a dokumentumrészleteket, valamint a felhasználói kérdést, a beszélgetési előzményeket, a szerepkör-információkat és az utasításokat a rendszer elküldi a modellnek a végső modellválasz létrehozásához. Hívjuk ezt a generációs kérésnek.

A modellnek összesen két hívása van:

A szándék feldolgozásához: A szándékkérelem jogkivonat-becslése tartalmazza a felhasználói kérdéshez, a beszélgetési előzményekhez és a modellnek a szándékgeneráláshoz küldött utasításokat.
A válasz létrehozásához: A generációs kérdés jogkivonat-becslése tartalmazza a felhasználói kérdéshez, a beszélgetési előzményekhez, a dokumentumtömbök lekért listájához, a szerepkör-információkhoz és a generációhoz küldött utasításokat.

A modell által létrehozott kimeneti jogkivonatokat (mind a szándékokat, mind a választ) figyelembe kell venni a teljes jogkivonat-becsléshez. Az alábbi négy oszlop összegzése a válasz létrehozásához használt átlagos összes jogkivonatot adja meg.

Modell	Parancssori jogkivonatok száma	Szándékkérési jogkivonatok száma	Válasz jogkivonatok száma	Szándék jogkivonatának száma
gpt-35-turbo-16k	4297	1366	111	25
gpt-4-0613	3997	1385	118	18
gpt-4-1106-preview	4538	811	119	27
gpt-35-turbo-1106	4854	1372	110	26

A fenti számok egy olyan adatkészleten végzett tesztelésen alapulnak, amely a következőkkel rendelkezik:

191 beszélgetés
250 kérdés
10 átlagos jogkivonat kérdésenként
Beszélgetésenként átlagosan 4 beszélgetési fordulat

És a következő paraméterek.

Beállítás	Érték
Lekért dokumentumok száma	5
Szigorúság	3
Adattömb mérete	1024
Korlátozza a betöltött adatokra adott válaszokat?	Igaz

Ezek a becslések a fenti paraméterekhez beállított értékektől függően változnak. Ha például a lekért dokumentumok száma 10, a szigorúság pedig 1, akkor a jogkivonatok száma megnő. Ha a visszaadott válaszok nem korlátozódnak a betöltött adatokra, kevesebb utasítást kap a modell, és a jogkivonatok száma csökken.

A becslések a dokumentumok jellegétől és a feltett kérdésektől is függenek. Ha például a kérdések nyitottak, a válaszok valószínűleg hosszabbak lesznek. Hasonlóképpen egy hosszabb rendszerüzenet is hozzájárul egy hosszabb, több jogkivonatot használó kérdéshez, és ha a beszélgetési előzmények hosszúak, a kérés hosszabb lesz.

Modell	A rendszerüzenethez tartozó jogkivonatok maximális kihasználása
GPT-35-0301	400
GPT-35-0613-16K	1000
GPT-4-0613-8K	400
GPT-4-0613-32K	2000.
GPT-35-turbo-0125	2000.
GPT-4-turbo-0409	4000
GPT-4o	4000
GPT-4o-mini	4000

A fenti táblázat a rendszerüzenethez használható jogkivonatok maximális számát mutatja. A modellválasz maximális jogkivonatainak megtekintéséhez tekintse meg a modellekről szóló cikket. Emellett a következők is használnak jogkivonatokat:

A metaüzenet: ha a modell válaszait az alapozó adattartalomra (inScope=True az API-ban) korlátozza, a jogkivonatok maximális száma magasabb. Ellenkező esetben (például ha inScope=False) a maximális érték alacsonyabb. Ez a szám a felhasználói kérdés és beszélgetés előzményeinek tokenhosszától függően változó. Ez a becslés tartalmazza az alapkérést és a lekérdezés újraírását kérő kéréseket a lekéréshez.
Felhasználói kérdés és előzmények: Változó, de 2000 jogkivonatra van megfeleltetve.
Lekért dokumentumok (adattömbök): A lekért dokumentumtömbök által használt tokenek száma több tényezőtől függ. Ennek felső határa a beolvasott dokumentumtömbök száma és az adattömb méretének szorzata. A többi mező megszámlálása után azonban csonkolja az adott modellhez használt jogkivonatok alapján.

Az elérhető jogkivonatok 20%-a a modell válaszához van fenntartva. Az elérhető jogkivonatok fennmaradó 80%-a tartalmazza a metaüzenetet, a felhasználói kérdést és a beszélgetési előzményeket, valamint a rendszerüzenetet. A fennmaradó jogkivonat-költségvetést a lekért dokumentumtömbök használják.

A bemenet által felhasznált tokenek számának kiszámításához (például a kérdés, a rendszerüzenet/szerepkör adatai) használja az alábbi kódmintát.

import tiktoken

class TokenEstimator(object):

    GPT2_TOKENIZER = tiktoken.get_encoding("gpt2")

    def estimate_tokens(self, text: str) -> int:
        return len(self.GPT2_TOKENIZER.encode(text))
      
token_output = TokenEstimator.estimate_tokens(input_text)

Hibaelhárítás

A sikertelen műveletek hibaelhárításához mindig keresse meg az API-válaszban vagy az Azure OpenAI Studióban megadott hibákat vagy figyelmeztetéseket. Íme néhány gyakori hiba és figyelmeztetés:

Sikertelen betöltési feladatok

Kvótakorlátozásokkal kapcsolatos problémák

Nem hozható létre X nevű index az Y szolgáltatásban. A szolgáltatás indexkvótája túllépte az indexkvótát. Először törölnie kell a nem használt indexeket, késleltetnie kell az indexlétrehozási kérelmeket, vagy frissítenie kell a szolgáltatást a magasabb korlátok érdekében.

A szolgáltatás esetében túllépte az X standard indexelőkvótát. Jelenleg X standard indexelőkkel rendelkezik. Először törölnie kell a nem használt indexelőket, módosítania kell a "executionMode" indexelőt, vagy frissítenie kell a szolgáltatást a magasabb korlátok érdekében.

Megoldás:

Frissítsen magasabb tarifacsomagra, vagy törölje a nem használt eszközöket.

Időtúllépési problémák előfeldolgozása

Nem sikerült végrehajtani a képességet, mert a webes API-kérés meghiúsult

Nem sikerült végrehajtani a képességet, mert a webes API-képesség válasza érvénytelen

Megoldás:

Bontsa le a bemeneti dokumentumokat kisebb dokumentumokra, és próbálkozzon újra.

Engedélyekkel kapcsolatos problémák

Ez a kérés nem jogosult a művelet végrehajtására

Megoldás:

Ez azt jelenti, hogy a tárfiók nem érhető el a megadott hitelesítő adatokkal. Ebben az esetben tekintse át az API-nak átadott tárfiók hitelesítő adatait, és győződjön meg arról, hogy a tárfiók nem rejthető el privát végpont mögött (ha egy privát végpont nincs konfigurálva ehhez az erőforráshoz).

503 hiba a lekérdezések Azure AI Search szolgáltatással történő küldésekor

Minden felhasználói üzenet több keresési lekérdezésre is lefordítható, amelyek mindegyike párhuzamosan lesz elküldve a keresési erőforrásnak. Ez szabályozást eredményezhet, ha a keresési replikák és partíciók száma alacsony. Előfordulhat, hogy egy partíció és egy replika által támogatott másodpercenkénti lekérdezések maximális száma nem elegendő. Ebben az esetben fontolja meg a replikák és partíciók növelését, vagy az alvó/újrapróbálkozások logikáját az alkalmazásban. További információkért tekintse meg az Azure AI Search dokumentációját .

Regionális rendelkezésre állás és modelltámogatás

Régió	`gpt-35-turbo-16k (0613)`	`gpt-35-turbo (1106)`	`gpt-4-32k (0613)`	`gpt-4 (1106-preview)`	`gpt-4 (0125-preview)`	`gpt-4 (0613)`	`gpt-4o`**	`gpt-4 (turbo-2024-04-09)`
Kelet-Ausztrália	✅	✅	✅	✅		✅
Kelet-Kanada	✅	✅	✅	✅		✅
USA keleti régiója	✅				✅		✅
USA 2. keleti régiója	✅			✅			✅	✅
Közép-Franciaország	✅	✅	✅	✅		✅
Kelet-Japán	✅
USA északi középső régiója	✅				✅		✅
Kelet-Norvégia	✅			✅
USA déli középső régiója					✅		✅
Dél-India		✅		✅
Közép-Svédország	✅	✅	✅	✅		✅		✅
Észak-Svájc	✅		✅			✅
Az Egyesült Királyság déli régiója	✅	✅		✅	✅
USA nyugati régiója		✅		✅			✅

**Ez csak szöveges implementáció

Ha az Azure OpenAI-erőforrás egy másik régióban található, nem fogja tudni használni az Azure OpenAI-t az adatain.

Megosztás a következőn keresztül:

Azure OpenAI az adatokon

Mi az Azure OpenAI az Ön adatain?

Fejlesztés az Azure OpenAI-val az adatokon

Azure Szerepköralapú hozzáférés-vezérlés (Azure RBAC) adatforrások hozzáadásához

Adatformátumok és fájltípusok

Támogatott adatforrások

Keresési típusok

Intelligens keresés

Dokumentumszintű hozzáférés-vezérlés

Indexmező-leképezés

Keresési szűrő (API)

Adatok betöltése az Azure AI-keresésbe

Adatkapcsolat

Üzembe helyezés egy másodpilóta (előzetes verzió), Teams-alkalmazás (előzetes verzió) vagy webalkalmazásban

Az Azure OpenAI biztonságos használata az adatokon

Ajánlott eljárások

Betöltési paraméter

Adattömb mérete (előzetes verzió)

Adattömb méretének beállítása a használati esethez

Futtatókörnyezeti paraméterek

Nem hivatkozott hivatkozások

Rendszerüzenet

Lehetséges használati minták

Maximális válasz

Az adatokra adott válaszok korlátozása

A modell interakciója

Adatok streamelése

Beszélgetési előzmények a jobb eredmények érdekében

Függvényhívás

Tokenhasználat becslése az Azure OpenAI-hoz az Ön adatain

Hibaelhárítás

Sikertelen betöltési feladatok

503 hiba a lekérdezések Azure AI Search szolgáltatással történő küldésekor

Regionális rendelkezésre állás és modelltámogatás

Következő lépések

Visszajelzés

További források