Azure OpenAI på dina data

Artikel
10/31/2024

Använd den här artikeln om du vill lära dig mer om Azure OpenAI På dina data, vilket gör det enklare för utvecklare att ansluta, mata in och jorda sina företagsdata för att snabbt skapa personliga andrepiloter (förhandsversion). Det förbättrar användarförståelsen, påskyndar slutförande av uppgifter, förbättrar drifteffektiviteten och underlättar beslutsfattandet.

Vad är Azure OpenAI på dina data

Med Azure OpenAI On Your Data kan du köra avancerade AI-modeller som GPT-35-Turbo och GPT-4 på dina egna företagsdata utan att behöva träna eller finjustera modeller. Du kan chatta ovanpå och analysera dina data med större noggrannhet. Du kan ange källor som stöder svaren baserat på den senaste informationen som är tillgänglig i dina avsedda datakällor. Du kan komma åt Azure OpenAI På dina data med hjälp av ett REST-API, via SDK eller det webbaserade gränssnittet i Azure AI Foundry-portalen. Du kan också skapa en webbapp som ansluter till dina data för att aktivera en förbättrad chattlösning eller distribuera den direkt som andrepilot i Copilot Studio (förhandsversion).

Utveckla med Azure OpenAI på dina data

Ett diagram som visar ett exempelarbetsflöde.

Den utvecklingsprocess som du använder med Azure OpenAI på dina data är vanligtvis:

Mata in: Ladda upp filer med antingen Azure AI Foundry-portalen eller inmatnings-API:et. Detta gör att dina data kan knäckas, segmenteras och bäddas in i en Azure AI Search-instans som kan användas av Azure OpenAI-modeller. Om du har en befintlig datakälla som stöds kan du även ansluta den direkt.
Utveckla: När du har provat Azure OpenAI På dina data börjar du utveckla ditt program med hjälp av det tillgängliga REST-API:et och SDK:erna, som är tillgängliga på flera språk. Den skapar uppmaningar och sökinsikter som ska skickas till Azure OpenAI-tjänsten.
Slutsatsdragning: När programmet har distribuerats i önskad miljö skickas uppmaningar till Azure OpenAI, som utför flera steg innan ett svar returneras:
1. Avsiktsgenerering: Tjänsten bestämmer avsikten med användarens uppmaning att fastställa ett korrekt svar.
2. Hämtning: Tjänsten hämtar relevanta delar av tillgängliga data från den anslutna datakällan genom att fråga den. Till exempel med hjälp av en semantisk sökning eller vektorsökning. Parametrar som strikthet och antal dokument som ska hämtas används för att påverka hämtningen.
3. Filtrering och omrankning: Sökresultat från hämtningssteget förbättras genom rangordning och filtrering av data för att förfina relevansen.
4. Svarsgenerering: Resulterande data skickas tillsammans med annan information som systemmeddelandet till LLM (Large Language Model) och svaret skickas tillbaka till programmet.

Kom igång genom att ansluta datakällan med Hjälp av Azure AI Foundry-portalen och börja ställa frågor och chatta om dina data.

Rollbaserade åtkomstkontroller i Azure (Azure RBAC) för att lägga till datakällor

Om du vill använda Azure OpenAI på dina data helt måste du ange en eller flera Azure RBAC-roller. Mer information finns i Azure OpenAI on Your Data configuration (Azure OpenAI på datakonfigurationen ).

Dataformat och filtyper

Azure OpenAI On Your Data stöder följande filtyper:

.txt
.md
.html
.docx
.pptx
.pdf

Det finns en uppladdningsgräns och det finns vissa varningar om dokumentstrukturen och hur den kan påverka kvaliteten på svar från modellen:

Om du konverterar data från ett format som inte stöds till ett format som stöds optimerar du kvaliteten på modellsvaret genom att säkerställa konverteringen:
- Leder inte till betydande dataförlust.
- Lägger inte till oväntat brus i dina data.
Om dina filer har särskild formatering, till exempel tabeller och kolumner eller punktpunkter, förbereder du dina data med det dataförberedelseskript som är tillgängligt på GitHub.
För dokument och datauppsättningar med lång text bör du använda det tillgängliga dataförberedelseskriptet. Skriptet delar upp data så att modellens svar är mer exakta. Det här skriptet stöder även skannade PDF-filer och bilder.

Datakällor som stöds

Du måste ansluta till en datakälla för att ladda upp dina data. När du vill använda dina data för att chatta med en Azure OpenAI-modell segmenteras dina data i ett sökindex så att relevanta data kan hittas baserat på användarfrågor.

Den integrerade vektordatabasen i vCore-baserade Azure Cosmos DB for MongoDB har inbyggt stöd för integrering med Azure OpenAI på dina data.

För vissa datakällor som att ladda upp filer från din lokala dator (förhandsversion) eller data som finns i ett bloblagringskonto (förhandsversion) används Azure AI Search. När du väljer följande datakällor matas dina data in i ett Azure AI Search-index.

Data som matas in via Azure AI Search	beskrivning
Azure AI Search	Använd ett befintligt Azure AI Search-index med Azure OpenAI på dina data.
Ladda upp filer (förhandsversion)	Ladda upp filer från den lokala datorn som ska lagras i en Azure Blob Storage-databas och matas in i Azure AI Search.
URL/webbadress (förhandsversion)	Webbinnehåll från URL:erna lagras i Azure Blob Storage.
Azure Blob Storage (förhandsversion)	Ladda upp filer från Azure Blob Storage som ska matas in i ett Azure AI Search-index.

Du kanske vill överväga att använda ett Azure AI Search-index när du antingen vill:

Anpassa processen för att skapa index.
Återanvänd ett index som skapats tidigare genom att mata in data från andra datakällor.

Kommentar

Om du vill använda ett befintligt index måste det ha minst ett sökbart fält.
Ange alternativet CORS Allow Origin Type till all och alternativet Tillåtet ursprung till *.

Söktyper

Azure OpenAI På dina data innehåller följande söktyper som du kan använda när du lägger till din datakälla.

Nyckelordssökning
Semantisk sökning
Vektorsökning med hjälp av Ada-inbäddningsmodeller som är tillgängliga i valda regioner

För att aktivera vektorsökning behöver du en befintlig inbäddningsmodell som distribuerats i din Azure OpenAI-resurs. Välj din inbäddningsdistribution när du ansluter dina data och välj sedan en av vektorsökningstyperna under Datahantering. Om du använder Azure AI Search som datakälla kontrollerar du att du har en vektorkolumn i indexet.

Om du använder ditt eget index kan du anpassa fältmappningen när du lägger till datakällan för att definiera de fält som mappas när du svarar på frågor. Om du vill anpassa fältmappning väljer du Använd anpassad fältmappning på sidan Datakälla när du lägger till datakällan.

Viktigt!

Semantisk sökning omfattas av ytterligare priser. Du måste välja Grundläggande eller högre SKU för att aktivera semantisk sökning eller vektorsökning. Mer information finns i prisnivåskillnad och tjänstgränser .
För att förbättra kvaliteten på svar på informationshämtningen och modellsvaret rekommenderar vi att du aktiverar semantisk sökning för följande datakällspråk: engelska, franska, spanska, portugisiska, italienska, tyska, kinesiska (zh), japanska, koreanska, ryska och arabiska.

Sökalternativ	Hämtningstyp	Ytterligare priser?	Förmåner
nyckelord	Nyckelordssökning	Inga ytterligare priser.	Utför snabb och flexibel frågeparsing och matchning över sökbara fält med hjälp av termer eller fraser på alla språk som stöds, med eller utan operatorer.
semantisk	Semantisk sökning	Ytterligare priser för användning av semantisk sökning .	Förbättrar precisionen och relevansen för sökresultat med hjälp av en reranker (med AI-modeller) för att förstå den semantiska innebörden av frågetermer och dokument som returneras av den första sökrankningen
vektor	Vektorsökning	Ytterligare priser för ditt Azure OpenAI-konto från att anropa inbäddningsmodellen.	Gör att du kan hitta dokument som liknar en viss frågeindata baserat på vektorinbäddning av innehållet.
hybrid (vektor + nyckelord)	En hybrid av vektorsökning och nyckelordssökning	Ytterligare priser för ditt Azure OpenAI-konto från att anropa inbäddningsmodellen.	Utför likhetssökning över vektorfält med hjälp av vektorinbäddningar, samtidigt som det stöder flexibel frågeparsing och fulltextsökning över alfanumeriska fält med termfrågor.
hybrid (vektor + nyckelord) + semantisk	En hybrid av vektorsökning, semantisk sökning och nyckelordssökning.	Ytterligare priser för ditt Azure OpenAI-konto från att anropa inbäddningsmodellen och ytterligare priser för användning av semantisk sökning .	Använder vektorinbäddningar, språktolkning och flexibel frågeparsing för att skapa omfattande sökupplevelser och generativa AI-appar som kan hantera komplexa och olika scenarier för informationshämtning.

Intelligent sökning

Azure OpenAI På dina data har intelligent sökning aktiverat för dina data. Semantisk sökning är aktiverat som standard om du har både semantisk sökning och nyckelordssökning. Om du har inbäddningsmodeller är intelligent sökning standard för hybrid - och semantisk sökning.

Åtkomstkontroll på dokumentnivå

Kommentar

Åtkomstkontroll på dokumentnivå stöds när du väljer Azure AI Search som datakälla.

Med Azure OpenAI På dina data kan du begränsa de dokument som kan användas som svar för olika användare med Säkerhetsfilter för Azure AI Search. När du aktiverar åtkomst på dokumentnivå trimmas sökresultaten som returneras från Azure AI Search och används för att generera ett svar baserat på användarens Microsoft Entra-gruppmedlemskap. Du kan bara aktivera åtkomst på dokumentnivå för befintliga Azure AI Search-index. Mer information finns i Azure OpenAI På ditt datanätverk och åtkomstkonfiguration .

Mappning av indexfält

Om du använder ditt eget index uppmanas du i Azure AI Foundry-portalen att definiera vilka fält du vill mappa för att besvara frågor när du lägger till datakällan. Du kan ange flera fält för innehållsdata och inkludera alla fält som har text som hör till ditt användningsfall.

I det här exemplet ger fälten som mappas till Innehållsdata och Rubrik information till modellen för att besvara frågor. Rubrik används också för rubrikciteringstext. Fältet som mappas till Filnamn genererar källhänvisningsnamnen i svaret.

Genom att mappa dessa fält på rätt sätt ser du till att modellen har bättre svars- och källhänvisningskvalitet. Du kan även konfigurera den i API :et med hjälp av parametern fieldsMapping .

Om du vill implementera ytterligare värdebaserade kriterier för frågekörning kan du konfigurera ett sökfilter med hjälp av parametern filter i REST-API :et.

Hur data matas in i Azure AI-sökning

Från och med september 2024 bytte inmatnings-API:erna till integrerad vektorisering. Den här uppdateringen ändrar inte befintliga API-kontrakt. Integrerad vektorisering, ett nytt erbjudande för Azure AI Search, använder fördefinierade kunskaper för segmentering och inbäddning av indata. Azure OpenAI On Your Data Ingestion-tjänsten använder inte längre anpassade kunskaper. Efter migreringen till integrerad vektorisering har inmatningsprocessen genomgått vissa ändringar och därför skapas endast följande tillgångar:

{job-id}-index
{job-id}-indexer, om ett schema per timme eller dagligen anges rensas indexeraren i slutet av inmatningsprocessen.
{job-id}-datasource

Segmentcontainern är inte längre tillgänglig eftersom den här funktionen nu hanteras av Azure AI Search.

Dataanslutning

Du måste välja hur du vill autentisera anslutningen från Azure OpenAI, Azure AI Search och Azure Blob Storage. Du kan välja en systemtilldelad hanterad identitet eller en API-nyckel. Genom att välja API-nyckel som autentiseringstyp fyller systemet automatiskt i API-nyckeln så att du kan ansluta med dina Azure AI Search-, Azure OpenAI- och Azure Blob Storage-resurser. Genom att välja Systemtilldelad hanterad identitet baseras autentiseringen på den rolltilldelning du har. Systemtilldelad hanterad identitet väljs som standard för säkerhet.

När du väljer nästa knapp valideras konfigurationen automatiskt för att använda den valda autentiseringsmetoden. Om du får ett fel kan du läsa artikeln om rolltilldelningar för att uppdatera konfigurationen.

När du har korrigerat konfigurationen väljer du nästa gång för att verifiera och fortsätta. API-användare kan också konfigurera autentisering med tilldelad hanterad identitet och API-nycklar.

Du kanske vill använda Azure Blob Storage som datakälla om du vill ansluta till befintlig Azure Blob Storage och använda filer som lagras i dina containrar.

Schemalägga automatiska indexuppdateringar

Kommentar

Automatisk indexuppdatering stöds endast för Azure Blob Storage.

Om du vill hålla ditt Azure AI Search-index uppdaterat med dina senaste data kan du schemalägga en automatisk indexuppdatering i stället för att uppdatera den manuellt varje gång dina data uppdateras. Automatisk indexuppdatering är endast tillgänglig när du väljer Azure Blob Storage som datakälla. Så här aktiverar du en automatisk indexuppdatering:

Lägg till en datakälla med Hjälp av Azure AI Foundry-portalen.
Under Välj eller lägg till datakälla väljer du Indexer-schema och väljer den uppdateringstakt som du vill tillämpa.

När datainmatningen har angetts till en annan takt än en gång skapas Azure AI Search-indexerare med ett schema som motsvarar 0.5 * the cadence specified. Det innebär att indexerarna vid den angivna kadensen hämtar, bearbetar och indexar de dokument som har lagts till eller ändrats från lagringscontainern. Den här processen säkerställer att uppdaterade data förbearbetas och indexeras i det slutliga indexet automatiskt vid önskad takt. Om du vill uppdatera dina data behöver du bara ladda upp ytterligare dokument från Azure Portal. I portalen väljer du Lagringskontocontainrar>. Välj namnet på den ursprungliga containern och sedan Ladda upp. Indexet hämtar filerna automatiskt efter den schemalagda uppdateringsperioden. Mellanliggande tillgångar som skapas i Azure AI Search-resursen rensas inte efter inmatning för att möjliggöra framtida körningar. Dessa tillgångar är:

{Index Name}-index
{Index Name}-indexer
{Index Name}-datasource
{Index Name}-skillset

Om du vill ändra schemat kan du använda Azure Portal.

Öppna sökresurssidan i Azure Portal
Välj Indexerare i det vänstra fönstret
Utför följande steg på de två indexerare som har ditt indexnamn som prefix.
1. Välj indexeraren för att öppna den. Välj sedan fliken Inställningar .
2. Uppdatera schemat till önskad takt från "Schema" eller ange en anpassad kadens från "Intervall (minuter)"
3. Välj Spara.

Hur data matas in i Azure AI-sökning

{job-id}-index
{job-id}-indexer, om ett schema per timme eller dagligen anges rensas indexeraren i slutet av inmatningsprocessen.
{job-id}-datasource

Segmentcontainern är inte längre tillgänglig eftersom den här funktionen nu hanteras av Azure AI Search.

Dataanslutning

Med Hjälp av Azure AI Foundry-portalen kan du ladda upp filer från datorn för att prova Azure OpenAI på dina data. Du kan också skapa ett nytt Azure Blob Storage-konto och en Azure AI Search-resurs. Tjänsten lagrar sedan filerna till en Azure Storage-container och utför inmatning från containern. Du kan använda snabbstartsartikeln för att lära dig hur du använder det här datakällsalternativet.

Hur data matas in i Azure AI-sökning

{job-id}-index
{job-id}-indexer, om ett schema per timme eller dagligen anges rensas indexeraren i slutet av inmatningsprocessen.
{job-id}-datasource

Segmentcontainern är inte längre tillgänglig eftersom den här funktionen nu hanteras av Azure AI Search.

Dataanslutning

Du kan klistra in URL:er så lagrar tjänsten webbsidans innehåll med hjälp av det när du genererar svar från modellen. Innehållet i URL:er/webbadresser som du använder måste ha följande egenskaper för att matas in korrekt:

En offentlig webbplats, till exempel Använda dina data med Azure OpenAI Service – Azure OpenAI | Microsoft Learn. Du kan inte lägga till en URL/webbadress med åtkomstkontroll, till exempel sådana med ett lösenord.
En HTTPS-webbplats.
Storleken på innehållet i varje URL är mindre än 5 MB.
Webbplatsen kan laddas ned som en av de filtyper som stöds.
Endast ett lager med kapslade länkar stöds. Endast upp till 20 länkar hämtas på webbsidan.

När du har lagt till URL:en/webbadressen för datainmatning hämtas webbsidorna från url:en och sparas i Azure Blob Storage med ett containernamn: webpage-<index name>. Varje URL sparas i en annan container i kontot. Sedan indexeras filerna till ett Azure AI Search-index, som används för hämtning när du chattar med modellen.

Hur data matas in i Azure AI-sökning

{job-id}-index
{job-id}-indexer, om ett schema per timme eller dagligen anges rensas indexeraren i slutet av inmatningsprocessen.
{job-id}-datasource

Segmentcontainern är inte längre tillgänglig eftersom den här funktionen nu hanteras av Azure AI Search.

Dataanslutning

Du kan ansluta till elasticsearch-vektordatabasen och chatta med dina data.

Förutsättningar

En Elasticsearch-databas
En inbäddningsmodell. Du kan:
- Använd en befintlig Inbäddningsmodell för Azure OpenAI text-embedding-ada-002 , eller
- Ta med din egen inbäddningsmodell som finns på Elasticsearch.
Förbered dina data med python-notebook-filen som är tillgänglig på GitHub.

Begär åtkomst

Att använda Elasticsearch-datakällan är en förhandsversionsfunktion som omfattas av villkoren för begränsad åtkomsttjänst i de tjänstspecifika villkoren för Azure AI-tjänster. Du måste fylla i och skicka ett begärandeformulär för att begära åtkomst till Elasticsearch-datakällan. Formuläret begär information om ditt företag och det scenario som du planerar att använda Elasticsearch-datakällan för. När du har skickat formuläret granskar Azure AI-tjänstteamet det och skickar ett e-postmeddelande till dig inom 10 arbetsdagar.

Ansluta Elasticsearch till Azure OpenAI på dina data

Konfigurera Elasticsearch och hämta din anslutningsinformation.

Du måste ange din Elasticsearch-slutpunkt och kodade API-nyckel för att ansluta till elasticsearch-databasen. Klicka sedan på verifiera anslutningen.
Välj det index som du vill ansluta till.
(valfritt) använd en anpassad fältmappning.

Du kan anpassa fältmappningen när du lägger till datakällan för att definiera de fält som ska mappas när du svarar på frågor eller använda standardvärdena.
Välj söktyp. Azure OpenAI På dina data innehåller följande söktyper som du kan använda när du lägger till din datakälla.
Fortsätt genom skärmarna som visas och välj Spara och stäng.

Söktyper

Azure OpenAI På dina data innehåller följande söktyper som du kan använda när du lägger till din datakälla.

För att aktivera vektorsökning behöver du en befintlig inbäddningsmodell som distribueras i din Azure OpenAI-resurs eller finns på Elasticsearch. Välj din inbäddningsdistribution när du ansluter dina data och välj sedan en av vektorsökningstyperna under Datahantering.

Sökalternativ	Hämtningstyp	Ytterligare priser?	Förmåner
nyckelord	Nyckelordssökning	Inga ytterligare priser.	Utför snabb och flexibel frågeparsing och matchning över sökbara fält med hjälp av termer eller fraser på alla språk som stöds, med eller utan operatorer.
vektor	Vektorsökning	Ytterligare priser för ditt Azure OpenAI-konto från att anropa inbäddningsmodellen.	Gör att du kan hitta dokument som liknar en viss frågeindata baserat på vektorinbäddning av innehållet.

Mappning av indexfält

Du kan anpassa fältmappningen när du lägger till datakällan för att definiera de fält som ska mappas när du svarar på frågor. Om du vill anpassa fältmappning väljer du Använd anpassad fältmappning på sidan Datakälla när du lägger till datakällan. Du kan ange flera fält för innehållsdata och inkludera alla fält som har text som hör till ditt användningsfall.

Genom att mappa dessa fält på rätt sätt ser du till att modellen har bättre svars- och källhänvisningskvalitet. Du kan dessutom konfigurera detta i API :et med hjälp av parametern fields_mapping .

Använda Elasticsearch som datakälla via API

Förutom att använda Elasticsearch-databaser i Azure AI Foundry-portalen kan du även använda elasticsearch-databasen med hjälp av API:et.

Du kan ansluta ditt MongoDB Atlas-vektorindex med Azure OpenAI på dina data för slutsatsdragning. Du kan använda den via Azure AI Foundry-portalen, API och SDK.

Förutsättningar

Ett MongoDB Atlas-konto
En Inbäddningsmodell för Azure OpenAI ada002
- För att uppnå god hämtningskvalitet kontrollerar du att vektorindexet har skapats med inbäddningsmodellen Azure OpenAI ada002.

Vi rekommenderar att du använder någon av följande modeller för MongoDB Atlas

gpt-4 (0613)
gpt-4 (turbo-2024-04-09)
gpt-4o (2024-05-13)
gpt-35-turbo (1106)

Konfiguration

Endast åtkomst till offentliga nätverk stöds. Kontrollera att databasen tillåter offentlig åtkomst En skärmbild som visar skärmen för nätverksåtkomst för Mongo DB.

Dataförberedelse

Om du vill skapa ett nytt vektorsökningsindex med dina dokument kan du använda det tillgängliga skriptet på GitHub för att förbereda dina data för användning med Azure OpenAI På dina data.

Anslutning till MongoDB-konto

Om du vill lägga till datakällan måste du först skapa en anslutning till MongoDB Atlas. Den här anslutningen innehåller information som autentisering (användarnamn och lösenord). Ange slutpunkten för Din MongoDB Atlas-anslutningssträng med följande format: mongodb+srv://{user_name}:{password}@{endpoint}/?appName={application_name}. Mer information om anslutningssträng metoder finns i MongoDB-dokumentationen.

Källindex

När du har skapat en anslutning eller valt en befintlig anslutning kan du ange informationen för att ansluta till ett specifikt vektorindex i det här anslutna kontot. Du måste ange namnet på databasen, samlingen och vektorindexet. Kontrollera att du har angett informationen korrekt för att skapa anslutningen.

Om du vill använda MongoDB Atlas behöver du en inbäddningsmodell för Azure OpenAI ada002. Den här modellen skapas åt dig om du inte redan har en, vilket medför användning för ditt konto.

Mappning av indexfält

När du lägger till Din MongoDB Atlas-datakälla kan du ange datafält för korrekt mappning av dina data för hämtning.

Innehållsdata (krävs): Det här är huvudtextinnehållet i varje dokument. För flera fält separerar du värdena med kommatecken, utan blanksteg.
Vektorfält (krävs): Fältnamnet i ditt MongoDB Atlas-sökindex som innehåller vektorerna.
Filnamn/rubrik/URL: Används för att visa mer information när ett dokument refereras i chatten.

Distribuera till en copilot (förhandsversion), Teams-app (förhandsversion) eller webbapp

När du har anslutit Azure OpenAI till dina data kan du distribuera dem med knappen Distribuera till i Azure AI Foundry-portalen.

Detta ger dig flera alternativ för att distribuera din lösning.

Du kan distribuera till en andrepilot i Copilot Studio (förhandsversion) direkt från Azure AI Foundry-portalen, så att du kan använda konversationsupplevelser till olika kanaler som: Microsoft Teams, webbplatser, Dynamics 365 och andra Azure Bot Service-kanaler. Klientorganisationen som används i Azure OpenAI-tjänsten och Copilot Studio (förhandsversion) bör vara densamma. Mer information finns i Använda en anslutning till Azure OpenAI på dina data.

Kommentar

Distribution till en andrepilot i Copilot Studio (förhandsversion) är endast tillgängligt i amerikanska regioner.

Med en Teams-app kan du ge dina användare i Teams en konversationsupplevelse för att förbättra driftseffektiviteten och demokratisera åtkomsten till information. Den här Teams-appen är konfigurerad för användare i dina scenarier med Azure-kontoklient och personlig chatt (icke-gruppchatt).

Förutsättningar

Den senaste versionen av Visual Studio Code installerad.
Den senaste versionen av Teams Toolkit installerad. Det här är ett VS Code-tillägg som skapar en projektram för din app.
Node.js (version 16 eller 18) installerad. Mer information finns i Node.js kompatibilitetstabell för version för projekttyp.
Microsoft Teams installerat.
Logga in på ditt Microsoft 365-utvecklarkonto (använd den här länken för att hämta ett testkonto: Utvecklarprogram).
- Aktivera anpassade Teams-appar och aktivera uppladdning av anpassade appar i ditt konto (instruktioner här)
Azures kommandoradsgränssnitt (CLI) installerat. Det här är ett plattformsoberoende kommandoradsverktyg för att ansluta till Azure och köra administrativa kommandon på Azure-resurser. Mer information om hur du konfigurerar miljövariabler finns i Azure SDK-dokumentationen.
Ditt Azure-konto har tilldelats Rollen Cognitive Services OpenAI-användare eller Cognitive Services OpenAI-deltagare för den Azure OpenAI-resurs som du använder, så att ditt konto kan göra Azure OpenAI API-anrop. Mer information finns i Azure OpenAI På din datakonfiguration och Lägg till rolltilldelning till en Azure OpenAI-resurs för anvisningar om hur du anger den här rollen i Azure Portal.

Du kan distribuera till en fristående Teams-app direkt från Azure AI Foundry-portalen. Följ stegen nedan:

När du har lagt till dina data i chattmodellen väljer du Distribuera och sedan en ny Teams-app (förhandsversion).
Ange namnet på din Teams-app och ladda ned den resulterande .zip filen.
Extrahera .zip-filen och öppna mappen i Visual Studio Code.
Om du väljer API-nyckel i dataanslutningssteget kopierar och klistrar du in din Azure AI Search-nyckel manuellt i src\prompts\chat\config.json filen. Din Azure AI-söknyckel finns i Azure AI Foundry Portal Playground genom att välja knappen Visa kod med nyckeln under Resursnyckel för Azure Search. Om du väljer Systemtilldelad hanterad identitet kan du hoppa över det här steget. Läs mer om olika alternativ för dataanslutning i avsnittet Dataanslutning .
Öppna Visual Studio Code-terminalen och logga in på Azure CLI och välj det konto som du tilldelade Cognitive Service OpenAI-användarrollen till. az login Använd kommandot i terminalen för att logga in.
Om du vill felsöka din app trycker du på F5-tangenten eller väljer Kör och felsöka i det vänstra fönstret. Välj sedan din felsökningsmiljö i listrutan. En webbsida öppnas där du kan chatta med din anpassade andrepilot.

Kommentar

Källhänvisningsfunktionen är endast tillgänglig i Felsökning (Edge) eller Felsökning (Chrome).
När du har testat din andrepilot kan du etablera, distribuera och publicera din Teams-app genom att välja Teams Toolkit-tillägget i den vänstra rutan i Visual Studio Code. Kör de separata etablerings-, distributions- och publiceringsstegen i avsnittet Livscykel . Du kan bli ombedd att logga in på ditt Microsoft 365-konto där du har behörighet att ladda upp anpassade appar och ditt Azure-konto.
Etablera din app: (detaljerade instruktioner i Etablera molnresurser)
Tilldela rollen Cognitive Service OpenAI-användare till din distribuerade användartilldelade hanterade identitetsresurs för din anpassade andrepilot.
1. Gå till Azure Portal och välj den nyligen skapade resursen Användartilldelad hanterad identitet för din anpassade andrepilot.
2. Gå till Rolltilldelningar i Azure.
3. Välj Lägg till rolltilldelning. Ange följande parametrar:
  - Omfång: resursgrupp
  - Prenumeration: prenumerationen på din Azure OpenAI-resurs
  - Resursgrupp för din Azure OpenAI-resurs
  - Roll: Cognitive Service OpenAI-användare
Distribuera din app till Azure genom att följa anvisningarna i Distribuera till molnet.
Publicera din app till Teams genom att följa anvisningarna i Publicera Teams-appen.

Viktigt!

Din Teams-app är avsedd att användas i samma klientorganisation för ditt Azure-konto som användes under installationen, eftersom den är säkert konfigurerad som standard för användning med en enda klientorganisation. Om du använder den här appen med ett Teams-konto som inte är associerat med Den Azure-klientorganisation som användes under installationen resulterar det i ett fel.

README-filen i teams-appen innehåller ytterligare information och tips. Mer information finns i Självstudie – Skapa anpassad copilot med Teams för guidade steg.

Konfigurera åtkomst och nätverk för Azure OpenAI på dina data

Du kan använda Azure OpenAI på dina data och skydda data och resurser med rollbaserad åtkomstkontroll, virtuella nätverk och privata slutpunkter i Microsoft Entra ID. Du kan också begränsa de dokument som kan användas som svar för olika användare med Säkerhetsfilter för Azure AI Search. Se Azure OpenAI På din dataåtkomst och nätverkskonfiguration.

Bästa praxis

Använd följande avsnitt för att lära dig hur du förbättrar kvaliteten på svar som ges av modellen.

Inmatningsparameter

När dina data matas in i Azure AI Search kan du ändra följande ytterligare inställningar i antingen studio- eller inmatnings-API:et.

Segmentstorlek (förhandsversion)

Azure OpenAI On Your Data bearbetar dina dokument genom att dela upp dem i segment innan de matas in. Segmentstorleken är den maximala storleken när det gäller antalet token för ett segment i sökindexet. Segmentstorlek och antalet hämtade dokument styr tillsammans hur mycket information (token) som ingår i uppmaningen som skickas till modellen. I allmänhet är segmentstorleken multiplicerad med antalet hämtade dokument det totala antalet token som skickas till modellen.

Ange segmentstorlek för ditt användningsfall

Standardstorleken för segment är 1 024 token. Men med tanke på att dina data är unika kan du hitta en annan segmentstorlek (till exempel 256, 512 eller 1 536 token) effektivare.

Om du justerar segmentstorleken kan du förbättra chattrobotens prestanda. Det krävs en del utvärderings- och fel för att hitta den optimala segmentstorleken, men börja med att tänka på vilken typ av datauppsättning du har. En mindre segmentstorlek är vanligtvis bättre för datauppsättningar med direkta fakta och mindre kontext, medan en större segmentstorlek kan vara fördelaktig för mer sammanhangsberoende information, även om det kan påverka hämtningsprestanda.

En liten segmentstorlek som 256 ger mer detaljerade segment. Den här storleken innebär också att modellen använder färre token för att generera sina utdata (såvida inte antalet hämtade dokument är mycket högt), vilket kan kosta mindre. Mindre segment innebär också att modellen inte behöver bearbeta och tolka långa delar av text, vilket minskar brus och distraktion. Den här kornigheten och fokuset utgör dock ett potentiellt problem. Viktig information kanske inte finns bland de mest hämtade segmenten, särskilt om antalet hämtade dokument är inställt på ett lågt värde som 3.

Dricks

Tänk på att ändring av segmentstorleken kräver att dina dokument matas in igen, så det är användbart att först justera körningsparametrar som strikthet och antalet hämtade dokument. Överväg att ändra segmentstorleken om du fortfarande inte får önskat resultat:

Om du stöter på ett stort antal svar, till exempel "Jag vet inte" för frågor med svar som bör finnas i dina dokument, bör du överväga att minska segmentstorleken till 256 eller 512 för att förbättra kornigheten.
Om chattroboten ger rätt information men saknar andra, vilket blir uppenbart i citaten, kan en ökning av segmentstorleken till 1 536 hjälpa till att samla in mer kontextuell information.

Körningsparametrar

Du kan ändra följande ytterligare inställningar i avsnittet Dataparametrar i Azure AI Foundry-portalen och API:et. Du behöver inte ange dina data igen när du uppdaterar dessa parametrar.

Parameternamn	beskrivning
Begränsa svar på dina data	Den här flaggan konfigurerar chattrobotens metod för att hantera frågor som inte är relaterade till datakällan eller när sökdokumenten inte räcker till för ett fullständigt svar. När den här inställningen är inaktiverad kompletterar modellen sina svar med sina egna kunskaper utöver dina dokument. När den här inställningen är aktiverad försöker modellen bara förlita sig på dina dokument för svar. Det här är parametern `inScope` i API:et och inställd på true som standard.
Hämtade dokument	Den här parametern är ett heltal som kan anges till 3, 5, 10 eller 20 och styr antalet dokumentsegment som tillhandahålls till den stora språkmodellen för att formulera det slutliga svaret. Som standard är detta inställt på 5. Sökprocessen kan vara bullrig och ibland, på grund av segmentering, kan relevant information spridas över flera segment i sökindexet. Om du väljer ett topp-K-nummer, till exempel 5, ser du till att modellen kan extrahera relevant information, trots de inneboende begränsningarna för sökning och segmentering. Men att öka antalet för högt kan potentiellt distrahera modellen. Dessutom beror det maximala antalet dokument som kan användas effektivt på modellens version, eftersom var och en har olika kontextstorlek och kapacitet för att hantera dokument. Om du upptäcker att svar saknar viktig kontext kan du prova att öka den här parametern. Det här är parametern `topNDocuments` i API:et och är 5 som standard.
Strikthet	Avgör systemets aggressivitet vid filtrering av sökdokument baserat på deras likhetspoäng. Systemet frågar Azure Search eller andra dokumentlager och bestämmer sedan vilka dokument som ska tillhandahållas till stora språkmodeller som ChatGPT. Om du filtrerar bort irrelevanta dokument kan du avsevärt förbättra prestandan för chattroboten från slutpunkt till slutpunkt. Vissa dokument undantas från top-K-resultaten om de har låga likhetspoäng innan de vidarebefordras till modellen. Detta styrs av ett heltalsvärde mellan 1 och 5. Om det här värdet anges till 1 innebär det att systemet filtrerar dokument minimalt baserat på söklikhet i användarfrågan. Omvänt anger en inställning på 5 att systemet aggressivt filtrerar bort dokument och tillämpar ett mycket högt tröskelvärde för likhet. Om du upptäcker att chattroboten utelämnar relevant information sänker du filtrets strikthet (ange värdet närmare 1) för att inkludera fler dokument. Omvänt, om irrelevanta dokument distraherar svaren, öka tröskelvärdet (ange värdet närmare 5). Det här är parametern `strictness` i API:et och inställd på 3 som standard.

Ej citerade referenser

Det är möjligt för modellen att returnera "TYPE":"UNCITED_REFERENCE" i stället "TYPE":CONTENT för i API:et för dokument som hämtas från datakällan, men som inte ingår i källhänvisning. Detta kan vara användbart för felsökning och du kan styra det här beteendet genom att ändra de strikta och hämtade dokumentkörningsparametrarna som beskrivs ovan.

Systemmeddelande

Du kan definiera ett systemmeddelande för att styra modellens svar när du använder Azure OpenAI på dina data. Med det här meddelandet kan du anpassa dina svar ovanpå rag-mönstret (hämtningsförhöjd generation) som Azure OpenAI On Your Data använder. Systemmeddelandet används utöver en intern basprompt för att tillhandahålla upplevelsen. För att stödja detta trunkerar vi systemmeddelandet efter ett visst antal token för att säkerställa att modellen kan svara på frågor med dina data. Om du definierar extra beteende utöver standardupplevelsen kontrollerar du att systemprompten är detaljerad och förklarar den exakta förväntade anpassningen.

När du har valt att lägga till din datauppsättning kan du använda avsnittet Systemmeddelande i Azure AI Foundry-portalen eller parametern role_informationi API:et.

Potentiella användningsmönster

Definiera en roll

Du kan definiera en roll som du vill ha din assistent. Om du till exempel skapar en supportrobot kan du lägga till "Du är en supportassistent för expertincidenter som hjälper användarna att lösa nya problem".

Definiera vilken typ av data som hämtas

Du kan också lägga till den typ av data som du tillhandahåller till assistenten.

Definiera ämnet eller omfånget för din datauppsättning, till exempel "finansiell rapport", "akademisk uppsats" eller "incidentrapport". För teknisk support kan du till exempel lägga till "Du besvarar frågor med hjälp av information från liknande incidenter i de hämtade dokumenten".
Om dina data har vissa egenskaper kan du lägga till den här informationen i systemmeddelandet. Om dina dokument till exempel är på japanska kan du lägga till "Du hämtar japanska dokument och bör läsa dem noggrant på japanska och svara på japanska".
Om dina dokument innehåller strukturerade data som tabeller från en finansiell rapport kan du också lägga till detta faktum i systemprompten. Om dina data till exempel har tabeller kan du lägga till "Du får data i form av tabeller som rör ekonomiska resultat och du bör läsa tabellen rad för rad för att utföra beräkningar för att besvara användarfrågor".

Definiera utdataformatet

Du kan också ändra modellens utdata genom att definiera ett systemmeddelande. Om du till exempel vill se till att assistentsvaren är på franska kan du lägga till en uppmaning som "Du är en AI-assistent som hjälper användare som förstår franska att hitta information. Användarfrågorna kan vara på engelska eller franska. Läs de hämtade dokumenten noggrant och besvara dem på franska. Översätt kunskapen från dokument till franska för att säkerställa att alla svar är på franska."

Bekräfta kritiskt beteende

Azure OpenAI On Your Data fungerar genom att skicka instruktioner till en stor språkmodell i form av uppmaningar för att besvara användarfrågor med dina data. Om det finns ett visst beteende som är kritiskt för programmet kan du upprepa beteendet i systemmeddelandet för att öka dess noggrannhet. Om du till exempel vill vägleda modellen att bara svara från dokument kan du lägga till "Svara endast med hämtade dokument och utan att använda dina kunskaper. Generera citat till hämtade dokument för varje anspråk i ditt svar. Om användarfrågan inte kan besvaras med hjälp av hämtade dokument förklarar du varför dokument är relevanta för användarfrågor. I vilket fall som helst, svara inte med dina egna kunskaper."

Prompt Engineering tricks

Det finns många knep inom snabbteknik som du kan försöka förbättra utdata. Ett exempel är en tankekedja där du kan lägga till "Låt oss tänka steg för steg om information i hämtade dokument för att besvara användarfrågor. Extrahera relevant kunskap till användarfrågor från dokument steg för steg och skapa ett svar nedifrån och upp från den extraherade informationen från relevanta dokument."

Kommentar

Systemmeddelandet används för att ändra hur GPT-assistenten svarar på en användarfråga baserat på hämtad dokumentation. Det påverkar inte hämtningsprocessen. Om du vill ge instruktioner för hämtningsprocessen är det bättre att ta med dem i frågorna. Systemmeddelandet är bara vägledning. Modellen kanske inte följer alla angivna instruktioner eftersom den har förberetts med vissa beteenden, till exempel objektivitet, och för att undvika kontroversiella uttalanden. Oväntat beteende kan inträffa om systemmeddelandet strider mot dessa beteenden.

Maximalt svar

Ange en gräns för antalet token per modellsvar. Den övre gränsen för Azure OpenAI På dina data är 1 500. Detta motsvarar inställningen av parametern max_tokens i API:et.

Begränsa svar på dina data

Det här alternativet uppmuntrar modellen att endast svara med dina data och är valt som standard. Om du avmarkerar det här alternativet kan modellen lättare använda sina interna kunskaper för att svara. Fastställ rätt val baserat på ditt användningsfall och scenario.

Interagera med modellen

Använd följande metoder för bästa resultat när du chattar med modellen.

Konversationshistorik

Innan du startar en ny konversation (eller ställer en fråga som inte är relaterad till de tidigare) rensar du chatthistoriken.
Att få olika svar för samma fråga mellan den första konversationssvängen och efterföljande svängar kan förväntas eftersom konversationshistoriken ändrar modellens aktuella tillstånd. Om du får felaktiga svar rapporterar du det som ett kvalitetsfel.

Modellsvar

Om du inte är nöjd med modellsvaret för en specifik fråga kan du prova att antingen göra frågan mer specifik eller mer allmän för att se hur modellen svarar och omrama frågan i enlighet med detta.
Tankekedjan har visat sig vara effektiv när det gäller att få modellen att producera önskade utdata för komplexa frågor/uppgifter.

Frågelängd

Undvik att ställa långa frågor och dela upp dem i flera frågor om möjligt. GPT-modellerna har gränser för hur många token de kan acceptera. Tokengränser räknas mot: användarfrågan, systemmeddelandet, hämtade sökdokument (segment), interna frågor, konversationshistoriken (om någon) och svaret. Om frågan överskrider tokengränsen trunkeras den.

Stöd för flera språk

För närvarande har nyckelordssökning och semantisk sökning i Azure OpenAI On Your Data stöd för frågor på samma språk som data i indexet. Om dina data till exempel finns på japanska måste indatafrågor också finnas på japanska. För hämtning av flerspråkiga dokument rekommenderar vi att du skapar indexet med Vector Search aktiverat.
För att förbättra kvaliteten på svar på informationshämtning och modell rekommenderar vi att du aktiverar semantisk sökning efter följande språk: engelska, franska, spanska, portugisiska, italienska, Tyskland, kinesiska(Zh), japanska, koreanska, ryska, arabiska
Vi rekommenderar att du använder ett systemmeddelande för att informera modellen om att dina data är på ett annat språk. Till exempel:
*"*Du är en AI-assistent som är utformad för att hjälpa användare att extrahera information från hämtade japanska dokument. Granska de japanska dokumenten noggrant innan du formulerar ett svar. Användarens fråga kommer att finnas på japanska, och du måste även ta svar på japanska."
Om du har dokument på flera språk rekommenderar vi att du skapar ett nytt index för varje språk och ansluter dem separat till Azure OpenAI.

Strömma data

Du kan skicka en strömningsbegäran med hjälp av parametern stream så att data kan skickas och tas emot stegvis, utan att vänta på hela API-svaret. Detta kan förbättra prestanda och användarupplevelse, särskilt för stora eller dynamiska data.

{
    "stream": true,
    "dataSources": [
        {
            "type": "AzureCognitiveSearch",
            "parameters": {
                "endpoint": "'$AZURE_AI_SEARCH_ENDPOINT'",
                "key": "'$AZURE_AI_SEARCH_API_KEY'",
                "indexName": "'$AZURE_AI_SEARCH_INDEX'"
            }
        }
    ],
    "messages": [
        {
            "role": "user",
            "content": "What are the differences between Azure Machine Learning and Azure AI services?"
        }
    ]
}

Konversationshistorik för bättre resultat

När du chattar med en modell kan en historik för chatten hjälpa modellen att returnera resultat av högre kvalitet. Du behöver inte inkludera context egenskapen för assistentmeddelandena i dina API-begäranden för bättre svarskvalitet. Exempel finns i API-referensdokumentationen .

Funktionsanrop

Med vissa Azure OpenAI-modeller kan du definiera verktyg och tool_choice parametrar för att aktivera funktionsanrop. Du kan konfigurera funktionsanrop via REST API/chat/completions. Om både tools och datakällor finns i begäran tillämpas följande princip.

Om tool_choice är noneignoreras verktygen och endast datakällorna används för att generera svaret.
Annars ignoreras datakällorna om tool_choice de inte har angetts eller angetts som auto eller ett objekt, och svaret innehåller det valda funktionsnamnet och eventuella argument. Även om modellen beslutar att ingen funktion har valts ignoreras fortfarande datakällorna.

Om principen ovan inte uppfyller dina behov bör du överväga andra alternativ, till exempel promptflöde eller API för assistenter.

Uppskattning av tokenanvändning för Azure OpenAI på dina data

Azure OpenAI On Your Data Retrieval Augmented Generation (RAG) är en tjänst som utnyttjar både en söktjänst (till exempel Azure AI Search) och generering (Azure OpenAI-modeller) för att låta användarna få svar på sina frågor baserat på angivna data.

Som en del av den här RAG-pipelinen finns det tre steg på hög nivå:

Omformulera användarfrågan till en lista över sökinsikter. Detta görs genom att göra ett anrop till modellen med en uppmaning som innehåller instruktioner, användarfrågan och konversationshistorik. Nu ska vi kalla detta en avsiktsfråga.
För varje avsikt hämtas flera dokumentsegment från söktjänsten. När du har filtrerat bort irrelevanta segment baserat på det användardefinierade tröskelvärdet för strikthet och reranking/aggregering av segmenten baserat på intern logik väljs det användardefinierade antalet dokumentsegment.
Dessa dokumentsegment, tillsammans med användarfrågan, konversationshistorik, rollinformation och instruktioner skickas till modellen för att generera det slutliga modellsvaret. Nu ska vi anropa generationsprompten.

Totalt görs två anrop till modellen:

För bearbetning av avsikten: Tokenuppskattningen för avsiktsprompten innehåller de för användarfrågan, konversationshistoriken och instruktionerna som skickas till modellen för avsiktsgenerering.
För att generera svaret: Tokenuppskattningen för generationsprompten innehåller de för användarfrågan, konversationshistoriken, den hämtade listan över dokumentsegment, rollinformation och instruktionerna som skickas till den för generering.

Modellen genererade utdatatoken (både avsikter och svar) måste beaktas för total tokenuppskattning. Om du summerar alla fyra kolumnerna nedan får du de genomsnittliga totala token som används för att generera ett svar.

Modell	Antal token för genereringsprompt	Antal token för avsiktsprompt	Antal svarstoken	Antal avsiktstoken
gpt-35-turbo-16k	4297	1366	111	25
gpt-4-0613	3997	1385	118	18
gpt-4-1106-preview	4538	811	119	27
gpt-35-turbo-1106	4854	1372	110	26

Ovanstående tal baseras på testning av en datauppsättning med:

191 konversationer
250 frågor
10 genomsnittliga token per fråga
4 konversationsvändningar per konversation i genomsnitt

Och följande parametrar.

Inställning	Värde
Antal hämtade dokument	5
Strikthet	3
Segmentstorlek	1024
Vill du begränsa svar till inmatade data?	Sant

Dessa uppskattningar varierar beroende på de värden som anges för ovanstående parametrar. Om till exempel antalet hämtade dokument är inställt på 10 och striktheten är inställd på 1, ökar antalet token. Om returnerade svar inte är begränsade till inmatade data finns det färre instruktioner som ges till modellen och antalet token kommer att minska.

Uppskattningarna beror också på dokumentens art och de frågor som ställs. Om frågorna till exempel är öppna kommer svaren sannolikt att bli längre. På samma sätt skulle ett längre systemmeddelande bidra till en längre fråga som förbrukar fler token, och om konversationshistoriken är lång blir prompten längre.

Modell	Maximalt antal token för systemmeddelande
GPT-35-0301	400
GPT-35-0613-16K	1000
GPT-4-0613-8K	400
GPT-4-0613-32K	2000
GPT-35-turbo-0125	2000
GPT-4-turbo-0409	4000
GPT-4o	4000
GPT-4o-mini	4000

Tabellen ovan visar det maximala antalet token som kan användas för systemmeddelandet. Mer information om hur du ser maximala token för modellsvaret finns i artikeln modeller. Dessutom använder följande även token:

Metaprompten: Om du begränsar svar från modellen till grunddatainnehållet (inScope=True i API:et) är det maximala antalet token högre. Annars (till exempel om inScope=False) är maxvärdet lägre. Det här talet är variabelt beroende på tokenlängden för användarens fråga och konversationshistorik. Den här uppskattningen inkluderar basprompten och frågan som skriver om prompter för hämtning.
Användarfråga och historik: Variabel men begränsad till 2 000 token.
Hämtade dokument (segment): Antalet token som används av de hämtade dokumentsegmenten beror på flera faktorer. Den övre gränsen för detta är antalet hämtade dokumentsegment multiplicerat med segmentstorleken. Den trunkeras dock baserat på de token som är tillgängliga token för den specifika modell som används efter att resten av fälten har räknats.

20 % av de tillgängliga token är reserverade för modellsvaret. De återstående 80 % av tillgängliga token är metaprompten, användarfrågan och konversationshistoriken och systemmeddelandet. Den återstående tokenbudgeten används av de hämtade dokumentsegmenten.

För att beräkna antalet token som förbrukas av dina indata (till exempel din fråga, systemmeddelandet/rollinformationen) använder du följande kodexempel.

import tiktoken

class TokenEstimator(object):

    GPT2_TOKENIZER = tiktoken.get_encoding("gpt2")

    def estimate_tokens(self, text: str) -> int:
        return len(self.GPT2_TOKENIZER.encode(text))
      
token_output = TokenEstimator.estimate_tokens(input_text)

Felsökning

Om du vill felsöka misslyckade åtgärder bör du alltid hålla utkik efter fel eller varningar som anges i API-svaret eller Azure AI Foundry-portalen. Här är några av de vanligaste felen och varningarna:

Misslyckade inmatningsjobb

Problem med kvotbegränsningar

Det gick inte att skapa ett index med namnet X i tjänst Y. Indexkvoten har överskridits för den här tjänsten. Du måste antingen ta bort oanvända index först, lägga till en fördröjning mellan begäranden om att skapa index eller uppgradera tjänsten för högre gränser.

Standardindexeringskvoten för X har överskridits för den här tjänsten. Du har för närvarande X-standardindexerare. Du måste antingen ta bort oanvända indexerare först, ändra indexeraren "executionMode" eller uppgradera tjänsten för högre gränser.

Lösning:

Uppgradera till en högre prisnivå eller ta bort oanvända tillgångar.

Problem med tidsgränser för förbearbetning

Det gick inte att köra färdigheten eftersom webb-API-begäran misslyckades

Det gick inte att köra färdigheten eftersom webb-API:ets kompetenssvar är ogiltigt

Lösning:

Dela upp indatadokumenten i mindre dokument och försök igen.

Problem med behörigheter

Den här begäran har inte behörighet att utföra den här åtgärden

Lösning:

Det innebär att lagringskontot inte är tillgängligt med de angivna autentiseringsuppgifterna. I det här fallet granskar du autentiseringsuppgifterna för lagringskontot som skickas till API:et och kontrollerar att lagringskontot inte är dolt bakom en privat slutpunkt (om en privat slutpunkt inte har konfigurerats för den här resursen).

503-fel när du skickar frågor med Azure AI Search

Varje användarmeddelande kan översättas till flera sökfrågor, som alla skickas till sökresursen parallellt. Detta kan ge begränsningsbeteende när antalet sökrepliker och partitioner är lågt. Det maximala antalet frågor per sekund som en enskild partition och en enskild replik kan stödja kanske inte räcker. I det här fallet bör du överväga att öka dina repliker och partitioner eller lägga till vilo-/återförsökslogik i ditt program. Mer information finns i dokumentationen för Azure AI Search.

Regional tillgänglighet och modellstöd

Region	`gpt-35-turbo-16k (0613)`	`gpt-35-turbo (1106)`	`gpt-4-32k (0613)`	`gpt-4 (1106-preview)`	`gpt-4 (0125-preview)`	`gpt-4 (0613)`	`gpt-4o`**	`gpt-4 (turbo-2024-04-09)`
Australien, östra	✅	✅	✅	✅		✅
Östra Kanada	✅	✅	✅	✅		✅
East US	✅				✅		✅
USA, östra 2	✅			✅			✅	✅
Centrala Frankrike	✅	✅	✅	✅		✅
Japan, östra	✅
USA, norra centrala	✅				✅		✅
Norge, östra	✅			✅
USA, södra centrala					✅		✅
Indien, södra		✅		✅
Sverige, centrala	✅	✅	✅	✅		✅		✅
Schweiz, norra	✅		✅			✅
Södra Storbritannien	✅	✅		✅	✅
Västra USA		✅		✅			✅

**Det här är en textimplementering

Om din Azure OpenAI-resurs finns i en annan region kan du inte använda Azure OpenAI på dina data.

Dela via

Azure OpenAI på dina data

Vad är Azure OpenAI på dina data

Utveckla med Azure OpenAI på dina data

Rollbaserade åtkomstkontroller i Azure (Azure RBAC) för att lägga till datakällor

Dataformat och filtyper

Datakällor som stöds

Söktyper

Intelligent sökning

Åtkomstkontroll på dokumentnivå

Mappning av indexfält

Sökfilter (API)

Hur data matas in i Azure AI-sökning

Dataanslutning

Distribuera till en copilot (förhandsversion), Teams-app (förhandsversion) eller webbapp

Konfigurera åtkomst och nätverk för Azure OpenAI på dina data

Bästa praxis

Inmatningsparameter

Segmentstorlek (förhandsversion)

Ange segmentstorlek för ditt användningsfall

Körningsparametrar

Ej citerade referenser

Systemmeddelande

Potentiella användningsmönster

Maximalt svar

Begränsa svar på dina data

Interagera med modellen

Strömma data

Konversationshistorik för bättre resultat

Funktionsanrop

Uppskattning av tokenanvändning för Azure OpenAI på dina data

Felsökning

Misslyckade inmatningsjobb

503-fel när du skickar frågor med Azure AI Search

Regional tillgänglighet och modellstöd

Nästa steg

Feedback

Ytterligare resurser