Integrerad vektorinbäddning i Azure AI-sökning

Integrerad vektorisering är ett tillägg för indexerings- och frågepipelines i Azure AI-sökning. Den lägger till följande funktioner:

Vektorkodning under indexer-driven indexering
Vektorkodning under frågor

Datasegmentering är inte ett hårt krav, men om inte dina rådata är små krävs segmentering för att uppfylla kraven på tokeninmatning i inbäddningsmodeller.

Vektorkonverteringar är enkelriktade: icke-vektor till vektor. Det finns till exempel ingen vektor-till-text-konvertering för frågor eller resultat, till exempel konvertering av ett vektorresultat till en sträng som kan läsas av människor, vilket är anledningen till att index innehåller både vektor- och icke-vektorfält.

Integrerad vektorisering påskyndar utvecklingen och minimerar underhållsaktiviteter under datainmatning och frågetid eftersom det finns färre åtgärder som du måste implementera manuellt.

Använda integrerad vektorisering under indexering

För integrerade datasegmentering och vektorkonverteringar är du beroende av följande komponenter:

En indexerare som hämtar rådata från en datakälla som stöds och kör pipelinemotorn.
Ett sökindex för att ta emot segmenterat och vektoriserat innehåll.
En kompetensuppsättning som konfigurerats för:
- En segmenteringsstrategi: Kompetens för delning av text, kunskaper i dokumentlayout, Azure Content Understanding-kunskaper eller något av dokumentparsinglägena.
- En inbäddningsfärdighet som används för att generera vektormatriser, vilket kan vara något av följande:
  - AzureOpenAIEmbedding-funktion, associerad med text-embedding-ada-002, text-embedding-3-small, text-embedding-3-large på Azure OpenAI.
  - Anpassad färdighet som pekar på en annan inbäddningsmodell i Azure eller på en annan webbplats.
  - Kunskaper om multimodala inbäddningar i Azure Vision (förhandsversion) som pekar på det multimodala API:et för Azure Vision.
  - AML-kunskaper som pekar på att välja modeller i Microsoft Foundry-modellkatalogen.

Använda integrerad vektorisering i frågor

För text-till-vektorkonvertering under frågor är du beroende av dessa komponenter:

En fråga som anger ett eller flera vektorfält.
En textsträng som konverteras till en vektor vid frågetillfället.

En vektoriserare, definierad i indexschemat, tilldelad till ett vektorfält och används automatiskt vid frågetillfället för att konvertera en textfråga till en vektor. Den vektoriserare som du har konfigurerat måste matcha inbäddningsmodellen som används för att koda ditt innehåll.

Inbäddningskompetens	Vektoriserare
AzureOpenAIEmbedding-kompetens	Azure OpenAI-vektoriserare
Anpassad färdighet	Anpassad webb-API-vektoriserare
Kunskaper om multimodala inbäddningar i Azure Vision (förhandsversion)	Azure Vision-vektoriserare
AML-funktion som pekar på modellkatalogen i Foundry-portalen	Microsoft Foundry-modellkatalogvektoriserare

Komponentdiagram

Följande diagram visar komponenterna i integrerad vektorisering.

Arbetsflödet är en indexerarpipeline. Indexerare hämtar data från datakällor som stöds och initierar databerikning (eller tillämpad AI) genom att anropa Azure OpenAI eller Foundry Tools eller anpassad kod för text-till-vektorkonverteringar eller annan bearbetning.

Diagrammet fokuserar på integrerad vektorisering, men lösningen är inte begränsad till den här listan. Du kan lägga till fler kunskaper för AI-berikning, skapa ett kunskapslager, lägga till semantisk rangordning, lägga till relevansjustering och andra frågefunktioner.

Tillgänglighet och priser

Integrerad vektorisering är tillgänglig i alla regioner och nivåer. Men om du använder färdigheter och vektoriserare för AI-berikande kan regionala krav gälla. Mer information finns i Koppla en Foundry-resurs till en kompetensuppsättning.

Om du använder en anpassad färdighet och en värdmekanism i Azure (till exempel en Azure-funktionsapp, Azure Web App och Azure Kubernetes) kontrollerar du Azure-produkt efter region-sidan för tillgänglighet av funktioner.

Datasegmentering (textdelningsfärdighet) är kostnadsfri och tillgänglig på alla Foundry-verktyg i alla regioner.

Anmärkning

Vissa äldre söktjänster som skapats före den 1 januari 2019 distribueras på infrastruktur som inte stöder vektorarbetsbelastningar. Om du försöker lägga till ett vektorfält i ett schema och få ett fel är det ett resultat av inaktuella tjänster. I det här fallet måste du skapa en ny söktjänst för att testa vektorfunktionen.

Vilka scenarier kan stöd för integrerad vektorisering stödja?

Dela upp stora dokument i segment, användbara för vektor- och icke-bevektorscenarier. För vektorer hjälper segment dig att uppfylla indatabegränsningarna för inbäddningsmodeller. För icke-bevektorscenarier kan du ha en sökapp i chattformat där GPT samlar in svar från indexerade segment. Du kan använda vektoriserade eller icke-vektoriserade segment för sökning i chattformat.
Skapa ett vektorlager där alla fält är vektorfält och dokument-ID (krävs för ett sökindex) är det enda strängfältet. Fråga vektorarkivet för att hämta dokument-ID:t och skicka sedan dokumentets vektorfält till en annan modell.
Kombinera vektor- och textfält för hybridsökning med eller utan semantisk rangordning. Integrerad vektorisering förenklar alla scenarier som stöds av vektorsökning.

Använda integrerad vektorisering

För endast frågevektorisering:

Lägg till en vektoriserare i ett index. Det bör vara samma inbäddningsmodell som används för att generera vektorer i indexet.
Tilldela vektoriseraren till en vektorprofil och tilldela sedan en vektorprofil till vektorfältet.
Formulera en vektorfråga som anger vilken textsträng som ska vektoriseras.

Ett vanligare scenario – datasegmentering och vektorisering under indexering:

Skapa en datakällaanslutning till en datakälla som stöds för indexerarbaserad indexering.
Skapa en kompetensuppsättning som anropar kunskaper om textdelning för segmentering och Inbäddning av Azure OpenAI eller någon annan inbäddningsfärdighet för att vektorisera segmenten.
Skapa ett index som anger en vektoriserare för frågetid och tilldela den till vektorfält.
Skapa en indexerare för att driva allt, från datahämtning till körning av kompetensuppsättningar, via indexering. Vi rekommenderar att du kör indexeraren enligt ett schema för att hämta ändrade dokument eller dokument som har missats på grund av strypning.

Valfritt skapa sekundära index för avancerade scenarier där segmenterat innehåll finns i ett index och icke-segmenterat i ett annat index. Segmenterade index (eller sekundära index) är användbara för RAG-appar.

Tips

Prova guiden Importera data i Azure-portalen för att utforska integrerad vektorisering innan du skriver någon kod.

Säkra anslutningar till vektoriserare och modeller

Om din arkitektur kräver privata anslutningar som kringgår internet kan du skapa en delad privat länkanslutning till de inbäddningsmodeller som används av skills under indexering och av vektoriserare vid frågetillfället.

Delade privata länkar fungerar endast för Azure-till-Azure-anslutningar. Om du ansluter till OpenAI eller en annan extern modell måste anslutningen vara via det offentliga Internet.

För vektoriseringsscenarier använder du:

openai_account för inbäddning av modeller som finns på en Azure OpenAI-resurs.
sites för inbäddning av modeller som används som en anpassad färdighet eller anpassad vektoriserare. Grupp-ID sites är för apptjänster och Azure-funktioner, som du kan använda till att hosta en inbäddningsmodell som inte är en av Azure OpenAI:s inbäddningsmodeller.

Fördelar

Här är några av de viktigaste fördelarna med den integrerade vektoriseringen:

Ingen separat pipeline för datasegmentering och vektorisering. Kod är enklare att skriva och underhålla.
Automatisera indexering från slutpunkt till slutpunkt. När informationen ändras i källan (till exempel i Azure Storage, Azure SQL eller Cosmos DB) kan indexeraren hantera dessa uppdateringar genom hela pipelinen, från hämtning till dokumentupplösning, genom valfri AI-berikning, datasegmentering, vektorisering och indexering.
Batchbearbetning och omprövningslogik är inbyggd (kan inte konfigureras). Azure AI-sökning har interna återförsöksprinciper för strypningsfel som uppstår på grund av att Azure OpenAI-slutpunkten överstiger tokenkvoterna för inbäddningsmodellen. Vi rekommenderar att indexeraren sätts enligt ett schema (till exempel var 5:e minut) så att indexeraren kan bearbeta alla anrop som begränsas av Azure OpenAI-slutpunkten trots återförsöksprinciperna.
Projicera segmenterat innehåll till sekundära index. Sekundära index skapas på samma sätt som för alla sökindex (ett schema med fält och andra konstruktioner), men de fylls i tillsammans med ett primärt index av en indexerare. Innehåll från varje källdokument flödar till fält i primära och sekundära index under samma indexeringskörning.

Sekundära index är avsedda för appar med fråge- och svars- eller chattformat. Det sekundära indexet innehåller detaljerad information för mer specifika matchningar, men det överordnade indexet har mer information och kan ofta ge ett mer fullständigt svar. När en matchning hittas i det sekundära indexet returnerar frågan det överordnade dokumentet från det primära indexet. Om du till exempel antar en stor PDF som ett källdokument kan det primära indexet ha grundläggande information (rubrik, datum, författare, beskrivning), medan ett sekundärt index har segment med sökbart innehåll.

Begränsningar

Kontrollera att du känner till Azure OpenAI-kvoter och -gränser för inbäddningsmodeller. Azure AI-sökning har återförsöksprinciper, men om kvoten är slut misslyckas återförsöken.

Gränser för Azure OpenAI-token per minut är per modell, per prenumeration. Tänk på detta om du använder en inbäddningsmodell för både fråge- och indexeringsarbetsbelastningar. Följ om möjligt metodtipsen. Ha en inbäddningsmodell för varje arbetsbelastning och försök distribuera dem i olika prenumerationer.

Kom ihåg att det finns tjänstbegränsningar per nivå och arbetsbelastningar i Azure AI-sökning.

Nästa steg

Feedback

Var den här sidan till hjälp?

Last updated on 2026-02-20