Dela via


Azure AI Content Understanding pro- och standardlägen

Azure AI Content Understanding är en avancerad generativ AI-tjänst som är utformad för att härleda strukturerade insikter från multimodalt innehåll som dokument, bilder, videor och ljud. Med introduktionen 2025-05-01-preview av versionen erbjuder tjänsten nu två distinkta lägen: standard och pro.

  • Standard: Det här läget fungerar som standardlösning för bearbetning av olika innehållstyper. Den är optimerad för att ge effektiv schemaextrahering anpassad för specifika uppgifter i alla dataformat. Det här läget betonar kostnadseffektivitet och kortare svarstid, vilket säkerställer att strukturerade insikter är tillgängliga för dina allmänna bearbetningsbehov.

  • Pro: Det här läget är utformat för avancerade användningsfall, särskilt de som kräver flera stegs resonemang och komplext beslutsfattande (till exempel att identifiera inkonsekvenser, dra slutsatser och fatta avancerade beslut). Pro-läget tillåter indata från flera innehållsfiler och innehåller alternativet att tillhandahålla referensdata vid skapandetiden för analysatorn. För närvarande erbjuds pro-läge endast för dina dokumentbaserade data.

Översikt över standardläge

Standardläget Content Understanding ger strukturerade insikter över olika datatyper, inklusive dokument, videor, bilder, ljud och text. Även om den inte stöder dataferens minimerar den kostnader och svarstider, vilket gör den idealisk för breda, datacentrerade scenarier. Med det här läget kan du skapa eller anpassa scheman för att extrahera exakta insikter som är skräddarsydda för dina behov. Dessutom innehåller den dataetiketter för dokumentdata, vilket gör att mänsklig indata kan förbättra kvaliteten på dina utdata.

Standardläge: användningsfall

Standard är den perfekta tjänsten för att extrahera de exakta insikter du behöver om alla typer av data. Om du bara vill låsa upp innehållet i dina data kanske ditt scenario inte kräver komplexa resonemang eller beslutsfattande. Scenarier som standardläget fungerar bra för är:

  • Strukturera data för att driva dina RAG-sökarbetsflöden och integrera med AI Search.
  • Extrahera data som ska integreras med Microsoft Fabric.
  • Analysera annonseringsvideor för att söka efter riktlinjer för innehåll.
  • Segmentera videofilmer för att skapa kapitel och identifiera idealiska reklampauser.
  • Extrahera kritiska datapunkter från sportspel och tillhandahålla sammanfattningar efter spelet.

Översikt över Pro-läge

Content Understanding Pro-läget är skräddarsytt för kunder med komplexa användningsfall, som erbjuder flera stegs resonemangsfunktioner och stöd för dokument med flera indata. Det möjliggör resonemang över både indatainnehåll och referensdata, vilket gör det idealiskt för scenarier som kräver komplex analys. Genom att införliva referensdata lägger pro-läget till kontext till varje begäran, vilket underlättar uppgifter som validering och berikning. För närvarande är pro-läget exklusivt tillgängligt för dokumentdata.

Referensdata för Pro-läge

När analyseraren skapas kan du tillhandahålla dokument som kan hjälpa till att ge kontext som refererar till tjänsten under inferens. Om du till exempel vill analysera fakturor för att säkerställa att de överensstämmer med ett avtal kan du ange fakturan och andra relevanta dokument (till exempel en inköpsorder) som indata och ange kontraktsfilerna som referensdata. Tjänsten tillämpar resonemang för att validera indatadokumenten enligt ditt schema, vilket kan innebära att identifiera och markera avvikelser för ytterligare granskning. Om dina dokument ligger inom pro-lägets tjänstgränser för indatadokument rekommenderar vi också att du försöker ange alla dokument som indatadokument om du stöter på kvalitetsproblem.

Resonemang i flera steg

Med flerstegsresonemang kan du dela upp komplexa problem till enkla uppgifter. Flerstegsskäl tar dataanalys ett steg längre än att extrahera och aggregera strukturerade data och gör att du kan dra slutsatser om dessa data, vilket minimerar behovet av mänsklig granskning. Exempel på de typer av frågor som pro-läget kan besvara med flerstegsskäl är:

  • Stämmer x överens med y?
  • Klarar x de definierade kriterierna?
  • Följer x-dokumentet de riktlinjer som krävs?
  • Är summan lika med summan av objekten?
  • Hitta alla inkonsekvenser mellan fakturan och kontraktet.

Standard- och pro-lägesfunktioner

Är du osäker på vilket läge som passar ditt scenario? I följande diagram jämförs standard- och pro-lägesfunktioner.

Egenskap Standardläge Pro-läge
Stora dokument
Fältläge
Extrahera, klassificera och generera fält
Grund- och konfidenspoäng
Typ av indatadokument Dokument, bilder, video, ljud Dokument
Maximalt antal fält 100 100
Bearbetning av flera indatadokument
Integrering av referensdatamängd
Resonemang i flera steg

Tillämpa standard- eller pro-läge på dina scenarier

Du kan använda både Content Understanding-standardlägen och pro-lägen på nästan alla scenarier, men hur du skapar din lösning beror på de frågor som du vill besvara. Följande scenarier innehåller exempel på hur du kan använda standardlägen och pro-lägen för dina data.

Scenarium Standardläge Pro-läge
Fakturaanalys Extrahera insikter om fakturadata i stor skala och aktivera RAG-sökning samt ytterligare dataanalys och visualisering. Besvara frågor som:
• Extrahera inköpsordernummer, summa, förfallodatum och radobjekt för inmatning i databasen.
Analysera fakturor och avtalsavtal med klienter och tillämpa resonemang i flera steg för att dra slutsatser om dessa data. Besvara frågor som:
• Uppfyller fakturan det avtal vi har med kunden?
• Behöver fakturan granskas ytterligare?
Avskriftsanalys för callcenter Extrahera insikter om stora mängder call center-data för att få värdefulla insikter om sentiment, förstå kundproblem och skapa riktad utbildning för att hantera stora smärtpunkter. Besvara frågor som:
• Vilka är de viktigaste problemen som kunderna ringer om?
• Vad är den genomsnittliga längden på samtal som görs om x-problem?
Analysera samtalscentrets avskriftsdata och tillämpa flerstegsskäl för att förstå hur kundtjänstpersonalen hanterar kundernas behov och om de följer riktlinjerna. Besvara frågor som:
• Presenterade sig callcentermedarbetaren?
• Klarade svaret vissa kriterier ?
Behandling av bolåneansökan Extrahera nyckelvärdena från inteckningsprogramdata och gör den sökbar och mer lättillgänglig. Besvara frågor som:
• Vilket år lämnades in inteckningsansökan?
• Vilka är namnen på ansökan?
Analysera kompletterande dokumentation och inteckningsansökningar för att avgöra om en potentiell bostadsköpare tillhandahåller all nödvändig dokumentation för att säkra ett lån. Besvara frågor som:
• Överensstämmer namn och personnummer i inteckningsansökan med stöddokumentationen?

Prova pro-läge

Du kan prova funktionerna i både Content Understanding-standardlägen och pro-lägen med hjälp av Azure AI Foundry. Med tjänsten kan du ta med egna data och experimentera med alla funktioner i båda lägena i en enkel metod utan kod som hjälper dig att hitta den bästa passformen för ditt unika scenario.

Kända begränsningar och metodtips för Pro-läge

  • Content Understanding Pro-läget erbjuder för närvarande inte konfidenspoäng eller förankring. Det stöder för närvarande generativ och klassificering av dina fält, men stöder inte endast extrahering.

  • Content Understanding Pro-läget är för närvarande endast tillgängligt för dokument.

  • Systemet fungerar i uppslagsläge när du refererar till dokument. Därför bör omfattande informationshämtning inte förväntas. Om fullständig återställning av data krävs rekommenderar vi att du införlivar dokumentet i indatauppsättningen.

  • Scheman bör utformas med högsta möjliga specificitetsnivå. I stället för att till exempel presentera en generaliserad lista över inkonsekvenser rekommenderar vi att du skapar distinkta fält för varje typ av inkonsekvens, tillsammans med detaljerade beskrivningar. Där det är möjligt bör dessutom hänvisningar till specifika avsnitt i relevanta dokument som bör granskas inkluderas.

  • Referensdokumenten bör vara koncisa och fokuserade. Prioritera viktiga dokument och se till att de är så korta som möjligt för att förbättra kvarhållning och återkallande.

Nästa steg

Mer information om dokumentbearbetning finns i Översikt över dokumentbearbetning.