Redigera

Dela via


Anpassade dokumentbearbetningsmodeller i Azure

Azure AI-dokumentinformation
Azure AI services
Azure Logic Apps
Azure Machine Learning Studio
Azure Storage

Den här artikeln beskriver Azure-lösningar för att skapa, träna, distribuera och använda anpassade modeller för dokumentbearbetning. Dessa Azure-tjänster erbjuder även användargränssnittsfunktioner (UI) för etikettering eller taggning för textbearbetning.

Arkitektur

Arkitekturdiagram som visar flera alternativ för en modellversion och distributionsprocess för anpassad dokumentbearbetningsmodell.

Ladda ned en Visio-fil med den här arkitekturen.

Dataflöde

  1. Orkestrerare som Azure Logic Apps, Azure Data Factory eller Azure Functions matar in meddelanden och bifogade filer från e-postservrar och filer från FTP-servrar eller webbprogram.

    • Azure Functions och Logic Apps aktiverar serverlösa arbetsbelastningar. Vilken tjänst du väljer beror på vad du föredrar för tjänstfunktioner som utveckling, anslutningsappar, hantering och körningskontext. Mer information finns i Jämför Azure Functions och Azure Logic Apps.

    • Överväg att använda Azure Data Factory för massflytt av data.

  2. Orkestrarna skickar inmatade data till Azure Blob Storage eller Data Lake Storage och organiserar data mellan datalager baserat på egenskaper som filtillägg eller kunder.

  3. Document Intelligence Studio, Language Studio eller Azure Machine Learning-studio etikett och tagga textdata och skapa anpassade modeller. Du kan använda dessa tre tjänster oberoende av varandra eller i olika kombinationer för att hantera olika användningsfall.

    • Om dokumentet kräver att du extraherar nyckel/värde-par eller skapar en anpassad tabell från ett bildformat eller PDF använder du Document Intelligence Studio för att tagga data och träna den anpassade modellen. Om det finns ett krav på att identifiera typen av dokument innan du anropar rätt extraheringsmodell använder du Document Intelligent Studio för att märka dokumenten.

    • För dokumentklassificering baserat på innehåll eller för domänspecifik entitetsextrahering kan du träna en anpassad textklassificering eller NER-modell (Named Entity Recognition) i Language Studio.

    • Machine Learning Studio har funktioner för dataetiketter för textklassificering eller entitetsextrahering som du kan använda med ramverk med öppen källkod som PyTorch eller TensorFlow. Azure Machine Learning-studio tillhandahåller en modellkatalog med grundmodeller. Dessa grundmodeller har finjusteringsfunktioner för olika uppgifter som textklassificering, frågesvar och sammanfattning. Om du vill finjustera grundmodeller använder du Machine Learning Studio UI eller kod.

  4. Så här distribuerar du de anpassade modellerna och använder dem för slutsatsdragning:

Komponenter

  • Logic Apps är en del av Azure Integration Services. Logic Apps skapar automatiserade arbetsflöden som integrerar appar, data, tjänster och system. Med hanterade anslutningsappar för tjänster som Azure Storage och Microsoft 365 kan du utlösa arbetsflöden när en fil hamnar i lagringskontot eller e-postmeddelandet tas emot.

  • Data Factory är en ETL-tjänst (managed cloud extract, transform, load) för dataintegrering och transformering. Data Factory kan lägga till transformeringsaktiviteter i en pipeline som omfattar att anropa en REST-slutpunkt eller köra en notebook-fil på inmatade data.

  • Azure Functions är en serverlös beräkningstjänst som kan vara värd för händelsedrivna arbetsbelastningar med kortvariga processer.

  • Blob Storage är objektlagringslösningen för rådatafiler i det här scenariot. Blob Storage stöder bibliotek för flera språk, till exempel .NET, Node.js och Python. Program kan komma åt filer på Blob Storage via HTTP/HTTPS. Blob Storage har frekventa, lågfrekventa och arkiverade åtkomstnivåer som stöd för kostnadsoptimering för lagring av stora mängder data.

  • Data Lake Storage är en uppsättning funktioner som bygger på Azure Blob Storage för stordataanalys. Data Lake Storage behåller kostnadseffektiviteten för Blob Storage och tillhandahåller funktioner som säkerhet på filnivå och filsystemssemantik med hierarkiskt namnområde.

  • Dokumentinformation är en del av Azure AI-tjänster. Dokumentinformation har inbyggda funktioner för dokumentanalys som du kan använda för att extrahera tryckt och handskriven text, tabeller och nyckel/värde-par. Document Intelligence har fördefinierade modeller för att extrahera data från fakturor, dokument, kvitton, ID-kort och visitkort. Dokumentinformation har också en anpassad mallformulärmodell och en anpassad neural dokumentmodell som du kan använda för att träna och distribuera anpassade modeller.

  • Document Intelligence Studio tillhandahåller ett användargränssnitt som du kan använda för att utforska funktioner och modeller för dokumentinformation och för att skapa, tagga, träna och distribuera anpassade modeller.

  • Azure AI Language konsoliderar bearbetningstjänsterna för naturligt språk i Azure. Sviten erbjuder fördefinierade och anpassningsbara alternativ. Mer information finns i tillgängliga funktioner för Azure AI Language.

    Language Studio tillhandahåller ett användargränssnitt för att utforska och analysera Azure AI Language-funktioner. Language Studio innehåller även alternativ för att skapa, tagga, träna och distribuera anpassade modeller.

  • Azure Machine Learning är en öppen plattform för att hantera utveckling och distribution av maskininlärningsmodeller i stor skala.

    • Azure Machine Learning-studio innehåller alternativ för dataetiketter för bilder och text.
    • Exportera märkta data som COCO - eller Azure Machine Learning-datamängder. Du kan använda datauppsättningarna för att träna och distribuera modeller i Azure Machine Learning-notebook-filer.
    • Distribuera modeller till AKS som en webbtjänst för realtidsinferens i stor skala eller som hanterade slutpunkter för både realtids- och batchinferens.

Alternativ

Du kan lägga till fler arbetsflöden i det här scenariot baserat på specifika användningsfall.

  • Om dokumentet är i bild- eller PDF-format kan du extrahera data med hjälp av Azure-visuellt innehåll, läs-API för dokumentinformation eller bibliotek med öppen källkod.

  • Du kan göra dokument- och konversationssammanfattningar med hjälp av den fördefinierade modellen i Azure AI Language.

  • Använd förbearbetningskod för att utföra textbearbetningssteg. De här stegen omfattar rensning, borttagning av stoppord, lemmatisering, härstamning och textsammanfattning för extraherade data enligt kraven för dokumentbearbetning. Du kan exponera koden som REST-API:er för automatisering. Utför dessa steg manuellt eller automatisera dem genom att integrera med logic apps - eller Azure Functions-inmatningsprocessen .

  • Du kan använda Azure AI Studio för att finjustera och distribuera grundmodeller.

Information om scenario

Dokumentbearbetning är ett brett område. Det kan vara svårt att uppfylla alla dina dokumentbearbetningsbehov med de fördefinierade modellerna som är tillgängliga i Document Intelligence och Azure AI Language. Du kan behöva skapa anpassade modeller för att automatisera dokumentbearbetningen för olika program och domäner.

Här är några av de största utmaningarna med modellanpassning:

  • Etikettera eller tagga textdata med relevanta nyckel/värde-parentiteter för att klassificera text för extrahering.
  • Distribuera modeller på ett säkert sätt i stor skala för enkel integrering med användning av program.

Potentiella användningsfall

Följande användningsfall kan dra nytta av anpassade modeller för dokumentbearbetning:

  • Skapa anpassade NER- och textklassificeringsmodeller baserat på ramverk med öppen källkod.
  • Extrahera anpassade nyckelvärden från dokument för olika branschvertaler som försäkring och sjukvård.
  • Tagga och extrahera specifika domänberoende entiteter utöver de fördefinierade NER-modellerna för domäner som säkerhet eller ekonomi.
  • Skapa anpassade tabeller från dokument.
  • Extrahera signaturer.
  • Märka och klassificera e-postmeddelanden eller andra dokument baserat på innehåll.

Att tänka på

Dessa överväganden implementerar grundpelarna i Azure Well-Architected Framework, som är en uppsättning vägledande grundsatser som kan användas för att förbättra kvaliteten på en arbetsbelastning. Mer information finns i Microsoft Azure Well-Architected Framework.

För den här exempelarbetsbelastningen beror implementeringen av varje pelare på optimal konfigurering och användning av varje komponent i Azure-tjänsten.

Tillförlitlighet

Tillförlitlighet säkerställer att ditt program kan uppfylla de åtaganden du gör gentemot dina kunder. Mer information finns i Checklista för designgranskning för tillförlitlighet.

Tillgänglighet

Motståndskraft

Säkerhet

Säkerhet ger garantier mot avsiktliga attacker och missbruk av dina värdefulla data och system. Mer information finns i Checklista för designgranskning för säkerhet.

Kostnadsoptimering

Kostnadsoptimering handlar om att titta på sätt att minska onödiga utgifter och förbättra drifteffektiviteten. Mer information finns i Checklista för designgranskning för kostnadsoptimering.

Den totala kostnaden för att implementera den här lösningen beror på prissättningen för de tjänster du väljer.

De största kostnaderna för den här lösningen är:

Mer information om priser för specifika komponenter finns i följande resurser:

Använd priskalkylatorn för Azure för att lägga till dina valda komponentalternativ och beräkna den totala lösningens kostnad.

Prestandaeffektivitet

Prestandaeffektivitet är arbetsbelastningens förmåga att skala för att uppfylla användarnas krav på ett effektivt sätt. Mer information finns i Checklista för designgranskning för prestandaeffektivitet.

Skalbarhet

  • Om du vill skala Azure Functions automatiskt eller manuellt väljer du rätt värdplan.

  • Dokumentinformation stöder 15 samtidiga begäranden per sekund som standard. Om du vill begära en ökad kvot skapar du en Azure Support biljett.

  • För anpassade Azure Machine Learning-modeller som hanteras som webbtjänster på AKS azureml-fe skalas klientdelen automatiskt efter behov. Den här komponenten dirigerar även inkommande slutsatsdragningsbegäranden till distribuerade tjänster.

  • För distributioner som hanterade slutpunkter stöder du automatisk skalning genom att integrera med autoskalningsfunktionen i Azure Monitor.

  • API-tjänstens gränser för anpassad NER - och anpassad textklassificering för slutsatsdragning är 20 GET- eller POST-begäranden per minut.

Deltagare

Den här artikeln underhålls av Microsoft. Den skrevs ursprungligen av följande deltagare.

Huvudförfattare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

Nästa steg