Deze inhoud is van toepassing op: v4.0 (preview) v3.1 (GA) v3.0 (GA) v2.1 (GA)
Azure AI Document Intelligence is een cloudservice die machine learning-modellen gebruikt om sleutel-waardeparen, tekst en tabellen uit uw documenten te extraheren. Het geretourneerde resultaat is een gestructureerde JSON-uitvoer. Document Intelligence-gebruiksscenario's omvatten geautomatiseerde gegevensverwerking, verbeterde gegevensgestuurde strategieën en verrijkte zoekmogelijkheden voor documenten.
Overzicht
Zijn Azure AI Document Intelligence en Azure AI Form Recognizer dezelfde service?
Ja.
Azure AI Document Intelligence en Azure AI Form Recognizer zijn dezelfde service. De naam van de service is gewijzigd van Azure AI Form Recognizer in Azure AI Document Intelligence in juli 2023. De service biedt dezelfde mogelijkheden en functies als vóór de hernoeming.
Prijswijzigingen: er zijn geen wijzigingen in prijzen. De namen Cognitive Services en Applied AI Services blijven worden gebruikt in Azure-facturering, kostenanalyse, prijslijsten en prijs-API's.
Belangrijke wijzigingen: Er zijn geen belangrijke wijzigingen in API's of clientbibliotheken. REST API's en SDK-versies 2024-02-29-preview, 2023-10-31-preview en nieuwere versies worden hernoemd
document intelligence
.
Kan Document Intelligence worden geïntegreerd met andere Microsoft-services?
Ja.
Document Intelligence kan worden geïntegreerd met de volgende services:
AI-mogelijkheden
Kan ik Document Intelligence gebruiken met generatieve AI voor documentverwerking?
Ja.
Document Intelligence bevat nu aangepaste generatieve een nieuw type extractiemodel dat gebruikmaakt van Generatieve AI en GROTE taalmodellen (LLM's) om velden uit documenten te extraheren. In het verleden hebt u een RAG-patroon (augmented generation ophalen) gebruikt om velden te extraheren. Het nieuwe model biedt resultaten van hoge kwaliteit met één API-aanroep. U kunt ook een documentgeneratieve AI-oplossing gebruiken om te chatten met uw documenten (RAG), boeiende inhoud van deze documenten te genereren en toegang te krijgen tot Azure OpenAI Service-modellen op uw gegevens.
Met Azure AI Document Intelligence en Azure OpenAI gecombineerd, kunt u een bedrijfstoepassing bouwen om naadloos met uw documenten te communiceren met behulp van natuurlijke taal. U kunt eenvoudig antwoorden vinden, waardevolle inzichten verkrijgen en nieuwe en aantrekkelijke inhoud genereren op basis van bestaande documenten.
Hier vindt u meer informatie over het patroon voor het ophalen van augmented generation.
Kan Document Intelligence helpen bij semantische segmentering in documenten voor het ophalen van uitgebreide generatie?
Ja.
Document Intelligence kan de bouwstenen bieden om semantische segmentering mogelijk te maken. Semantisch segmenteren is een belangrijke stap in het ophalen van augmented generation (RAG) om de context dichte segmenten en relevantieverbetering te garanderen.
Document Intelligence biedt een indelingsmodel dat een visuele ontleding van het document biedt in regels, alinea's, secties, kopteksten en voetteksten.
Vervolgens kunt u ervoor kiezen om de resultaten op te halen in markdown-indeling om het document verder te segmenteren op sectie- of alineagrenzen.
Zie overzicht van RAG in Document Intelligence voor meer informatie
Document Intelligence Studio
Heb ik specifieke machtigingen nodig voor toegang tot Document Intelligence Studio?
Ja.
U hebt een actief Azure-account en -abonnement nodig met ten minste een lezerrol voor toegang tot Document Intelligence Studio.
Voor documentanalyse en vooraf samengestelde modellen zijn dit de rolvereisten voor gebruikersscenario's:
Basis
- Cognitive Services-gebruiker: u hebt deze rol nodig voor een Document Intelligence - of Azure Cognitive Services-resource met meerdere services om Document Intelligence Studio te kunnen gebruiken.
Geavanceerd
- Inzender: u hebt deze rol nodig om een resourcegroep of een Document Intelligence-resource te maken.
Voor aangepaste modelprojecten zijn dit de rolvereisten voor gebruikersscenario's:
Basis
Cognitive Services-gebruiker: u hebt deze rol nodig voor een Document Intelligence - of Cognitive Services-resource met meerdere services om een aangepast model te trainen of te analyseren met getrainde modellen.
Inzender voor opslagblobgegevens: u hebt deze rol nodig voor een opslagaccount om project- en labelgegevens te maken.
Geavanceerd
Inzender voor opslagaccount: u hebt deze rol nodig voor het opslagaccount om CORS-instellingen (Cross-Origin Resource Sharing) in te stellen. Dit is eenmalig als u hetzelfde opslagaccount opnieuw gebruikt.
Inzender: u hebt deze rol nodig om een resourcegroep en resources te maken. Met de rol Inzender of Opslagaccountbijdrager hebt u geen toegang tot het gebruik van uw Document Intelligence-resource of opslagaccount als lokale verificatie (op basis van sleutels) is uitgeschakeld. U hebt nog steeds de basisrollen (Inzender voor Cognitive Services-gebruikers- en opslaggegevensblob) nodig om de functies in Document Intelligence Studio te kunnen gebruiken.
Zie ingebouwde Rollen van Microsoft Entra en de secties over Azure-roltoewijzingen in de quickstart voor Document Intelligence Studio voor meer informatie.
Kan ik documenten verwerken met meer dan twee pagina's in Document Intelligence Studio?
Ja, voor resources in de betaalde laag.
Nee, voor resources in de gratis laag.
Voor F0-resources (free-tier) worden alleen de eerste twee pagina's geanalyseerd of u Document Intelligence Studio, de REST API of clientbibliotheken gebruikt.
Als u alle pagina's in een document wilt analyseren, kunt u overschakelen naar een betaalde resource (S0). Selecteer in Document Intelligence Studio de knop Instellingen (tandwiel), selecteer het tabblad Resources en controleer de prijscategorie die u wilt gebruiken voor het analyseren van uw documenten.
Kan ik mappen of abonnementen wijzigen in Document Intelligence Studio?
Ja.
Als u een map wilt wijzigen in Document Intelligence Studio, selecteert u de knop Instellingen (tandwiel). Selecteer onder Map de map in de lijst en selecteer vervolgens Schakelen tussen mappen. Meld u opnieuw aan nadat u de map hebt overgeschakeld.
Als u een abonnement of resource wilt wijzigen, gaat u naar het tabblad Resource onder Instellingen.
Kan ik Document Intelligence Studio gebruiken met een resource die is geconfigureerd met een firewall of virtueel netwerk?
Ja.
Als uw Document Intelligence-resource is geconfigureerd met een firewall of virtueel netwerk, moet u het toegewezen IP-adres 20.3.165.95 toevoegen aan de acceptatielijst voor de firewall voor uw Document Intelligence-resource. Sommige functies in aangepaste projecten (bijvoorbeeld automatisch labelen, projectbeheer en menselijk in de lus) werken niet als de toegang tot het openbare netwerk is uitgeschakeld.
Wanneer ik een bestand upload in Document Intelligence Studio door de functie Ophalen uit URL te gebruiken, kan ik een URL uit mijn blobopslag gebruiken?
Ja.
Als uw AZURE Blob Storage-URL een SAS-token bevat en toegankelijk is vanuit openbare netwerken. U kunt de functie Ophalen niet gebruiken voor opslagaccounts waarbij de sleuteltoegang is uitgeschakeld of achter een firewall/VNet.
Kan ik de labelervaring van Document Intelligence Studio opnieuw gebruiken of aanpassen en deze inbouwen in mijn eigen toepassing?
Ja.
De labelervaring van Document Intelligence Studio is open source in de toolkit-opslagplaats.
Zijn er afzonderlijke URL-eindpunten voor onafhankelijke cloudregio's van Document Intelligence?
Ja.
Document Intelligence Studio heeft afzonderlijke URL-eindpunten voor onafhankelijke cloudregio's:
URL voor de Azure US Government-cloud (Azure Fairfax): Document Intelligence Studio VOOR de Amerikaanse overheid.
URL Microsoft Azure beheerd door 21Vianet (Azure China): Document Intelligence Studio China.
App-ontwikkeling
Kan ik toepassingen ontwikkelen met behulp van Azure AI Document Intelligence met behulp van de nieuwste ontwikkelopties?
Ja.
Document Intelligence biedt de nieuwste ontwikkelopties binnen de volgende platforms:
[REST API](/rest/api/aiservices/document-models/analyze-document?view=rest-aiservices-2023-07-31 &preserve-view=true&tabs=HTTP)
Kan ik mijn toepassing migreren naar de nieuwste versie van Document Intelligence?
Ja.
De volgende tabel bevat koppelingen naar gedetailleerde instructies voor het migreren naar de nieuwste versie van Document Intelligence:
Taal/API | Migratiehandleiding |
---|---|
REST-API | v3 |
C#/.NET | 4.0.0 |
Java | 4.0.0 |
JavaScript | 4.0.0 |
Python | 3.2.0 |
Kan ik een reeks pagina's opgeven die in een document moeten worden geanalyseerd?
Ja.
Gebruik de pages
parameter (ondersteund in v2.1, v3.0 en latere versies van de REST API) en geef pagina's op voor PDF- en TIFF-documenten met meerdere pagina's. Geaccepteerde invoer bevat de volgende bereiken:
- Eén pagina. Als u bijvoorbeeld opgeeft
1, 2
, worden pagina's 1 en 2 verwerkt. - Eindige bereiken. Als u bijvoorbeeld opgeeft
2-5
, worden pagina's 2 tot en met 5 verwerkt. - Open-eindbereiken. Als u bijvoorbeeld opgeeft
5-
, worden alle pagina's van pagina 5 verwerkt. Als u opgeeft-10
, worden pagina's 1 tot en met 10 verwerkt.
U kunt deze parameters combineren en bereiken kunnen elkaar overlappen. Als u bijvoorbeeld opgeeft -5, 1, 3, 5-10
, worden pagina's 1 tot en met 10 verwerkt.
De service accepteert de aanvraag als deze ten minste één pagina van het document kan verwerken. Het gebruik van een document met 5-100
vijf pagina's is bijvoorbeeld een geldige invoer die betekent dat pagina 5 wordt verwerkt.
Als u geen paginabereik opgeeft, wordt het hele document verwerkt.
Raadt u aan Om Document Intelligence Studio te gebruiken in plaats van het FOTT-voorbeeldhulpprogramma voor labelen voor mijn project?
Ja.
We raden Document Intelligence Studio meestal aan, omdat het uw tijd voor het configureren van Document Intelligence-resources en opslagservices kan verminderen.
Overweeg alleen het hulpprogramma voor formuliertests (FOTT) te gebruiken voor de volgende scenario's:
Uw gegevens moeten binnen één computer blijven. Gebruik het hulpprogramma FOTT-voorbeeldlabels en een Document Intelligence-container.
Uw project is sterk afhankelijk van Document Intelligence V2.1 en u wilt de v2.1-API's blijven gebruiken.
Zijn er best practices om beperking te beperken?
Ja.
Document Intelligence maakt gebruik van automatisch schalen om de vereiste rekenbronnen op aanvraag te leveren, terwijl de kosten van klanten laag blijven. Als u de beperking tijdens automatisch schalen wilt beperken, raden we u aan de volgende methode te gebruiken:
Implementeert logica voor opnieuw proberen in uw toepassing.
Als u merkt dat u wordt beperkt tot het aantal
POST
aanvragen, kunt u overwegen om een vertraging tussen de aanvragen toe te voegen.Verhoog de workload geleidelijk. Vermijd scherpe wijzigingen.
Maak een ondersteuningsaanvraag om de limiet voor transacties per seconde (TPS) te verhogen.
Meer informatie over quota en limieten voor document intelligence-services.
Aangepaste modellen
Kan ik een geschatte nauwkeurigheidsscore voor een aangepast model verbeteren?
Ja.
Afwijkingen in de visuele structuur van uw documenten kunnen van invloed zijn op de nauwkeurigheid van een model. Hier volgen enkele tips:
Neem alle variaties van een document op in de trainingsgegevensset. Variaties bevatten verschillende indelingen; Bijvoorbeeld digitale versus gescande PDF-bestanden.
Afzonderlijke visueel afzonderlijke documenttypen en verschillende modellen trainen.
Zorg ervoor dat u geen overbodige labels hebt.
Neem de omliggende tekst niet op voor het labelen van handtekeningen en regio's.
Zie Nauwkeurigheid en betrouwbaarheidsscores voor meer informatie.
Kan ik een aangepast model opnieuw trainen?
Nee.
Document Intelligence heeft geen expliciete hertrainbewerking. Elke treinbewerking genereert een nieuw model.
Als u merkt dat uw model opnieuw moet worden getraind, kunt u meer voorbeelden toevoegen aan uw trainingsgegevensset en een nieuw model trainen.
U kunt ook als volgt een nieuw model maken dat u samenstelt met uw oorspronkelijke model:
Maak een gegevensset voor uw nieuwe sjabloon.
Een nieuw model labelen en trainen.
Controleer of het nieuwe model goed presteert voor uw specifieke documenttypen.
Stel uw nieuwe model samen met het bestaande model in één eindpunt. Document Intelligence kan vervolgens het beste model bepalen voor elk document dat moet worden geanalyseerd.
Zie samengestelde modellen voor meer informatie.
Kan ik mijn getrainde modellen verplaatsen van de ene omgeving (zoals bèta) naar een andere (zoals productie)?
Ja.
U kunt de Copy-API gebruiken om aangepaste modellen van het ene Document Intelligence-account te kopiëren naar andere modellen die in elke ondersteunde geografische regio bestaan. Zie Herstel na noodgevallen voor gedetailleerde instructies.
De kopieerbewerking is beperkt tot het kopiëren van modellen in de specifieke cloudomgeving waar u het model hebt getraind. Het kopiëren van modellen van de openbare cloud naar de Azure Government-cloud wordt bijvoorbeeld niet ondersteund.
Worden er kosten in rekening gebracht bij het trainen van aangepaste modellen?
Ja.
Training is gratis voor alle aangepaste generatieve en aangepaste sjabloonmodellen. Voor het maken van de trainingsgegevensset voor alle modellen is het uitvoeren van het indelingsmodel echter vereist voor de trainingsdocumenten. Klanten zijn verantwoordelijk voor deze kosten.
Aangepaste generatieve modellen zijn ook afhankelijk van de functie voor automatisch labelen om de generatie van de gelabelde gegevensset te versnellen. Er zijn kosten verbonden aan deze actie. Hoewel de bouwbewerking voor sjabloon- en generatieve modellen gratis is, kan het maken van de gelabelde gegevensset leiden tot een aantal minimale kosten.
Aangepaste v4.0 2024-07-31-preview
neurale modellen kunnen maximaal 10 uur gratis worden getraind. Of u nu één model traint voor de 10 uur of meerdere modellen traint voor het totaal van 10 uur, er worden geen kosten in rekening gebracht voor de eerste 10 uur. Nadat u de gratis 10 uur hebt gebruikt, worden er automatisch kosten in rekening gebracht door het extra trainingsuur. Raadpleeg de pagina met prijzen voor meer informatie over de prijzen. Met deze nieuwe betaalde trainingsfunctie kunnen trainingsmodellen voor een langere duur grotere documenten verwerken. Raadpleeg de sectie aangepaste facturering van neurale modellen voor meer informatie over deze betaalde trainingsfunctie.
v3.1 2023-07-31
Aangepaste v3.0 2022-08-31
neurale modellen kunnen gratis worden getraind voor maximaal 20 trainingssessies, waarbij elke sessie is beperkt tot 30 minuten trainingsduur. Zodra u alle 20 trainingssessies hebt gebruikt, kunt u ondersteuning voor Azure ticket indienen om de limiet voor de trainingssessie te verhogen. Als u de limiet wilt verhogen, worden twee trainingssessies beschouwd als één trainingsuur en worden er kosten in rekening gebracht per twee sessies/één trainingsuur. Raadpleeg de [pagina met prijzen] voor meer informatie over de prijzen. Raadpleeg de sectie aangepaste facturering van neurale modellen voor meer informatie over manieren om de limiet te verhogen. v3.1
Betaalde v3.0
trainingsfunctie is niet beschikbaar. Betaalde trainingsfunctie voor aangepast neuraal model is alleen beschikbaar op v4.0
.
Opslagaccount
Is er een verlooptijd voor het SAS-token (Shared Access Signature) dat ik voor verificatie van mijn opslagaccount heb?
Ja.
Wanneer u een Shared Access Signature (SAS) maakt, is de standaardduur 48 uur. Na 48 uur moet u een nieuw token maken.
Overweeg om een langere periode in te stellen voor de tijd dat u uw opslagaccount gebruikt met Document Intelligence.
Heeft Document Intelligence toegang tot gegevens in mijn opslagaccount als deze zich achter een virtueel netwerk of een firewall bevindt?
Nee, niet rechtstreeks.
Document Intelligence heeft geen toegang tot uw opslagaccount als het wordt beveiligd door een virtueel netwerk of een firewall.
Toegang tot en verificatie van privé-Azure-opslagaccounts ondersteunen echter beheerde identiteiten voor Azure-resources. Wanneer u een beheerde identiteit gebruikt, heeft de Document Intelligence-service toegang tot uw opslagaccount met behulp van een toegewezen referentie.
Als u uw persoonlijke opslagaccountgegevens wilt analyseren met behulp van FOTT, moet u het hulpprogramma achter het virtuele netwerk of de firewall implementeren.
Meer informatie over het maken en gebruiken van een beheerde identiteit voor uw Document Intelligence-resource.
Containers
Is er een verschil tussen niet-verbonden en verbonden containers?
Ja.
Hoewel de modelmogelijkheden hetzelfde zijn voor verbonden en niet-verbonden containers, verschillen de facturerings- en connectiviteitsmethoden:
Verbonden containers verzenden factureringsgegevens naar Azure met behulp van een Document Intelligence-resource in uw Azure-account. Bij verbonden containers is internetverbinding vereist om factureringsgegevens naar Azure te verzenden. Met Document Intelligence verbonden containers verzenden factureringsgegevens naar Azure met behulp van een Document Intelligence-resource in uw Azure-account. Verbonden containers verzenden geen klantgegevens, zoals de afbeelding of tekst die wordt geanalyseerd, naar Microsoft. Zie de veelgestelde vragen over azure AI-containers voor een voorbeeld van de informatie die verbonden containers naar Microsoft verzenden voor facturering.
Met niet-verbonden containers kunt u API's gebruiken die zijn losgekoppeld van internet. Factureringsgegevens worden niet via internet verzonden. In plaats daarvan zijn kosten gebaseerd op een aangeschafte toezeggingslaag. Momenteel is het gebruik van niet-verbonden containers beschikbaar voor aangepaste Document Intelligence- en factuurmodellen.
Kan ik lokale opslag gebruiken voor de FOTT-container (Document Intelligence Sample Labeling Tool) ?
Ja.
FOTT heeft een versie die gebruikmaakt van lokale opslag. De versie moet worden geïnstalleerd op een Windows-computer. U kunt het installeren vanaf deze locatie.
Geef op de projectpagina de labelmap-URI op als /shared of /shared/sub-dir als uw labelbestanden zich in een submap bevinden. Alle andere gedrag van het hulpprogramma voor het labelen van documentinformatie is hetzelfde als de gehoste service.
Is er een best practice voor omhoog schalen?
Ja.
Voor asynchrone aanroepen kunt u meerdere containers uitvoeren met gedeelde opslag. De container die de analyseoproep POST
verwerkt, slaat de uitvoer op in de opslag. Vervolgens kan elke andere container de resultaten ophalen uit de opslag en de GET
aanroepen verwerken. De aanvraag-id is niet gekoppeld aan een container.
Voor synchrone aanroepen kunt u meerdere containers uitvoeren, maar slechts één container dient een aanvraag. Omdat het een blokkerende aanroep is, kan elke container uit de pool de aanvraag verwerken en het antwoord verzenden. Hier is slechts één container gekoppeld aan een aanvraag tegelijk en is er geen polling vereist.
Kan ik containers instellen met gedeelde opslag?
Ja.
De containers gebruiken de eigenschap tijdens het Mounts: Shared
opstarten voor het opgeven van de gedeelde opslag om de verwerkingsbestanden op te slaan. Raadpleeg de documentatie voor containers om het gebruik van deze eigenschap te bekijken.
Beveiliging en privacy
Worden mijn gegevens opgeslagen in Document Intelligence?
Ja, kort.
Voor alle functies slaat Document Intelligence gegevens tijdelijk op en resulteert dit in Azure Storage in dezelfde regio als de aanvraag. Uw gegevens worden vervolgens binnen 24 uur verwijderd vanaf het moment dat u een analyseaanvraag indient.
Meer informatie over gegevens, privacy en beveiliging voor Document Intelligence.
Voor getrainde aangepaste modellen worden de tussentijdse uitvoer na analyse en labeling opgeslagen op dezelfde Azure Storage-locatie waar u uw trainingsgegevens opslaat. De getrainde aangepaste modellen worden opgeslagen in Azure Storage in dezelfde regio en worden logisch geïsoleerd met uw Azure-abonnement en API-referenties.
Meer hulp en ondersteuning
Zijn er andere resources beschikbaar om oplossingen te bieden voor vragen over Azure AI Document Intelligence?
Ja.
Microsoft Q &A is de thuisbasis voor technische vragen en antwoorden bij Microsoft. U kunt query's filteren die specifiek zijn voor Document Intelligence.
Kan ik direct feedback geven als de service specifieke tekst niet herkent of deze onjuist herkent wanneer ik documenten label?
Ja.
We werken de Document Intelligence-modellen voortdurend bij en verbeteren deze. U kunt het Document Intelligence-team e-mailen. Deel indien mogelijk een voorbeelddocument met het probleem gemarkeerd.