Bearbeiten

Häufig gestellte Fragen zur Azure AI-Dokument Intelligenz

Dieser Inhalt gilt für:Häkchenv4.0 (Vorschau)Häkchenv3.1 (allgemein verfügbar)Häkchenv3.0 (allgemein verfügbar)Häkchenv2.1 (allgemein verfügbar)

Allgemeine Konzepte

Was ist Azure KI Dokument Intelligenz, und was ist aus der Azure KI-Formularerkennung geworden?

Azure KI Dokument Intelligenz ist ein cloudbasierter Dienst, bei dem Machine Learning-Modelle zum Extrahieren von Schlüssel-Wert-Paaren, Text und Tabellen aus Ihren Dokumenten verwendet werden. Das zurückgegebene Ergebnis ist eine strukturierte JSON-Ausgabe. Anwendungsfälle für Dokument Intelligenz sind u. a. die Automatisierung der Datenverarbeitung, die Verbesserung datengesteuerter Strategien und die Anreicherung von Suchfunktionen für Dokumente.

Dokument Intelligenz ist Teil der Azure KI-Dienste. Azure KI Services umfasst alle bisher als Azure Cognitive Services und Azure Applied AI Services bezeichneten Dienste.

Der vorherige Name für Dokument Intelligenz war Azure KI-Formularerkennung. Formularerkennung wurde offiziell zu Dokument Intelligenz im Juli 2023.

Es gibt keine Änderungen an den Preisen. Die Namen „Cognitive Services“ und „Applied AI Services“ werden in Abrechnungs-, Kostenanalyse-, Preislisten- und Preis-APIs von Azure weiterhin verwendet.

Es gibt keine wichtigen Änderungen an APIs oder Clientbibliotheken (SDKs). REST-APIs und SDK-Versionen 2024-02-29-preview, 2023-10-31-preview und höher werden in document intelligence umbenannt.

Einige Plattformen warten noch auf das Update mit der Umbenennung. In der Microsoft-Dokumentation beziehen sich alle Erwähnungen der Formularerkennung und Dokument Intelligenz auf denselben Azure-Dienst.

In welchem Zusammenhang stehen Dokument Intelligenz und generative KI für Dokumente?

Sie können eine generative KI-Lösung für Dokumente verwenden, um mit Ihren Dokumenten zu kommunizieren, Inhalte aus diesen Dokumenten zu generieren und Azure OpenAI Service-Modelle auf Ihre Daten anzuwenden. Mit Azure KI Dokument Intelligenz und Azure OpenAI können Sie eine Unternehmensanwendung entwickeln, die unter Verwendung natürlicher Sprachen nahtlos mit Ihren Dokumenten interagiert, mühelos Antworten findet und wertvolle Erkenntnisse liefert sowie aus Ihren bereits vorhandenen Dokumenten einfach neue und ansprechende Inhalte generiert. Weitere Informationen finden Sie im Blog der technischen Community.

Wie steht Dokument Intelligenz mit RAG (Retrieval Augmented Generation) in Zusammenhang?

Die Bildung semantischer Blöcke ist ein wichtiger Schritt in RAG (Retrieval Augmented Generation), um das effiziente Speichern und Abrufen zu gewährleisten. Das Dokument Intelligenz-Layoutmodell ist eine umfassende Lösung für erweiterte Extraktion von Inhalten und Analyse der Dokumentenstruktur.

Mit dem Layoutmodell können Sie Text- und Strukturelemente einfach extrahieren, um große Textmengen in kleinere, aussagekräftige Abschnitte zu unterteilen, die auf dem semantischen Inhalt und nicht auf willkürlichen Unterteilungen basieren. Sie können die extrahierten Informationen dann bequem im Markdown-Format ausgegeben werden, sodass Sie Ihre Strategie für die Bildung semantischer Blöcke auf der Grundlage der bereitgestellten Bausteine definieren können. Weitere Details finden Sie in der Übersicht über RAG in Dokument Intelligenz.

Welche Anwendungsfälle von Dokument Intelligenz bedürfen einer besonderen Betrachtung?

Gehen Sie bei Dokumentverarbeitungsprojekten, die Finanzdaten, geschützte Gesundheitsdaten, persönliche oder hochsensible Daten umfassen, besonders umsichtig vor.

Stellen Sie sicher, dass alle nationalen, regionalen und branchenspezifischen Anforderungen erfüllt werden.

Welche Sprachen werden von Dokument Intelligenz unterstützt?

Die auf Deep Learning basierenden universellen Modelle von Dokument Intelligenz unterstützen eine Vielzahl von Sprachen und können mehrsprachige Texte aus Ihren Bildern und Dokumenten extrahieren, darunter auch Textzeilen mit gemischten Sprachen.

Die Sprachunterstützung variiert je nach Funktionalität des Dokument Intelligenz-Diensts. Unter Sprachunterstützung finden Sie eine vollständige Liste der handschriftlichen und gedruckten Texte, die von Dokument Intelligenz unterstützt werden.

Steht Dokument Intelligenz in meiner Azure-Region zur Verfügung?

Dokument Intelligenz ist in vielen der mehr als 60 globalen Azure-Infrastrukturregionen allgemein verfügbar.

Wählen Sie die Region aus, die für Sie und Ihre Kunden optimal ist.

Kann Dokument Intelligenz in andere Microsoft-Dienste integriert werden?

Ja, Dokument Intelligenz kann in die folgenden Dienste integriert werden:

Wie arbeitet Dokument Intelligenz mit der optischen Zeichenerkennung (OCR)?

Dokument Intelligenz ist ein cloudbasierter Dienst, der die optische Zeichenerkennung (OCR), die Textanalyse und die benutzerdefinierte Textklassifizierung von Azure KI-Diensten enthält.

Dokument Intelligenz verwendet OCR zum Erkennen und Extrahieren von Informationen aus Schriftarten und handschriftlichen Textdokumenten, was von KI unterstützt wird, um mehr Struktur und Informationen für die Textextraktion bereitzustellen.

Wie lange kann ich mein benutzerdefiniertes Modell verwenden?

Ein Modell verfügt über den gleichen Lebenszyklus wie die API-Version, die Sie zum Trainieren verwenden. Benutzerdefinierte Modelle, die mit einer allgemein verfügbaren (GA) Version der API trainiert werden, haben den gleichen Lebenszyklus wie die API-Version. Wenn die API-Version veraltet ist, steht das Modell nicht mehr für Rückschlüsse zur Verfügung. Modelle, die mit einer Vorschauversion der API trainiert werden, haben auch den gleichen Lebenszyklus wie die Vorschau-API.

Gehen Sie davon aus, dass Vorschau-APIs innerhalb von drei Monaten nach einer aktualisierten Vorschau-API-Version oder einer neueren allgemein verfügbaren API-Version veraltet sind.

Was ist die Genauigkeitsbewertung und wie wird sie berechnet?

Die Ausgabe eines benutzerdefinierten Modellvorgangs build(v3.0 und höher)train oder (v2.1) enthält den geschätzten Genauigkeitsscore. Diese Bewertung stellt die Fähigkeit des Modells dar, den beschrifteten Wert in einem visuell ähnlichen Dokument genau vorherzusagen.

Die Genauigkeit wird innerhalb eines Prozentwertbereichs von 0 % (niedrig) bis 100 % (hoch) gemessen.

Weitere Informationen finden Sie unter Genauigkeits- und Konfidenzbewertungen.

Wie kann ich Genauigkeitsbewertungen verbessern?

Varianzen in der visuellen Struktur Ihrer Dokumente könnend die Genauigkeit eines Modells beeinflussen. Hier finden Sie einige Tipps:

  • Schließen Sie alle Variationen eines Dokuments in das Schulungsdatenset ein. Variationen umfassen verschiedene Formate, z. B. digitale und gescannte PDF-Dateien.

  • Trennen Sie visuell unterschiedliche Dokumenttypen, und trainieren Sie verschiedene Modelle.

  • Stellen Sie sicher, dass keine überflüssigen Beschriftungen vorhanden sind.

  • Schließen Sie beim Beschriften von Unterschriften und Bereichen den umgebenden Text nicht ein.

Weitere Informationen finden Sie unter Genauigkeits- und Konfidenzbewertungen.

Was ist die Konfidenzbewertung und wie wird sie berechnet?

Ein Konfidenz-Score gibt die Wahrscheinlichkeit an, indem der Grad der statistischen Sicherheit gemessen wird, dass das extrahierte Ergebnis ordnungsgemäß erkannt wurde.

Der Konfidenzwertbereich ist ein Prozentsatz von 0 % (niedrig) bis 100 % (hoch). Es ist am besten, eine Bewertung von 80 % oder höher zu erzielen. In sensibleren Fällen, z. B. bei Finanz- oder Patientendatensätzen, empfehlen wir eine Bewertung von fast 100 %. Möglicherweise ist auch eine Überprüfung durch Personen erforderlich.

Weitere Informationen finden Sie unter Genauigkeits- und Konfidenzbewertungen.

Wie lassen sich Konfidenzbewertungen verbessern?

Überprüfen Sie nach einem Analysevorgang die JSON-Ausgabe. Überprüfen Sie die confidence-Werte für jedes Schlüssel-Wert-Ergebnis unter dem Knoten pageResults. Sie sollten sich auch die Konfidenzbewertungen im Knoten readResults ansehen, die dem Textlesevorgang entsprechen. Die Konfidenz der Leseergebnisse wirkt sich nicht auf die Konfidenz der Ergebnisse der Schlüssel-Wert-Extraktion aus, daher sollten Sie beide Bewertungen überprüfen. Hier finden Sie einige Tipps:

  • Wenn die Konfidenzbewertung für das readResults-Objekt niedrig ist, verbessern Sie die Qualität Ihrer Eingabedokumente.

  • Wenn die Konfidenzbewertung für das pageResults-Objekt niedrig ist, stellen Sie sicher, dass die analysierten Dokumente denselben Typ haben.

  • Erwägen Sie, die Überprüfung durch eine Person in Ihre Workflows zu integrieren.

  • Verwenden Sie Formulare mit unterschiedlichen Werten in jedem Feld.

  • Verwenden Sie für benutzerdefinierte Modelle einen größeren Satz von Trainingsdokumenten. Durch Markieren von mehr Dokumenten lernt Ihr Modell, Felder mit höherer Genauigkeit zu erkennen.

Weitere Informationen finden Sie unter Genauigkeits- und Konfidenzbewertungen.

Was ist ein Begrenzungsrahmen?

Ein Begrenzungsrahmen (polygon in v3.0 und höheren Versionen) ist ein abstraktes Rechteck, das Textelemente in einem Dokument oder Formular umgibt. Es wird als Referenzpunkt für die Objekterkennung verwendet.

Der Begrenzungsrahmen gibt die Position mithilfe einer x- und y-Koordinatenebene an, die als Array von vier numerischen Paaren dargestellt wird. Jedes Paar stellt eine Ecke des Felds in der folgenden Reihenfolge dar: oben links, oben rechts, unten rechts, unten links.

Bei einem Bild werden die Koordinaten in Pixel angegeben. Bei einer PDF-Datei werden die Koordinaten in Zoll angegeben.

Kann Dokument Intelligenz mich bei der Klassifizierung von Dokumenten unterstützen?

Dokument Intelligenz bietet benutzerdefinierte Klassifizierungsmodelle, die Dokumente mit einzelnen oder mehreren Dateien analysieren können, um zu ermitteln, ob einer der trainierten Dokumenttypen in einer Eingabedatei enthalten ist. Der Dienst unterstützt die folgenden Szenarien:

  • Eine einzelne Datei, die einen Dokumenttyp enthält, z. B. ein Formular für einen Darlehensantrag.

  • Eine einzelne Datei, die mehrere Dokumente enthält. Ein Beispiel ist ein Kreditantragspaket, das ein Kreditantragsformular, eine Lohnabrechnung und einen Bankauszug enthält.

  • Eine einzelne Datei, die mehrere Instanzen desselben Dokuments enthält. Ein Beispiel ist eine Sammlung gescannter Rechnungen.

Weitere Informationen finden Sie in der Übersicht über benutzerdefinierte Klassifizierungsmodelle.

App-Entwicklung

Welche Entwicklungsoptionen stehen für Dokument Intelligenz zur Verfügung?

Dokument Intelligenz bietet die neuesten Entwicklungsoptionen innerhalb der folgenden Plattformen:

Wo finde ich die unterstützte API-Version für die neuesten Programmiersprachen-SDKs?

Diese Tabelle enthält Links zu den neuesten SDK-Versionen und zeigt die Beziehung zwischen unterstützten Versionen von Dokument Intelligenz-SDK und -API:

Unterstützte Sprach-Azure SDK-Referenz Unterstützte API-Versionen
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-preview
v3.0
v2.1
v2.0

Weitere Informationen finden Sie unter Unterstützte Clients für v4.0 und Unterstützte Clients für v3.1.

Was unterscheidet Dokument Intelligenz v3.0 von v2.1, und wie kann ich auf die neueste Version migrieren?

Zur Verbesserung der Benutzerfreundlichkeit wird mit Dokument Intelligenz v3.0 eine vollständig neu gestaltete Clientbibliothek eingeführt. Um die neuesten Features der Dokument Intelligenz-API erfolgreich nutzen zu können, wird das aktuelle SDK benötigt, und Ihr Anwendungscode muss für die Nutzung der neuen Clients aktualisiert werden.

Die folgende Tabelle enthält Links zu detaillierten Anweisungen für die Migration zur neuesten Version von Dokument Intelligenz:

Sprache/API Migrationsleitfaden
REST-API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Welche Dateiformate werden von Dokument Intelligenz unterstützt? Gibt es Größenbeschränkungen bei Eingabedokumenten?

Informationen dazu, wie Sie die besten Ergebnisse erzielen, finden Sie unter Eingabeanforderungen.

Wie kann ich einen Seitenbereich angeben, der in einem Dokument analysiert werden soll?

Verwenden Sie den Parameter pages (in Version 2.1, 3.0 und höher der REST-API unterstützt), um Seiten für PDF- und TIFF-Dokumente mit mehreren Seiten anzugeben. Die akzeptierte Eingabe umfasst die folgenden Bereiche:

  • Einzelne Seiten. Wenn Sie beispielsweise 1, 2 angeben, werden die Seiten 1 und 2 verarbeitet.
  • Endliche Bereiche. Wenn Sie beispielsweise 2-5 angeben, werden die Seiten 2 bis 5 verarbeitet.
  • Nach hinten offene Bereiche. Wenn Sie beispielsweise 5- angeben, werden alle Seiten von Seite 5 an verarbeitet. Wenn Sie -10 angeben, werden die Seiten 1 bis 10 verarbeitet.

Sie können diese Parameter miteinander kombinieren, und Bereiche können sich überlappen. Wenn Sie beispielsweise -5, 1, 3, 5-10 angeben, werden die Seiten 1 bis 10 verarbeitet.

Der Dienst akzeptiert die Anforderung, wenn er mindestens eine Seite des Dokuments verarbeiten kann. Die Verwendung von 5-100 für ein fünfseitiges Dokument ist beispielsweise eine gültige Eingabe, bei der die Seite 5 verarbeitet wird.

Wenn Sie keinen Seitenbereich angeben, wird das gesamte Dokument verarbeitet.

Es stehen sowohl Dokument Intelligenz Studio als auch das FOTT-Tool für die Beschriftung von Beispielen zur Verfügung. Was sollte ich verwenden?

In den meisten Fällen empfehlen wir Dokument Intelligenz Studio, da es die benötigte Zeit für die Konfiguration von Dokument Intelligenz-Ressourcen und Speicherdiensten reduzieren kann.

Erwägen Sie die Verwendung des Form OCR Testing Tool (FOTT) bei den folgenden Szenarien:

Dienstgrenzwerte und Preise

Wie berechnet Azure die Kosten für die Nutzung von Dokument Intelligenz?

Die Abrechnung von Dokument Intelligenz erfolgt monatlich, basierend auf dem Modelltyp und der Anzahl von analysierten Seiten. Hier sind einige Details:

  • Wenn Sie ein Dokument zur Analyse übermitteln, analysiert der Dienst alle Seiten, es sei denn, Sie geben einen Seitenbereich mithilfe des pages-Parameters in Ihrer Anforderung an. Wenn der Dienst Microsoft Excel- und PowerPoint-Dokumente über das Lese-, OCR- oder Layoutmodell analysiert, zählt er jedes Excel-Arbeitsblatt und jede PowerPoint-Folie als eine Seite.

  • Wenn der Dienst PDF- und TIFF-Dateien analysiert, zählt er jede Seite in der PDF-Datei oder jedes Bild in der TIFF-Datei als eine Seite und hat keine maximale Zeichenbeschränkungen.

  • Wenn der Dienst Microsoft Word- und HTML-Dateien analysiert, die von den Lese- und Layoutmodellen unterstützt werden, zählt er Seiten in Blöcken von jeweils 3.000 Zeichen. Wenn Ihr Dokument z. B. 7.000 Zeichen enthält, ergeben sich zwei Seiten mit je 3.000 Zeichen und eine Seite mit 1.000 Zeichen, insgesamt also drei Seiten.

  • Wenn Sie das Lese- oder Layoutmodell zum Analysieren von Microsoft Word-, Excel-, PowerPoint- und HTML-Dateien verwenden, werden eingebettete oder verknüpfte Bilder nicht unterstützt. Der Dienst zählt sie also nicht als hinzugefügte Bilder.

  • Das Training eines benutzerdefinierten Modells mit Dokument Intelligenz ist immer kostenfrei. Es wird nur berechnet, wenn der Dienst ein Modell zum Analysieren eines Dokuments verwendet.

  • Die Preise für Container entsprechen den Preisen für Clouddienste.

  • Dokument Intelligenz bietet einen kostenlosen Tarif (F0), mit dem Sie alle Features von Dokument Intelligenz testen können.

  • Dokument Intelligenz bietet für große Workloads ein Preismodell mit Mindestabnahme an.

Erfahren Sie mehr über die Preisoptionen von Azure KI Dokument Intelligenz.

Wie kann ich meine Nutzung von Dokument Intelligenz überprüfen und die Kosten abschätzen?

Sie finden Nutzungsmetriken im Metrikendashboard im Azure-Portal. Das Dashboard zeigt die Anzahl der von Azure KI Dokument Intelligenz verarbeiteten Seiten an. Sie können die geschätzten Kosten für die Ressource mithilfe des Azure-Preisrechners überprüfen. Ausführliche Anweisungen finden Sie unter Überprüfen der Nutzung und Schätzen der Kosten.

Welche bewährten Methoden gibt es, um die Drosselung zu verringern?

Dokument Intelligenz nutzt die automatische Skalierung, um die erforderlichen Computeressourcen nach Bedarf bereitzustellen und gleichzeitig die Kosten für die Kund*innen niedrig zu halten. Um die Drosselung während der automatischen Skalierung zu minimieren, empfehlen wir den folgenden Ansatz:

  • Implementieren Sie eine Wiederholungslogik in der Anwendung.

  • Wenn Sie feststellen, dass die Anzahl der POST-Anforderungen gedrosselt wird, sollten Sie eine Verzögerung zwischen den Anforderungen hinzufügen.

  • Erhöhen Sie die Workload nach und nach. Vermeiden Sie abrupte Änderungen.

  • Erstellen Sie eine Supportanfrage, um den TPS-Grenzwert (Transaktionen pro Sekunde) zu erhöhen.

Erfahren Sie mehr über die Dienstkontingente und Limits für Dokument Intelligenz.

Wie lange dauert die Analyse eines Dokuments?

Die Dauer einer Dokumentanalyse hängt von der Größe (z. B. Anzahl von Seiten) und vom Inhalt der einzelnen Seiten ab.

Dokument Intelligenz ist ein mehrinstanzenfähiger Dienst, bei dem die Latenz für ähnliche Dokumente vergleichbar, aber nicht immer identisch ist. Latenz ist die Zeit, die ein API-Server benötigt, um eine eingehende Anforderung zu behandeln und zu verarbeiten und die ausgehende Antwort an den Client zu senden. Gelegentliche Variabilität bei Latenz und Leistung ist in jedem auf Microservices basierenden, zustandslosen, asynchronen Dienst, der Bilder und große Dokumente im großen Stil verarbeitet, inhärent.

Obwohl wir die Hardware-, Kapazitäts- und Skalierungsfunktionen kontinuierlich hochskalieren, können zur Laufzeit weiterhin Latenzprobleme auftreten.

Benutzerdefinierte Modelle

Wie stelle ich die besten Trainingsdaten zusammen?

Wenn Sie das benutzerdefinierte Modell von Dokument Intelligenz verwenden, stellen Sie Ihre eigenen Trainingsdaten zur Verfügung. Im Folgenden finden Sie einige Tipps zum effektiven Trainieren Ihrer Modelle:

  • Verwenden Sie nach Möglichkeit textbasierte anstelle von bildbasierten PDF-Dateien. Eine Möglichkeit, eine bildbasierte PDF-Datei zu identifizieren, besteht darin, bestimmten Text im Dokument auszuwählen. Wenn Sie nur das gesamte Bild des Texts auswählen können, ist das Dokument bildbasiert und nicht textbasiert.

  • Strukturieren Sie Ihre Trainingsdokumente mithilfe eines Unterordners für jedes Format (JPEG/JPG, PNG, BMP, PDF oder TIFF).

  • Verwenden Sie Formulare, in denen alle verfügbaren Felder ausgefüllt sind.

  • Verwenden Sie Formulare mit verschiedenen Werten in allen Feldern.

  • Wenn Ihre Bilder eine niedrige Qualität aufweisen, verwenden Sie ein größeres Dataset (mehr als fünf Trainingsdokumente).

Weitere Informationen zum Erstellen eines Trainingsdatensatzes.

Was sind bewährte Methoden zum Trainieren eines äußerst präzisen benutzerdefinierten Modells?

Der Grad der Genauigkeit für Ihr Modell hängt von der Qualität Ihrer Trainingsmaterialien ab. Hier finden Sie einige Tipps:

  • Bestimmen Sie, ob Sie ein einzelnes Modell oder mehrere Modelle verwenden müssen, die aus einem einzelnen Modell bestehen.

  • Die Modellgenauigkeit kann abnehmen, wenn Sie verschiedene Formate mit einem einzelnen Modell analysieren. Planen Sie die Segmentierung Ihres Datasets in Ordner, wobei jeder Ordner eine eindeutige Vorlage ist. Trainieren Sie ein Modell pro Ordner, und stellen Sie die resultierenden Modelle zu einem einzelnen Endpunkt zusammen.

  • Benutzerdefinierte Formulare basieren auf einer konsistenten visuellen Vorlage. Wenn Ihr Formular Variationen mit Formaten und Seitenumbrüchen aufweist, sollten Sie das Dataset segmentieren, um mehrere Modelle zu trainieren.

  • Stellen Sie sicher, dass Sie über ein ausgewogenes Dataset verfügen, indem Sie Formate, Dokumenttypen und Struktur berücksichtigen.

Weitere Informationen über zusammengestellte Modelle.

Kann ich ein benutzerdefiniertes Modell erneut trainieren?

Dokument Intelligenz bietet keinen expliziten Vorgang zum erneuten Trainieren. Jeder Trainingsvorgang generiert ein neues Modell.

Wenn Sie feststellen, dass Ihr Modell erneut trainiert werden muss, fügen Sie Ihrem Trainingsdatensatz weitere Beispiele hinzu, und trainieren Sie ein neues Modell.

Wie viele benutzerdefinierte Modelle kann ich zu einem einzelnen benutzerdefinierten Modell zusammenstellen?

Mit dem Vorgang zum Zusammenstellen eines Modells können Sie einer einzelnen Modell-ID bis zu 200 Modelle zuweisen. Wenn Sie die Anforderung Analyze Document mit der ID eines zusammengestellten Modells erstellen, klassifiziert Dokument Intelligenz das übermittelte Formular, wählt das beste Modell aus und gibt die Ergebnisse zurück. Derzeit können nur benutzerdefinierte Modelle zusammengestellt werden, die mit Beschriftungen trainiert wurden.

Das Analysieren eines Dokuments mithilfe zusammengesetzter Modelle ist identisch mit der Analyse eines Dokuments mithilfe eines einzelnen Modells. Das Analyze Document-Ergebnis gibt eine docType-Eigenschaft zurück, die angibt, welche Komponentenmodelle Sie für die Analyse des Dokuments ausgewählt haben. Die Preise für die Analyse eines Dokuments mithilfe eines individuellen benutzerdefinierten Modells oder eines zusammengesetzten benutzerdefinierten Modells ändern sich nicht.

Weitere Informationen über zusammengestellte Modelle.

Welche Alternativen habe ich, wenn die Anzahl von Modellen, die ich zusammenstellen möchte, die Obergrenze für zusammengestellte Modelle übersteigt?

Sie können eine der folgenden Alternativen verwenden:

Wie verfeinere ich ein Modell über das erste Training hinaus?

Jeder Trainingsvorgang generiert ein neues Modell.

  1. Erstellen Sie ein Dataset für Ihre neue Vorlage.

  2. Beschriften und trainieren Sie ein neues Modell.

  3. Überprüfen Sie, ob das neue Modell für Ihre spezifischen Dokumenttypen gut funktioniert.

  4. Stellen Sie Ihr neues Modell mit dem vorhandenen Modell zu einem einzelnen Endpunkt zusammen. Dokument Intelligenz kann dann das beste Modell für jedes zu analysierende Dokument bestimmen.

Weitere Informationen über zusammengestellte Modelle.

Ich erstelle ein benutzerdefiniertes Modell. Was gibt die Signaturerkennungsbezeichnung zurück?

Die Signaturerkennung sucht nach einer vorhandenen Signatur, nicht nach der Identität der Person, die das Dokument signiert.

Wenn das Modell unsigniert für die Signaturerkennung zurückgibt, hat das Modell keine Signatur im definierten Feld gefunden.

Was sollte ich berücksichtigen, und was sind bewährte Methoden zum Extrahieren von Tabellen aus Dokumenten?

Sie können mit dem Layoutmodell von Dokument Intelligenz beginnen, um Texte, Tabellen, Auswahlmarkierungen und Strukturinformationen aus Dokumenten und Bildern zu extrahieren. Sie können auch die folgenden Faktoren berücksichtigen:

  • Werden die Daten, die Sie extrahieren möchten, als Tabelle dargestellt, und ist die Tabellenstruktur aussagekräftig?

  • Können die Daten in ein zweidimensionales Raster eingepasst werden, wenn sie nicht in einem Tabellenformat vorliegen?

  • Erstrecken sich Ihre Tabellen über mehrere Seiten? Falls ja, teilen Sie die PDF-Datei vor dem Senden an Dokument Intelligenz in einzelne Seiten auf, damit nicht alle Seiten beschriftet werden müssen. Verarbeiten Sie die Seiten nach der Analyse in einer einzelnen Tabelle.

  • Wenn Sie benutzerdefinierte Modelle erstellen, finden Sie weitere Informationen unter Beschrifteten als Tabellen. Dynamische Tabellen weisen eine variable Anzahl von Zeilen für jede Spalte auf. Fixierte Tabellen weisen eine konstante Anzahl von Zeilen für jede Spalte auf.

Wie kann ich meine trainierten Modelle zwischen Umgebungen verschieben (etwa von der Betaumgebung in die Produktionsumgebung)?

Sie können die Copy API verwenden, um benutzerdefinierte Modelle aus einem Dokumentintelligenzkonto in andere zu kopieren, die in einer der unterstützten geografischen Region vorhanden sind. Ausführliche Anweisungen finden Sie unter Notfallwiederherstellung.

Der Kopiervorgang ist auf das Kopieren von Modellen innerhalb der spezifischen Cloudumgebung beschränkt, in der Sie das Modell trainiert haben. Beispielsweise wird das Kopieren von Modellen aus der öffentlichen Cloud in die Azure Government-Cloud nicht unterstützt.

Warum wurde Layout beim Ausführen einer benutzerdefinierten Schulung in Rechnung gestellt?

Das Layout ist erforderlich, um Bezeichnungen für Ihr Dataset zu generieren. Wenn für das Dataset, das Sie für benutzerdefinierte Schulungen verwenden, keine Bezeichnungsdateien verfügbar sind, generiert der Dienst sie für Sie.

Speicherkonto

Ich konnte vor einigen Tagen auf mein Speicherkonto zugreifen. Warum habe ich jetzt Probleme beim Wiederherstellen der Verbindung?

Wenn Sie eine Shared Access Signature (SAS) erstellen, beträgt die Standarddauer 48 Stunden. Nach 48 Stunden müssen Sie ein neues Token erstellen.

Legen Sie eventuell einen längeren Zeitraum fest, in dem Sie Ihr Speicherkonto bei Dokument Intelligenz verwenden.

Wie ermögliche ich Dokument Intelligenz den Zugriff auf meine Daten, wenn sich mein Speicherkonto hinter einem virtuellen Netzwerk oder einer Firewall befindet?

Wenn Sie über ein Azure-Speicherkonto verfügen, das durch ein virtuelles Netzwerk oder eine Firewall geschützt ist, kann Dokument Intelligenz nicht direkt auf Ihr Speicherkonto zugreifen. Der Zugriff auf das private Azure-Speicherkonto und die Authentifizierung unterstützen allerdings die verwalteten Identitäten für Azure-Ressourcen. Wenn Sie eine verwaltete Identität verwenden, kann der Dokument Intelligenz-Dienst mithilfe einer zugewiesenen Anmeldeinformation auf Ihr Speicherkonto zugreifen.

Wenn Sie beabsichtigen, Ihre privaten Speicherkontodaten mithilfe von FOTT zu analysieren, müssen Sie das Tool hinter dem virtuellen Netzwerk oder der Firewall bereitstellen.

Erfahren Sie, wie Sie eine verwaltete Identität für Ihre Dokument Intelligenz-Ressource erstellen und verwenden.

Dokument Intelligenz Studio

Welche Berechtigungen benötige ich für den Zugriff auf Dokument Intelligenz Studio?

Für den Zugriff auf Dokument Intelligenz Studio benötigen Sie ein aktives Azure-Konto und ein Abonnement, dem mindestens die Rolle „Leser“ zugewiesen ist.

Für Dokumentanalyse- und vorgefertigte Modelle sind hier die Rollenanforderungen für Benutzerszenarien:

  • Grundlegend

  • Erweitert

    • Mitwirkender: Sie benötigen diese Rolle, um eine Ressourcengruppe oder Dokument Intelligenz-Ressource zu erstellen. Mit der Rolle „Mitwirkender“ können Sie keine Schlüssel für Cognitive Services auflisten. Um Dokument Intelligenz Studio zu verwenden, benötigen Sie weiterhin die Rolle „Cognitive Services-Benutzer“.

Für benutzerdefinierte Modellprojekte sind hier die Rollenanforderungen für Benutzerszenarien aufgeführt:

  • Grundlegend

    • Cognitive Services-Benutzer: Sie benötigen diese Rolle für Dokument Intelligenz- oder Cognitive Services-Multi-Service-Ressourcen, um benutzerdefinierte Modelle zu trainieren oder mit trainierten Modellen zu analysieren.

    • Storage Blob Data-Mitwirkender: Sie benötigen diese Rolle für ein Speicherkonto, um Projekt- und Etikettendaten zu erstellen.

  • Erweitert

    • Speicherkonto-Mitwirkender: Sie benötigen diese Rolle für das Speicherkonto, um CORS-Einstellungen (Cross-Origin Resource Sharing) einzurichten. Es ist ein einmaliger Aufwand, wenn Sie dasselbe Speicherkonto wiederverwenden.

      Mit der Rolle „Mitwirkender“ können Sie nicht auf Daten in Ihrem BLOB zugreifen. Um Dokument Intelligenz Studio zu verwenden, benötigen Sie weiterhin die Rolle „Speicher-BLOB-Daten-Mitwirkender“.

    • Mitwirkender: Sie benötigen diese Rolle, um eine Ressourcengruppe und Ressourcen zu erstellen. Die Rolle „Mitwirkender“ ermöglicht Ihnen keinen Zugriff auf die Verwendung der erstellten Ressourcen oder des Speichers. Um Dokument Intelligenz Studio zu verwenden, benötigen Sie weiterhin Basisrollen.

Weitere Informationen finden Sie unter integrierte Microsoft Entra-Rollen und in den Abschnitten zu Azure-Rollenzuweisungen in der Schnellstartanleitung von Dokument Intelligenz Studio.

Ich habe ein Dokument mit mehreren Seiten. Warum werden in Dokument Intelligenz Studio nur zwei Seiten analysiert?

Für Ressourcen im kostenlosen Tarif (F0) werden nur die ersten beiden Seiten analysiert – unabhängig davon, ob Sie Dokument Intelligenz Studio, die REST-API oder SDKs verwenden.

Wählen Sie in Dokument Intelligenz Studio die Schaltfläche Einstellungen (Zahnrad) aus, wählen Sie die Registerkarte Ressourcen aus, und überprüfen Sie den Tarif, den Sie zum Analysieren der Dokumente nutzen. Wechseln Sie zu einer kostenpflichtigen Ressource (S0), wenn Sie alle Seiten in einem Dokument analysieren möchten.

Wie kann ich die Verzeichnisse oder Abonnements in Dokument Intelligenz Studio ändern?

Um ein Verzeichnis in Dokument Intelligenz Studio zu ändern, wählen Sie die Schaltfläche Einstellungen (Zahnrad) aus. Wählen Sie unter Verzeichnis das Verzeichnis aus der Liste und dann Verzeichnis wechseln aus. Sie werden aufgefordert, sich erneut anzumelden, nachdem Sie das Verzeichnis gewechselt haben.

Um ein Abonnement oder eine Ressource zu ändern, wechseln Sie unter Einstellungen zur Registerkarte Ressource.

Warum erhalte ich einen Speicherfehler bei der Projektfreigabe, der automatischen Beschriftung oder dem OCR-Upgradevorgang, wenn meine Speicherkontoressource mit einer Firewall oder einem virtuellen Netzwerk konfiguriert ist?

Unter Verwaltete Identitäten für Dokument Intelligenz finden Sie Informationen dazu, wie Sie Ihre Azure-Ressourcen einrichten.

Warum erhalte ich die Fehlermeldung „Zugriff verweigert aufgrund von Regeln des virtuellen Netzwerks/der Firewall“ bei der automatischen Bezeichnung oder dem OCR-Upgradevorgang, wenn meine Dokument Intelligenz-Ressource mit einer Firewall oder einem virtuellen Netzwerk konfiguriert ist?

Sie müssen die dedizierte IP-Adresse 20.3.165.95 zur Firewall-Zulassungsliste für Ihre Dokument Intelligenz-Ressource hinzufügen.

Kann ich die Beschriftungsoberfläche von Document Intelligence Studio wiederverwenden oder anpassen und in meine eigene Anwendung integrieren?

Ja. Die Beschriftungsoberfläche von Dokument Intelligenz Studio wird im Toolkit-Repository geöffnet.

Warum erhalte ich beim Öffnen meines benutzerdefinierten Projekts die Fehlermeldung „Formularerkennung nicht gefunden“?

Ihre an dieses benutzerdefinierte Projekt gebundene Dokument Intelligenz-Ressource wurde möglicherweise gelöscht oder in eine andere Ressourcengruppe verschoben. Es gibt zwei Möglichkeiten, dieses Problem zu beheben:

  • Erstellen Sie die Dokument Intelligenz-Ressource unter derselben Abonnement-/Ressourcengruppe mit demselben Namen erneut.

  • Erstellen Sie ein benutzerdefiniertes Projekt mit der migrierten Document Intelligence-Ressource erneut, und geben Sie dasselbe Speicherkonto an.

Container

Benötige ich eine Internetverbindung, um Dokument Intelligenz-Container zu verwenden?

Ja. Dokument Intelligenz-Container benötigen eine Internetverbindung, um Abrechnungsinformationen an Azure zu senden. Weitere Informationen über die Sicherheit von Azure-Containern.

Worin besteht der Unterschied zwischen getrennten und verbundenen Containern?

Verbundene Container senden unter Verwendung einer Dokument Intelligenz-Ressource in Ihrem Azure-Konto Abrechnungsinformationen an Azure. Bei verbundenen Containern ist eine Internetverbindung erforderlich, um Abrechnungsinformationen an Azure zu senden.

Mit der Funktion Getrennte Container können Sie APIs ohne Internetverbindung verwenden. Abrechnungsinformationen werden nicht über das Internet gesendet. Stattdessen werden Sie basierend auf einer erworbenen Mindestabnahme in Rechnung gestellt. Derzeit steht die Nutzung nicht verbundener Container für die Dokument Intelligenz-Modelle „Benutzerdefiniert“ und „Rechnung“ zur Verfügung.

Die in verbundenen und getrennten Containern bereitgestellten Modellfunktionen sind identisch und werden von Dokument Intelligenz v2.1 unterstützt.

Welche Daten senden verbundene Container an die Cloud?

Mit Dokument Intelligenz verbundene Container senden unter Verwendung einer Dokument Intelligenz-Ressource in Ihrem Azure-Konto Abrechnungsinformationen an Azure. Verbundene Container senden keine Kundendaten (z. B. das analysierte Bild oder den analysierten Text) an Microsoft.

Ein Beispiel für die Informationen, die verbundene Container zur Abrechnung an Microsoft senden, finden Sie in den häufig gestellten Fragen zu Azure AI-Containern.

Warum erhalte ich die Fehlermeldung „Container ist nicht in einem gültigen Zustand. Fehler bei der Abonnementüberprüfung mit dem Status „OutOfQuota“: API-Schlüssel hat das Kontingent überschritten“.

Mit Dokument Intelligenz verbundene Container senden unter Verwendung einer Dokument Intelligenz-Ressource in Ihrem Azure-Konto Abrechnungsinformationen an Azure. Sie erhalten diese Meldung unter Umständen, wenn die Container nicht mit dem Abrechnungsendpunkt kommunizieren können.

Kann ich den Dokument Intelligenz-Container für das FOTT-Tool zur Beschriftung von Beispielen im lokalen Speicher ablegen?

FOTT verfügt über eine Version, die lokalen Speicher verwendet. Die Version muss auf einem Windows-Computer installiert werden. Das Installationspaket finden Sie unter diesem Speicherort.

Geben Sie auf der Projektseite den Bezeichnungsordner-URI als /shared oder /shared/sub-dir an, wenn sich die Bezeichnungsdateien in einem Unterverzeichnis befinden. Alle anderen Verhaltensweisen des Dokument Intelligenz-Tools zur Beschriftung von Beispielen entsprechen denen des gehosteten Diensts.

Was ist die bewährte Methode für die Hochskalierung?

Bei asynchronen Aufrufen können Sie mehrere Container mit gemeinsam genutztem Speicher ausführen. Der Container, der den POST-Analyze-Aufruf verarbeitet, speichert die Ausgabe im Speicher. Anschließend kann jeder andere Container die Ergebnisse aus dem Speicher abrufen und die GET-Aufrufe bedienen. Die Anforderungs-ID ist nicht an einen Container gebunden.

Bei synchronen Aufrufen können Sie mehrere Container ausführen, aber nur ein Container bedient eine Anforderung. Da es sich um einen blockierten Aufruf handelt, kann jeder Container aus dem Pool die Anforderung bedienen und die Antwort senden. In diesem Fall ist nur ein Container an eine Anforderung gebunden, und es ist keine Abfrage erforderlich.

Wie kann ich Container mit freigegebenem Speicher einrichten?

Die Container verwenden die Eigenschaft Mounts:Shared beim Starten, um den freigegebenen Speicher zum Speichern der Verarbeitungsdateien anzugeben. Informationen zur Verwendung dieser Eigenschaft finden Sie in der Containerdokumentation.

Sicherheit und Datenschutz

Welche Methoden und Anforderungen gelten für Authentifizierungsanforderungen an Azure KI Services?

Jede Anforderung an Azure Cognitive Service muss einen Authentifizierungsheader enthalten. Sie können eine Anforderung mit mehreren Methoden authentifizieren:

Speichert Dokument Intelligenz meine Daten?

Dokument Intelligenz speichert für alle Features Daten und Ergebnisse vorübergehend im Azure-Speicher in derselben Region wie die Anforderung. Ihre Daten werden dann innerhalb von 24 Stunden nach dem Übermitteln einer Analyseanforderung gelöscht.

Weitere Informationen erhalten Sie unter Daten, Datenschutz und Sicherheit für Dokument Intelligenz.

Wie werden meine trainierten benutzerdefinierten Modelle in Dokument Intelligenz gespeichert und genutzt?

Die Zwischenausgaben nach der Analyse und Bezeichnung werden an demselben Azure Storage-Speicherort gespeichert, an dem Sie Ihre Trainingsdaten speichern. Die trainierten benutzerdefinierten Modelle werden in Azure Storage in der gleichen Region gespeichert und logisch mit Ihrem Azure-Abonnement und den zugehörigen API-Anmeldeinformationen isoliert.

Weitere Hilfe und Support

Wo finde ich weitere Antworten auf meine Fragen zu Azure KI Dokument Intelligenz?

Besuchen Sie Microsoft Q&A, die Microsoft-Seite für technische Fragen und Antworten. Sie können nach Fragen speziell zu Dokument Intelligenz filtern.

Was sollte ich tun, wenn der Dienst bestimmte Texte nicht erkennt oder falsch erkennt, wenn ich Dokumente beschrifte?

Das OCR-Modell von Dokument Intelligenz wird fortlaufend aktualisiert und verbessert. Sie können das Dokumentintelligenzteam per E-Mail kontaktieren. Hängen Sie nach Möglichkeit ein Beispieldokument mit Angabe des Problems an.