Bearbeiten

Teilen über


Häufig gestellte Fragen

Dieser Inhalt gilt für: Häkchen Version 4.0 (Vorschau) Häkchen Version 3.1 (GA) Häkchen Version 3.0 (GA) Häkchen Version 2.1 (GA)

Azure KI Dokument Intelligenz ist ein cloudbasierter Dienst, bei dem Machine Learning-Modelle zum Extrahieren von Schlüssel-Wert-Paaren, Text und Tabellen aus Ihren Dokumenten verwendet werden. Das zurückgegebene Ergebnis ist eine strukturierte JSON-Ausgabe. Anwendungsfälle für Dokument Intelligenz sind u. a. die Automatisierung der Datenverarbeitung, die Verbesserung datengesteuerter Strategien und die Anreicherung von Suchfunktionen für Dokumente.

Übersicht

Handelt es sich bei Azure KI Dokument Intelligenz und Azure KI-Formularerkennung um den gleichen Dienst?

Ja.

Azure KI Dokument Intelligenz und Azure KI-Formularerkennung sind der gleiche Dienst. Der Dienst wurde im Juli 2023 von Azure KI-Formularerkennung in Azure KI Dokument Intelligenz umbenannt. Der Dienst bietet die gleichen Features und Funktionen wie vor der Umbenennung.

  • Preisänderungen: Die Preise haben sich nicht geändert. Die Namen „Cognitive Services“ und „Applied AI Services“ werden in Abrechnungs-, Kostenanalyse-, Preislisten- und Preis-APIs von Azure weiterhin verwendet.

  • Breaking Changes: Es gibt keine Breaking Changes für APIs oder Clientbibliotheken. REST-APIs und SDK-Versionen 2024-02-29-preview, 2023-10-31-preview und höher werden in document intelligence umbenannt.

Kann Dokument Intelligenz in andere Microsoft-Dienste integriert werden?

Ja.

Dokument Intelligenz kann in folgende Dienste integriert werden:

KI-Funktionalitäten

Kann ich Dokument Intelligenz mit generativer KI für die Dokumentverarbeitung verwenden?

Ja.

Sie können eine generative KI-Lösung für Dokumente verwenden, um mit Ihren Dokumenten zu kommunizieren, Inhalte aus diesen Dokumenten zu generieren und Azure OpenAI Service-Modelle auf Ihre Daten anzuwenden.

  • Mit Azure KI Dokument Intelligenz und Azure OpenAI können Sie eine Unternehmensanwendung erstellen, um nahtlos und unter Verwendung von natürlicher Sprache mit Ihren Dokumenten zu interagieren. Sie können ganz einfach Antworten finden, wertvolle Erkenntnisse gewinnen und neue, interessante Inhalte auf der Grundlage vorhandener Dokumente generieren.

  • Ausführlichere Informationen finden Sie im Blog der technischen Community.

Kann Document Intelligenz bei der Bildung semantischer Blöcke innerhalb von Dokumenten für RAG (Retrieval-Augmented Generation) helfen?

Ja.

Dokument Intelligenz kann die Bausteine bereitstellen, um die Bildung semantischer Blöcke zu ermöglichen. Die Bildung semantischer Blöcke ist ein wichtiger Schritt in RAG (Retrieval Augmented Generation), um das effiziente Speichern und Abrufen zu gewährleisten.

  • Dokument Intelligenz bietet ein Layoutmodell, das Dokumente basierend auf ihrem semantischen Inhalt in kohärente Einheiten segmentiert.

  • Die erhaltenen Informationen können dann in das Markdown-Format exportiert werden, sodass Sie Ihre Strategie für die semantische Segmentierung auf der Grundlage der verfügbaren Bausteine anpassen können.

Weitere Informationen finden Sie in der Übersicht über RAG in Dokument Intelligenz.

Dokument Intelligenz Studio

Benötige ich für den Zugriff auf Dokument Intelligenz Studio bestimmte Berechtigungen?

Ja.

Für den Zugriff auf Dokument Intelligenz Studio benötigen Sie ein aktives Azure-Konto und ein Abonnement, dem mindestens die Rolle „Leser“ zugewiesen ist.

Für Dokumentanalyse- und vorgefertigte Modelle sind hier die Rollenanforderungen für Benutzerszenarien:

  • Grundlegend

  • Erweitert

    • Mitwirkender: Sie benötigen diese Rolle, um eine Ressourcengruppe oder Dokument Intelligenz-Ressource zu erstellen.

Für benutzerdefinierte Modellprojekte sind hier die Rollenanforderungen für Benutzerszenarien aufgeführt:

  • Grundlegend

    • Cognitive Services-Benutzer: Sie benötigen diese Rolle für Dokument Intelligenz- oder Cognitive Services-Multi-Service-Ressourcen, um benutzerdefinierte Modelle zu trainieren oder mit trainierten Modellen zu analysieren.

    • Storage Blob Data-Mitwirkender: Sie benötigen diese Rolle für ein Speicherkonto, um Projekt- und Etikettendaten zu erstellen.

  • Erweitert

    • Speicherkonto-Mitwirkender: Sie benötigen diese Rolle für das Speicherkonto, um CORS-Einstellungen (Cross-Origin Resource Sharing) einzurichten. Es ist ein einmaliger Aufwand, wenn Sie dasselbe Speicherkonto wiederverwenden.

    • Mitwirkender: Sie benötigen diese Rolle, um eine Ressourcengruppe und Ressourcen zu erstellen. Die Rollen Mitwirkender oder Speicherkontomitwirkender geben Ihnen keinen Zugriff auf die Verwendung Ihrer Dokument Intelligenz-Ressourcen oder Ihres Speicherkontos, wenn die lokale (schlüsselbasierte) Authentifizierung deaktiviert ist. Sie benötigen weiterhin die Basisrollen (Cognitive Services-Benutzer und Mitwirkender an Speicherdatenblobs), um die Funktionen im Dokument Intelligenz-Studio zu verwenden.

Weitere Informationen finden Sie unter integrierte Microsoft Entra-Rollen und in den Abschnitten zu Azure-Rollenzuweisungen in der Schnellstartanleitung von Dokument Intelligenz Studio.

Kann ich in Document Intelligence Studio Dokumente mit mehr als zwei Seiten verarbeiten?

Ja (bei Ressourcen in einem kostenpflichtigen Tarif).

Nein (bei Ressourcen im kostenlosen Tarif).

  • Bei Ressourcen im kostenlosen Tarif (F0) werden lediglich die ersten beiden Seiten analysiert – unabhängig davon, ob Sie Dokument Intelligenz Studio, die REST-API oder Clientbibliotheken verwenden.

  • Wechseln Sie zu einer kostenpflichtigen Ressource (S0), wenn Sie alle Seiten in einem Dokument analysieren möchten. Wählen Sie in Dokument Intelligenz Studio die Schaltfläche Einstellungen (Zahnrad) aus, wählen Sie die Registerkarte Ressourcen aus, und überprüfen Sie den zu verwendenden Tarif für die Analyse Ihrer Dokumente.

Kann ich in Dokument Intelligenz Studio das Verzeichnis oder Abonnement ändern?

Ja.

  • Um ein Verzeichnis in Dokument Intelligenz Studio zu ändern, wählen Sie die Schaltfläche Einstellungen (Zahnrad) aus. Wählen Sie unter Verzeichnis das Verzeichnis aus der Liste und dann Verzeichnis wechseln aus. Melden Sie sich nach dem Verzeichniswechsel erneut an.

  • Um ein Abonnement oder eine Ressource zu ändern, wechseln Sie unter Einstellungen zur Registerkarte Ressource.

Kann ich Dokument Intelligenz Studio mit einer Ressource verwenden, die mit einer Firewall oder einem virtuellen Netzwerk konfiguriert ist?

Ja.

Wenn Ihre Dokument Intelligenz-Ressource mit einer Firewall oder einem virtuellen Netzwerk konfiguriert ist, müssen Sie die dedizierte IP-Adresse 20.3.165.95 der Firewall-Positivliste für Ihre Dokument Intelligenz-Ressource hinzufügen.

Kann ich die Beschriftungsoberfläche von Document Intelligence Studio wiederverwenden oder anpassen und in meine eigene Anwendung integrieren?

Ja.

Die Beschriftungsoberfläche von Dokument Intelligenz Studio wird im Toolkit-Repository geöffnet.

Gibt es separate URL-Endpunkte für souveräne Dokumentintelligenz-Cloudregionen?

Ja.

Dokument Intelligenz Studio verfügt über separate URL-Endpunkte für Sovereign Cloud-Regionen:

App-Entwicklung

Kann ich bei der Entwicklung von Anwendungen mit Azure KI Dokument Intelligenz die neuesten Entwicklungsoptionen nutzen?

Ja.

Dokument Intelligenz bietet die neuesten Entwicklungsoptionen innerhalb der folgenden Plattformen:

Kann ich meine Anwendung zur neuesten Version von Dokument Intelligenz migrieren?

Ja.

Die folgende Tabelle enthält Links zu detaillierten Anweisungen für die Migration zur neuesten Version von Dokument Intelligenz:

Sprache/API Migrationsleitfaden
REST-API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Kann ich einen Bereich von Seiten angeben, die in einem Dokument analysiert werden sollen?

Ja.

Verwenden Sie den pages-Parameter (unterstützt in den REST-API-Versionen 2.1, 3.0 und höher), und geben Sie Seiten für PDF- und TIFF-Dokumente mit mehreren Seiten an. Die akzeptierte Eingabe umfasst die folgenden Bereiche:

  • Einzelne Seiten. Wenn Sie beispielsweise 1, 2 angeben, werden die Seiten 1 und 2 verarbeitet.
  • Endliche Bereiche. Wenn Sie beispielsweise 2-5 angeben, werden die Seiten 2 bis 5 verarbeitet.
  • Nach hinten offene Bereiche. Wenn Sie beispielsweise 5- angeben, werden alle Seiten von Seite 5 an verarbeitet. Wenn Sie -10 angeben, werden die Seiten 1 bis 10 verarbeitet.

Sie können diese Parameter miteinander kombinieren, und Bereiche können sich überlappen. Wenn Sie beispielsweise -5, 1, 3, 5-10 angeben, werden die Seiten 1 bis 10 verarbeitet.

Der Dienst akzeptiert die Anforderung, wenn er mindestens eine Seite des Dokuments verarbeiten kann. Die Verwendung von 5-100 für ein fünfseitiges Dokument ist beispielsweise eine gültige Eingabe, bei der die Seite 5 verarbeitet wird.

Wenn Sie keinen Seitenbereich angeben, wird das gesamte Dokument verarbeitet.

Sollte ich für mein Projekt lieber Dokument Intelligenz Studio anstatt des FOTT-Tools für die Beschriftung von Beispielen verwenden?

Ja.

In den meisten Fällen empfiehlt sich die Verwendung von Dokument Intelligenz Studio, da es die Konfiguration von Dokument Intelligenz-Ressourcen und Speicherdiensten beschleunigen kann.

Die Verwendung von FOTT (Form Testing Tool) sollte nur in folgenden Szenarien erwogen werden:

Gibt es bewährte Methoden zur Behandlung der Drosselung?

Ja.

Dokument Intelligenz nutzt die automatische Skalierung, um die erforderlichen Computeressourcen nach Bedarf bereitzustellen und gleichzeitig die Kosten für die Kund*innen niedrig zu halten. Um die Drosselung während der automatischen Skalierung zu minimieren, empfehlen wir den folgenden Ansatz:

  • Implementieren Sie eine Wiederholungslogik in der Anwendung.

  • Wenn Sie feststellen, dass die Anzahl der POST-Anforderungen gedrosselt wird, sollten Sie eine Verzögerung zwischen den Anforderungen hinzufügen.

  • Erhöhen Sie die Workload nach und nach. Vermeiden Sie abrupte Änderungen.

  • Erstellen Sie eine Supportanfrage, um den TPS-Grenzwert (Transaktionen pro Sekunde) zu erhöhen.

Erfahren Sie mehr über die Dienstkontingente und Limits für Dokument Intelligenz.

Benutzerdefinierte Modelle

Kann ich eine ungefähre Genauigkeitsbewertung für ein benutzerdefiniertes Modell verbessern?

Ja.

Varianzen in der visuellen Struktur Ihrer Dokumente könnend die Genauigkeit eines Modells beeinflussen. Hier finden Sie einige Tipps:

  • Schließen Sie alle Variationen eines Dokuments in das Schulungsdatenset ein. Variationen umfassen verschiedene Formate, z. B. digitale und gescannte PDF-Dateien.

  • Trennen Sie visuell unterschiedliche Dokumenttypen, und trainieren Sie verschiedene Modelle.

  • Stellen Sie sicher, dass keine überflüssigen Beschriftungen vorhanden sind.

  • Schließen Sie beim Beschriften von Unterschriften und Bereichen den umgebenden Text nicht ein.

Weitere Informationen finden Sie unter Genauigkeits- und Konfidenzbewertungen.

Kann ich ein benutzerdefiniertes Modell erneut trainieren?

Nein.

  • Dokument Intelligenz bietet keinen expliziten Vorgang zum erneuten Trainieren. Jeder Trainingsvorgang generiert ein neues Modell.

  • Wenn Sie feststellen, dass Ihr Modell erneut trainiert werden muss, können Sie Ihrem Trainingsdataset weitere Beispiele hinzufügen und ein neues Modell trainieren.

  • Sie können auch wie folgt ein neues Modell erstellen, um es mit Ihrem ursprünglichen Modell zu kombinieren:

    1. Erstellen Sie ein Dataset für Ihre neue Vorlage.

    2. Beschriften und trainieren Sie ein neues Modell.

    3. Überprüfen Sie, ob das neue Modell für Ihre spezifischen Dokumenttypen gut funktioniert.

    4. Stellen Sie Ihr neues Modell mit dem vorhandenen Modell zu einem einzelnen Endpunkt zusammen. Dokument Intelligenz kann dann das beste Modell für jedes zu analysierende Dokument bestimmen.

    Weitere Informationen finden Sie unter Benutzerdefinierte Document Intelligence-Modelle.

Kann ich meine trainierten Modelle zwischen Umgebungen verschieben (etwa von der Betaumgebung in die Produktionsumgebung)?

Ja.

Sie können die Kopier-API verwenden, um benutzerdefinierte Modelle in andere Dokument Intelligenz-Konten in einer beliebigen der unterstützten geografischen Region zu kopieren. Ausführliche Anweisungen finden Sie unter Notfallwiederherstellung.

Der Kopiervorgang ist auf das Kopieren von Modellen innerhalb der spezifischen Cloudumgebung beschränkt, in der Sie das Modell trainiert haben. Beispielsweise wird das Kopieren von Modellen aus der öffentlichen Cloud in die Azure Government-Cloud nicht unterstützt.

Speicherkonto

Gibt es eine Ablaufzeit für das SAS-Token (Shared Access Signature), das ich für meine Speicherkontoauthentifizierung verwende?

Ja.

Wenn Sie eine Shared Access Signature (SAS) erstellen, beträgt die Standarddauer 48 Stunden. Nach 48 Stunden müssen Sie ein neues Token erstellen.

Legen Sie eventuell einen längeren Zeitraum fest, in dem Sie Ihr Speicherkonto bei Dokument Intelligenz verwenden.

Kann Dokument Intelligenz auf Daten in meinem Speicherkonto zugreifen, wenn es sich hinter einem virtuellen Netzwerk oder hinter einer Firewall befindet?

Nein, nicht direkt.

Dokument Intelligenz kann nicht auf Ihr Speicherkonto zugreifen, wenn es durch ein virtuelles Netzwerk oder eine Firewall geschützt ist.

Der Zugriff auf das private Azure-Speicherkonto und die Authentifizierung unterstützen allerdings die verwalteten Identitäten für Azure-Ressourcen. Wenn Sie eine verwaltete Identität verwenden, kann der Dokument Intelligenz-Dienst mithilfe einer zugewiesenen Anmeldeinformation auf Ihr Speicherkonto zugreifen.

Wenn Sie beabsichtigen, Ihre privaten Speicherkontodaten mithilfe von FOTT zu analysieren, müssen Sie das Tool hinter dem virtuellen Netzwerk oder der Firewall bereitstellen.

Erfahren Sie, wie Sie eine verwaltete Identität für Ihre Dokument Intelligenz-Ressource erstellen und verwenden.

Container

Gibt es einen Unterschied zwischen getrennten und verbundenen Containern?

Ja.

Die Modellfunktionen für verbundene und getrennte Container sind zwar identisch, die Abrechnungs- und Konnektivitätsmethoden unterscheiden sich jedoch:

  • Verbundene Container senden unter Verwendung einer Dokument Intelligenz-Ressource in Ihrem Azure-Konto Abrechnungsinformationen an Azure. Bei verbundenen Containern ist eine Internetverbindung erforderlich, um Abrechnungsinformationen an Azure zu senden. Mit Dokument Intelligenz verbundene Container senden unter Verwendung einer Dokument Intelligenz-Ressource in Ihrem Azure-Konto Abrechnungsinformationen an Azure. Verbundene Container senden keine Kundendaten (z. B. das analysierte Bild oder den analysierten Text) an Microsoft. Ein Beispiel für die Informationen, die verbundene Container zur Abrechnung an Microsoft senden, finden Sie in den häufig gestellten Fragen zu Azure AI-Containern.

  • Mit der Funktion Getrennte Container können Sie APIs ohne Internetverbindung verwenden. Abrechnungsinformationen werden nicht über das Internet gesendet. Stattdessen basieren Gebühren auf einer erworbenen Mindestabnahme. Derzeit steht die Nutzung nicht verbundener Container für die Dokument Intelligenz-Modelle „Benutzerdefiniert“ und „Rechnung“ zur Verfügung.

Kann ich den Dokument Intelligenz-Container für das FOTT-Tool zur Beschriftung von Beispielen im lokalen Speicher ablegen?

Ja.

FOTT verfügt über eine Version, die lokalen Speicher verwendet. Die Version muss auf einem Windows-Computer installiert werden. Das Installationspaket finden Sie unter diesem Speicherort.

Geben Sie auf der Projektseite den Bezeichnungsordner-URI als /shared oder /shared/sub-dir an, wenn sich die Bezeichnungsdateien in einem Unterverzeichnis befinden. Alle anderen Verhaltensweisen des Dokument Intelligenz-Tools zur Beschriftung von Beispielen entsprechen denen des gehosteten Diensts.

Gibt es eine bewährte Methode für die Hochskalierung?

Ja.

Bei asynchronen Aufrufen können Sie mehrere Container mit gemeinsam genutztem Speicher ausführen. Der Container, der den POST-Analyze-Aufruf verarbeitet, speichert die Ausgabe im Speicher. Anschließend kann jeder andere Container die Ergebnisse aus dem Speicher abrufen und die GET-Aufrufe bedienen. Die Anforderungs-ID ist nicht an einen Container gebunden.

Bei synchronen Aufrufen können Sie mehrere Container ausführen, aber nur ein Container bedient eine Anforderung. Da es sich um einen blockierten Aufruf handelt, kann jeder Container aus dem Pool die Anforderung bedienen und die Antwort senden. In diesem Fall ist nur ein Container an eine Anforderung gebunden, und es ist keine Abfrage erforderlich.

Kann ich Container mit freigegebenem Speicher einrichten?

Ja.

Die Container verwenden die Eigenschaft Mounts: Shared beim Starten, um den freigegebenen Speicher zum Speichern der Verarbeitungsdateien anzugeben. Informationen zur Verwendung dieser Eigenschaft finden Sie in der Containerdokumentation.

Sicherheit und Datenschutz

Speichert Dokument Intelligenz meine Daten?

Ja, kurzzeitig.

Dokument Intelligenz speichert für alle Features Daten und Ergebnisse vorübergehend im Azure-Speicher in derselben Region wie die Anforderung. Ihre Daten werden dann innerhalb von 24 Stunden nach dem Übermitteln einer Analyseanforderung gelöscht.

Weitere Informationen erhalten Sie unter Daten, Datenschutz und Sicherheit für Dokument Intelligenz.

Bei trainierten benutzerdefinierten Modellen werden die Zwischenausgaben nach der Analyse und Beschriftung an dem Azure Storage-Standort gespeichert, an dem Sie auch Ihre Trainingsdaten speichern. Die trainierten benutzerdefinierten Modelle werden in Azure Storage in der gleichen Region gespeichert und logisch mit Ihrem Azure-Abonnement und den zugehörigen API-Anmeldeinformationen isoliert.

Weitere Hilfe und Support

Gibt es weitere Ressourcen mit Lösungen für Fragen zu Azure KI Dokument Intelligenz?

Ja.

Besuchen Sie Microsoft Q&A, die Microsoft-Seite für technische Fragen und Antworten. Sie können nach Fragen speziell zu Dokument Intelligenz filtern.

Kann ich direktes Feedback senden, wenn der Dienst bei der Beschriftung von Dokumenten bestimmten Text nicht oder falsch erkennt?

Ja.

Die Dokument Intelligenz-Modelle werden von uns fortlaufend aktualisiert und verbessert. Sie können das Dokumentintelligenzteam per E-Mail kontaktieren. Hängen Sie nach Möglichkeit ein Beispieldokument mit Angabe des Problems an.