Dokument Intelligenz-Vertragsmodell
Wichtig
- Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden.
- Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
- Die öffentliche Vorschauversion der Clientbibliotheken für Dokument-Intelligence ist standardmäßig die REST-API-Version 2024-02-29-preview.
- Öffentliche Vorschauversion 2024-02-29-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar:
- USA, Osten
- USA, Westen 2
- Europa, Westen
Dieser Inhalt gilt für: Version 4.0 (Vorschau) | Vorherige Version: Version 3.1 (GA)
Dieser Inhalt gilt für: Version 3.1 (GA) | Aktuelle Version: Version 4.0 (Vorschau)
Das Vertragsmodell von Dokument Intelligenz nutzt leistungsstarke Funktionen zur optischen Zeichenerkennung (Optical Character Recognition, OCR), um Schlüsselfelder und Positionen aus einer ausgewählten Gruppe wichtiger Vertragselemente zu analysieren und zu extrahieren. Verträge können in verschiedenen Formaten und Qualitäten vorliegen, z. B. als mit dem Smartphone aufgenommene Bilder, als gescannte Dokumente oder als digitale PDF-Dateien. Die API analysiert den Dokumenttext, extrahiert Schlüsselinformationen wie z. B. Parteien, Gerichtsbarkeiten, Vertrags-ID und Titel und gibt eine strukturierte JSON-Darstellung der Daten zurück. Das Modell unterstützt derzeit englischsprachige Dokumentformate.
Automatisierte Vertragsverarbeitung
Bei der automatisierten Vertragsverarbeitung werden die wichtigsten Vertragsfelder aus den Dokumenten extrahiert. In der Vergangenheit wurde die Vertragsanalyse manuell durchgeführt und war daher sehr zeitaufwändig. Die akkurate Extraktion wesentlicher Daten aus Verträgen ist in der Regel der erste und einer der wichtigsten Schritte im Prozess der Vertragsautomatisierung.
Entwicklungsoptionen
Dokument-Intelligence v4.0 (2024-02-29-preview) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
Funktion | Ressourcen | Modell-ID |
---|---|---|
Vertragsmodell | • Dokument-Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-contract |
Dokument-Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
Feature | Ressourcen | Modell-ID |
---|---|---|
Vertragsmodell | • Dokument-Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-contract |
Dokument-Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
Feature | Ressourcen | Modell-ID |
---|---|---|
Vertragsmodell | • Dokument-Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-contract |
Eingabeanforderungen
Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.
Unterstützte Dateiformate:
Modell PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTMLLesen ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Allgemeines Dokument ✔ ✔ Vordefiniert ✔ ✔ Benutzerdefinierte Extraktion ✔ ✔ Benutzerdefinierte Klassifizierung ✔ ✔ ✔ (2024-02-29-preview) In den Formaten PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).
Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige (S0) und 4 MB für die kostenlose (F0) Stufe.
Die Bildgrößen müssen im Bereich zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.
Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.
Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem
8
-Punkt-Text bei 150 Punkten pro Zoll (Dots per Inch, DPI).Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.
Für das Training des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neuronale Modell.
Für das Training des benutzerdefinierten Klassifizierungsmodells beträgt die Gesamtgröße der Trainingsdaten
1GB
mit einem Maximum von 10 000 Seiten.
Testen der Datenextraktion aus Vertragsdokumenten
Erleben Sie aus erster Hand, wie Daten – z. B. Kundeninformationen, Details zu Lieferanten und Einzelpositionen – aus Verträgen extrahiert werden. Sie benötigen die folgenden Ressourcen:
Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).
Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (
F0
) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.
Dokument Intelligenz Studio
Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Steuerdokumente aus.
Sie können die Mustersteuerdokumente analysieren oder Ihre eigenen Dateien hochladen.
Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:
Unterstützte Sprachen und Gebietsschemas
Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.
Feldextraktion
Im Folgenden sind die Felder aufgeführt, die aus einem Vertrag in die JSON-Ausgabeantwort extrahiert werden.
Name | Typ | Beschreibung | Beispielausgabe |
---|---|---|---|
Titel | String | Vertragstitel | Servicevertrag |
ContractId | String | Vertragstitel | AB12956 |
Parteien | Array | Liste der juristischen Parteien | |
ExecutionDate | Datum | Datum, an dem die Vereinbarung von allen Parteien unterzeichnet und angenommen wurde | On this twenty-third day of February two thousand and twenty two |
Ablaufdatum | Datum | Datum, an dem die Gültigkeit des Vertrags endet | Ein Jahr |
RenewalDate | Datum | Datum, an dem der Vertrag verlängert werden muss | On this twenty-third day of February two thousand and twenty two |
Jurisdictions | Array | Liste der Gerichtsbarkeiten |
Die aus dem Vertrag extrahierten Schlüssel-Wert-Paare und Einzelpositionen befinden sich im Abschnitt documentResults
der JSON-Ausgabe.
Nächste Schritte
Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe von Dokument Intelligenz Studio zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für