Freigeben über


Welches Modell sollte ich auswählen?

Wichtig

  • Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden. Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
  • Die Public Preview von Dokument Intelligenz-Clientbibliotheken verwendet standardmäßig Version 2024-07-31-preview der REST-API.
  • Die Public Preview 2024-07-31-preview ist derzeit lediglich in den folgenden Azure-Regionen verfügbar. Beachten Sie, dass das benutzerdefinierte generative Modell (Dokumentfeldextraktion) in KI Studio nur in der Region „USA, Norden-Mitte“ verfügbar ist:
    • USA, Osten
    • USA, Westen 2
    • Europa, Westen
    • USA, Norden-Mitte

Die Azure KI Dokument Intelligenz unterstützt eine Vielzahl von Modellen, mit denen Sie Ihre Anwendungen um intelligente Dokumentenverarbeitung erweitern und Ihre Workflows optimieren können. Die Auswahl des richtigen Modells ist entscheidend für den Erfolg Ihres Unternehmens. In diesem Artikel stellen wir Ihnen die verfügbaren Dokument Intelligenz-Modelle vor und geben Ihnen Hinweise, wie Sie die beste Lösung für Ihre Projekte auswählen können.

Die folgenden Entscheidungsdiagramme heben die Features der einzelnen unterstützten Modelle hervor und helfen Ihnen bei der Auswahl des Modells, das den Anforderungen Ihrer Anwendung am besten entspricht.

Wichtig

Informieren Sie sich auf der Seite Sprachunterstützung über die unterstützte Sprachtext- und Feldextraktion nach Feature.

Vortrainierte Dokumentanalysemodelle

Dokumenttyp Beispiel Zu extrahierende Daten Für Sie am besten geeignete Lösung
Ein allgemeines Dokument. Ein Vertrag oder ein Brief. Sie möchten in erster Linie geschriebene oder gedruckte Textzeilen, Wörter, Orte und erkannte Sprachen extrahieren. Lese-OCR-Modell
Ein Dokument, das strukturelle Informationen enthält. Ein Bericht oder eine Studie. Zusätzlich zum geschriebenen oder gedruckten Text müssen Sie Strukturinformationen wie Tabellen, Markierungen, Absätze, Titel, Überschriften und Unterüberschriften extrahieren. Layoutanalysemodell
Ein strukturiertes oder halbstrukturiertes Dokument, das Inhalte enthält, die als Felder (Schlüssel) und Werte formatiert sind. Ein Formular oder Dokument in einem standardisierten Format, das in Ihrem Unternehmen oder Ihrer Branche häufig verwendet wird, z. B. ein Kreditantrag oder eine Umfrage. Sie möchten Felder und Werte extrahieren, die nicht von den szenariospezifischen vorgefertigten Modellen abgedeckt werden, ohne ein benutzerdefiniertes Modell trainieren zu müssen. **Layoutanalysemodell mit dem optionalen Abfragezeichenfolgenparameter features=keyValuePairs aktiviert **

Vortrainierte szenariospezifische Modelle

Dokumenttyp Zu extrahierende Daten Für Sie am besten geeignete Lösung
US Unified Tax Sie möchten Schlüsselinformationen aus allen Steuerformularen von W2, 1040, 1090, 1098 aus einer einzigen Datei extrahieren, ohne eine benutzerdefinierte Klassifizierung auszuführen. US Unified Tax-Modell
US Tax W-2 tax Sie möchten Schlüsselinformationen wie Gehalt, Lohn und einbehaltene Steuern extrahieren. US-Steuermodell W-2
US Tax 1098 Sie möchten Details zu Hypothekenzinsen wie Prinzipal, Punkten und Steuern extrahieren. US-Steuerformular 1098
US Tax 1098-E Sie möchten Zinsdetails für das Studentendarlehen extrahieren, z. B. Kreditgeber und Zinsbetrag. US-Steuermodell 1098-E
US Tax 1098T Sie möchten qualifizierte Studiendetails extrahieren, z. B. Stipendienanpassungen, Status für Studierende und Informationen zum Kreditgeber. US-Steuermodell 1098-T
US Tax 1099(Variationen) Sie möchten Informationen aus 1099-Formularen und ihren Variationen (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB) extrahieren. US-Steuermodell 1099
US Tax 1040(Variationen) Sie möchten Informationen aus 1040 Formularen und deren Variationen extrahieren (Schema 1, Schema 2, Schema 3, Schema 8812, Schema A, Schema B, Schema C, Schema D, Schema E, Schema EIC, Schema F, Schema H, Schema J, Schema R, Schema SE, Schema Senior). US-Steuermodell 1040
Kontoauszug Sie möchten Schlüsselinformationen aus US-Kontoauszügen extrahieren. \Kontoauszug
Bankscheck Sie möchten Schlüsselinformationen aus Scheckdokumenten extrahieren. Bankscheck
Vertrag (rechtliche Vereinbarung zwischen Parteien). Sie möchten Vertragsvereinbarungsdetails wie Parteien, Datumsangaben und Intervalle extrahieren. Vertragsmodell
Krankenversicherungskarte oder Krankenversicherungs-ID. Sie möchten Schlüsselinformationen wie Versicherer, Mitglieds-ID, verschreibungspflichtige Leistungen und Gruppennummer extrahieren. Krankenversicherungskartenmodell
Kredit-/Debitkarte Sie möchten wichtige Informationsbankkarten wie Kartennummer und Bankname extrahieren. Kredit-/Debitkartenmodell
Heiratsurkunde Sie möchten wichtige Informationen aus Ehescheinen extrahieren. Heiratsurkunde-Modell
Rechnung oder Abrechnung Sie möchten Schlüsselinformationen wie Kundenname, Rechnungsadresse und fälligen Betrag extrahieren. Rechnungsmodell
Quittung, Gutschein oder einseitiger Hotelbeleg. Sie möchten Schlüsselinformationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme extrahieren. Belegmodell
Ausweisdokument (ID), z. B. ein Führerschein oder internationaler Reisepass Sie möchten Schlüsselinformationen wie Vorname, Nachname, Geburtsdatum, Adresse und Unterschrift extrahieren. Ausweisdokumentmodell
Lohnabrechnung Sie möchten Schlüsselinformationen aus Lohnabrechnungsdokumenten extrahieren. Lohnabrechnungsmodell
US Mortgage 1003 Sie möchten Schlüsselinformationen aus dem Antrag für ein einheitliches Wohnbaudarlehen extrahieren. 1003-Formularmodell
US Mortgage 1004 Sie möchten Schlüsselinformationen aus dem Uniform Residential Appraisal Report (URAR) extrahieren. 1004-Formularmodell
US Mortgage 1005 Sie möchten Schlüsselinformationen aus dem Formular „Verification of employment“ extrahieren. 1005-Formularmodell
US Mortgage 1008 Sie möchten wichtige Informationen aus der Uniform Underwriting and Transmittal Summary extrahieren. 1008-Formularmodell
US Mortgage Closing Disclosure Sie möchten wichtige Informationen aus einem Offenlegungsformular für Hypothekenabschluss extrahieren. Formularmodell zur Offenlegung von Hypothekenabschluss
Gemischte Dokumente mit strukturierten, teilstrukturierten und/oder unstrukturierten Elementen Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. Benutzerdefiniertes Modell

Tipp

  • Wenn Sie immer noch nicht sicher sind, welches vortrainierte Modell verwendet werden soll, probieren Sie das Layoutmodell mit aktiviertem optionalen Abfragezeichenfolgenparameter features=keyValuePairs aus.
  • Das Layoutmodell wird von der Lese-OCR-Engine unterstützt, mit der Seiten, Tabellen, Stile, Textlinien, Wörter, Orte und Sprachen erkannt werden können.

Benutzerdefinierte Extraktionsmodelle

Trainingssatz Beispieldokumente Für Sie am besten geeignete Lösung
Strukturierte, konsistente Dokumente mit einem statischen Layout. Strukturierte Formulare wie Fragebögen oder Anwendungen. Benutzerdefiniertes Vorlagenmodell
Strukturierte und semistrukturierte Daten ● Strukturierte → Umfragen
● Halbstrukturierte → Rechnungen
Benutzerdefiniertes neuronales Modell
Unstrukturierte Dokumente, Dokumente mit unterschiedlichen Vorlagen ● Unstrukturierte Dokumente wie Verträge oder Briefe
● Unterschiedliche Dokumentvorlagen wie Kreditauszüge verschiedener Hypothekengesellschaften
Benutzerdefiniertes generatives Modell
Eine Sammlung von mehreren Modellen, die jeweils anhand von Dokumenten ähnlicher Art trainiert wurden. ● Lieferantenbestellungen
● Ausrüstungsbestellungen
● Möbelbestellungen
Alle zusammen in einem einzelnen Modell.
Zusammengestelltes benutzerdefiniertes Modell

Benutzerdefiniertes Klassifizierungsmodell

Trainingssatz Beispieldokumente Für Sie am besten geeignete Lösung
Mindestens zwei verschiedene Dokumenttypen. Formulare, Briefe oder Dokumente Benutzerdefiniertes Klassifizierungsmodell

Nächste Schritte