Welches Modell sollte ich auswählen?
Wichtig
- Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden. Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
- Die Public Preview von Dokument Intelligenz-Clientbibliotheken verwendet standardmäßig Version 2024-07-31-preview der REST-API.
- Die Public Preview 2024-07-31-preview ist derzeit lediglich in den folgenden Azure-Regionen verfügbar. Beachten Sie, dass das benutzerdefinierte generative Modell (Dokumentfeldextraktion) in KI Studio nur in der Region „USA, Norden-Mitte“ verfügbar ist:
- USA, Osten
- USA, Westen 2
- Europa, Westen
- USA, Norden-Mitte
Die Azure KI Dokument Intelligenz unterstützt eine Vielzahl von Modellen, mit denen Sie Ihre Anwendungen um intelligente Dokumentenverarbeitung erweitern und Ihre Workflows optimieren können. Die Auswahl des richtigen Modells ist entscheidend für den Erfolg Ihres Unternehmens. In diesem Artikel stellen wir Ihnen die verfügbaren Dokument Intelligenz-Modelle vor und geben Ihnen Hinweise, wie Sie die beste Lösung für Ihre Projekte auswählen können.
Die folgenden Entscheidungsdiagramme heben die Features der einzelnen unterstützten Modelle hervor und helfen Ihnen bei der Auswahl des Modells, das den Anforderungen Ihrer Anwendung am besten entspricht.
Wichtig
Informieren Sie sich auf der Seite Sprachunterstützung über die unterstützte Sprachtext- und Feldextraktion nach Feature.
Vortrainierte Dokumentanalysemodelle
Dokumenttyp | Beispiel | Zu extrahierende Daten | Für Sie am besten geeignete Lösung |
---|---|---|---|
Ein allgemeines Dokument. | Ein Vertrag oder ein Brief. | Sie möchten in erster Linie geschriebene oder gedruckte Textzeilen, Wörter, Orte und erkannte Sprachen extrahieren. | Lese-OCR-Modell |
Ein Dokument, das strukturelle Informationen enthält. | Ein Bericht oder eine Studie. | Zusätzlich zum geschriebenen oder gedruckten Text müssen Sie Strukturinformationen wie Tabellen, Markierungen, Absätze, Titel, Überschriften und Unterüberschriften extrahieren. | Layoutanalysemodell |
Ein strukturiertes oder halbstrukturiertes Dokument, das Inhalte enthält, die als Felder (Schlüssel) und Werte formatiert sind. | Ein Formular oder Dokument in einem standardisierten Format, das in Ihrem Unternehmen oder Ihrer Branche häufig verwendet wird, z. B. ein Kreditantrag oder eine Umfrage. | Sie möchten Felder und Werte extrahieren, die nicht von den szenariospezifischen vorgefertigten Modellen abgedeckt werden, ohne ein benutzerdefiniertes Modell trainieren zu müssen. | **Layoutanalysemodell mit dem optionalen Abfragezeichenfolgenparameter features=keyValuePairs aktiviert ** |
Vortrainierte szenariospezifische Modelle
Dokumenttyp | Zu extrahierende Daten | Für Sie am besten geeignete Lösung |
---|---|---|
US Unified Tax | Sie möchten Schlüsselinformationen aus allen Steuerformularen von W2, 1040, 1090, 1098 aus einer einzigen Datei extrahieren, ohne eine benutzerdefinierte Klassifizierung auszuführen. | US Unified Tax-Modell |
US Tax W-2 tax | Sie möchten Schlüsselinformationen wie Gehalt, Lohn und einbehaltene Steuern extrahieren. | US-Steuermodell W-2 |
US Tax 1098 | Sie möchten Details zu Hypothekenzinsen wie Prinzipal, Punkten und Steuern extrahieren. | US-Steuerformular 1098 |
US Tax 1098-E | Sie möchten Zinsdetails für das Studentendarlehen extrahieren, z. B. Kreditgeber und Zinsbetrag. | US-Steuermodell 1098-E |
US Tax 1098T | Sie möchten qualifizierte Studiendetails extrahieren, z. B. Stipendienanpassungen, Status für Studierende und Informationen zum Kreditgeber. | US-Steuermodell 1098-T |
US Tax 1099(Variationen) | Sie möchten Informationen aus 1099 -Formularen und ihren Variationen (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB) extrahieren. |
US-Steuermodell 1099 |
US Tax 1040(Variationen) | Sie möchten Informationen aus 1040 Formularen und deren Variationen extrahieren (Schema 1, Schema 2, Schema 3, Schema 8812, Schema A, Schema B, Schema C, Schema D, Schema E, Schema EIC , Schema F, Schema H, Schema J, Schema R, Schema SE , Schema Senior). |
US-Steuermodell 1040 |
Kontoauszug | Sie möchten Schlüsselinformationen aus US-Kontoauszügen extrahieren. | \Kontoauszug |
Bankscheck | Sie möchten Schlüsselinformationen aus Scheckdokumenten extrahieren. | Bankscheck |
Vertrag (rechtliche Vereinbarung zwischen Parteien). | Sie möchten Vertragsvereinbarungsdetails wie Parteien, Datumsangaben und Intervalle extrahieren. | Vertragsmodell |
Krankenversicherungskarte oder Krankenversicherungs-ID. | Sie möchten Schlüsselinformationen wie Versicherer, Mitglieds-ID, verschreibungspflichtige Leistungen und Gruppennummer extrahieren. | Krankenversicherungskartenmodell |
Kredit-/Debitkarte | Sie möchten wichtige Informationsbankkarten wie Kartennummer und Bankname extrahieren. | Kredit-/Debitkartenmodell |
Heiratsurkunde | Sie möchten wichtige Informationen aus Ehescheinen extrahieren. | Heiratsurkunde-Modell |
Rechnung oder Abrechnung | Sie möchten Schlüsselinformationen wie Kundenname, Rechnungsadresse und fälligen Betrag extrahieren. | Rechnungsmodell |
Quittung, Gutschein oder einseitiger Hotelbeleg. | Sie möchten Schlüsselinformationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme extrahieren. | Belegmodell |
Ausweisdokument (ID), z. B. ein Führerschein oder internationaler Reisepass | Sie möchten Schlüsselinformationen wie Vorname, Nachname, Geburtsdatum, Adresse und Unterschrift extrahieren. | Ausweisdokumentmodell |
Lohnabrechnung | Sie möchten Schlüsselinformationen aus Lohnabrechnungsdokumenten extrahieren. | Lohnabrechnungsmodell |
US Mortgage 1003 | Sie möchten Schlüsselinformationen aus dem Antrag für ein einheitliches Wohnbaudarlehen extrahieren. | 1003-Formularmodell |
US Mortgage 1004 | Sie möchten Schlüsselinformationen aus dem Uniform Residential Appraisal Report (URAR) extrahieren. | 1004-Formularmodell |
US Mortgage 1005 | Sie möchten Schlüsselinformationen aus dem Formular „Verification of employment“ extrahieren. | 1005-Formularmodell |
US Mortgage 1008 | Sie möchten wichtige Informationen aus der Uniform Underwriting and Transmittal Summary extrahieren. | 1008-Formularmodell |
US Mortgage Closing Disclosure | Sie möchten wichtige Informationen aus einem Offenlegungsformular für Hypothekenabschluss extrahieren. | Formularmodell zur Offenlegung von Hypothekenabschluss |
Gemischte Dokumente mit strukturierten, teilstrukturierten und/oder unstrukturierten Elementen | Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. | Benutzerdefiniertes Modell |
Tipp
- Wenn Sie immer noch nicht sicher sind, welches vortrainierte Modell verwendet werden soll, probieren Sie das Layoutmodell mit aktiviertem optionalen Abfragezeichenfolgenparameter
features=keyValuePairs
aus. - Das Layoutmodell wird von der Lese-OCR-Engine unterstützt, mit der Seiten, Tabellen, Stile, Textlinien, Wörter, Orte und Sprachen erkannt werden können.
Benutzerdefinierte Extraktionsmodelle
Trainingssatz | Beispieldokumente | Für Sie am besten geeignete Lösung |
---|---|---|
Strukturierte, konsistente Dokumente mit einem statischen Layout. | Strukturierte Formulare wie Fragebögen oder Anwendungen. | Benutzerdefiniertes Vorlagenmodell |
Strukturierte und semistrukturierte Daten | ● Strukturierte → Umfragen ● Halbstrukturierte → Rechnungen |
Benutzerdefiniertes neuronales Modell |
Unstrukturierte Dokumente, Dokumente mit unterschiedlichen Vorlagen | ● Unstrukturierte Dokumente wie Verträge oder Briefe ● Unterschiedliche Dokumentvorlagen wie Kreditauszüge verschiedener Hypothekengesellschaften |
Benutzerdefiniertes generatives Modell |
Eine Sammlung von mehreren Modellen, die jeweils anhand von Dokumenten ähnlicher Art trainiert wurden. | ● Lieferantenbestellungen ● Ausrüstungsbestellungen ● Möbelbestellungen Alle zusammen in einem einzelnen Modell. |
Zusammengestelltes benutzerdefiniertes Modell |
Benutzerdefiniertes Klassifizierungsmodell
Trainingssatz | Beispieldokumente | Für Sie am besten geeignete Lösung |
---|---|---|
Mindestens zwei verschiedene Dokumenttypen. | Formulare, Briefe oder Dokumente | Benutzerdefiniertes Klassifizierungsmodell |
Nächste Schritte
- Hier erfahren Sie, wie Sie Ihre eigenen Formulare und Dokumente mithilfe von Dokument Intelligenz Studio verarbeiten.