Freigeben über


Auswählen einer Azure AI-Zielsprachenverarbeitungstechnologie

Foundry Tools hilft Entwicklern und Organisationen, KI-basierte, fortgeschrittene, produktionsfähige Anwendungen zu erstellen, die sich an verantwortungsvolle KI-Praktiken orientieren, indem sie sofort einsatzbereite, vorgefertigte und anpassbare APIs und Modelle verwenden.

In diesem Artikel werden die Von Tools bereitgestellten Funktionen für die Sprachverarbeitung beschrieben, einschließlich natürlicher Sprachverarbeitung, Textanalyse, Sprachverständnis, Übersetzung und Dokumentdatenextraktion. Sie umfasst die folgenden Dienste:

  • Azure Language in Foundry Tools ist ein cloudbasierter Dienst, der Funktionen für die Verarbeitung natürlicher Sprachen zum Verstehen und Analysieren von Text bereitstellt, einschließlich der benannten Entitätserkennung (NER), der Stimmungsanalyse, der Spracherkennung, der Zusammenfassung und der Fragebeantwortung.

  • Azure Translator in Foundry Tools ist ein maschineller Übersetzungsdienst. Es bietet Echtzeittextübersetzung, Batch- und Einzeldateidokumentübersetzung sowie benutzerdefinierte Übersetzungen, die Sie verwenden können, um spezielle Terminologie oder branchenspezifische Sprache für Ihren Anwendungsfall zu integrieren. Azure Translator unterstützt mehrere Sprachen.

  • Azure Document Intelligence in Foundry Tools ist ein Dienst, der Bilder direkt in elektronische Formulare konvertiert. Sie können erwartete Felder und Suchbilder angeben, die Sie bereitstellen, um diese Felder ohne menschliche Eingriffe zu erfassen. Azure Document Intelligence hosten viele vorgefertigte Modelle. Sie können es auch verwenden, um eigene benutzerdefinierte Modelle zu erstellen.

  • Azure Content Understanding in Foundry Tools ist ein Dienst, der generative KI verwendet, um schemadefinierte Felder aus Dokumenten mithilfe von Beschreibungen natürlicher Sprachen zu extrahieren. Verwenden Sie Azure Content Understanding, wenn für Ihren Dokumenttyp kein vorgefertigtes Azure Document Intelligence-Modell vorhanden ist, wenn Sie Zuverlässigkeit und eine solide Grundlage für automatisierte Workflows benötigen oder wenn Sie eine für Retrieval-Augmented Generation (RAG) geeignete Markdown-Ausgabe benötigen.

  • Foundry Models ist ein Dienst, der KI-Modelle bereitstellt, die Sie direkt über APIs für Sprachaufgaben wie Inhaltsgenerierung, Zusammenfassung und Übersetzung verwenden können.

Azure-Sprache

Azure Language bietet spezielle Tools, die Agents über standardisierte Protokolle mit Sprachverarbeitungsdiensten verbinden.

Verwenden der Azure-Sprache für diese Aufgaben Verwenden Sie keine Azure-Sprache für diese Aufgaben.
Erstellen Sie intelligente Anwendungen mithilfe der webbasierten Microsoft Foundry-, REST-APIs und Clientbibliotheken. Durchsuchen von Dokumenten mithilfe eines Chats. Verwenden Sie stattdessen Azure AI Search .
Arbeiten Sie mit strukturierten oder unstrukturierten Dokumenten für die breite Palette sprachbezogener Aufgaben, die in diesem Artikel beschrieben werden. Überprüfen Sie Dokumente auf Die Sicherheit von Inhalten. Verwenden Sie die Inhaltssicherheit in der Gießereisteuerungsebene stattdessen.
Übersetzen von Dokumenten. Verwenden Sie für die Übersetzung Azure Translator.

Verfügbare Azure-Sprachtools

Der MCP-Server (Azure Language Model Context Protocol) verbindet Agents direkt mit Azure Language-Diensten über den MCP. Mit dieser Integration können Entwickler Unterhaltungsanwendungen erstellen, die über zuverlässige Funktionen für die Verarbeitung natürlicher Sprachen verfügen und gleichzeitig die Compliance, den Datenschutz und die Verarbeitungsgenauigkeit in KI-Workflows sicherstellen. Azure Language bietet sowohl Remote- als auch lokale MCP-Serveroptionen:

  • Remoteserver: Verfügbar über den Tools-Katalog für in der Cloud gehostete Bereitstellungen.
  • Lokaler Server: Verfügbar für Entwickler, die den Server lieber in ihrer eigenen Umgebung hosten möchten.

Verfügbare Azure-Sprach-Agents

Die folgende Tabelle enthält eine Liste der Agents, die in Azure Language für Szenarien mit konversationeller künstlicher Intelligenz verfügbar sind.

Agent Beschreibung
Intent-Routing-Agent Steuert Konversationsflüsse durch das Verstehen von Benutzerabsichten und liefert genaue Antworten in konversationalen KI-Anwendungen. Verwendet vorhersehbare Entscheidungsprozesse in Kombination mit kontrollierter Reaktionsgenerierung, um konsistente, zuverlässige Interaktionen zu gewährleisten.
Exakter Frageantwort-Agent Bietet zuverlässige, Wort-für-Wort-Antworten auf wichtige Geschäftsfragen. Automatisiert häufig gestellte Fragen, während die Überwachung und Qualitätskontrolle von Menschen beibehalten wird, um Genauigkeit und Compliance zu gewährleisten.

Verfügbare Azure-Sprachfeatures

Die folgende Tabelle enthält eine Liste der features, die in Azure Language verfügbar sind.

Funktion Beschreibung
NER Identifiziert verschiedene Einträge in Text und kategorisiert sie in vordefinierte Typen, z. B. Personen, Ereignisse, Orte und Datumsangaben.
Erkennung personenbezogener Daten und Gesundheitsdaten Identifiziert Entitäten in Text und Unterhaltungen, einschließlich Chats oder Transkriptionen, die personen zugeordnet sind. Erkennt und redigiert vertrauliche Informationen wie Telefonnummern, E-Mail-Adressen und Formen der Identifikation.
Sprachenerkennung Wertet Text aus und erkennt eine vielzahl von Sprachen und Dialekten.
Stimmungsanalyse und Opinion Mining Hilft Ihnen, die öffentliche Wahrnehmung Ihrer Marke oder Ihres Themas zu verstehen, indem Sie Text auf Anzeichen positiver oder negativer Stimmungen analysieren und mit bestimmten Aspekten des Inhalts verknüpfen.
Zusammenfassung Verdichtet Informationen für Text und Unterhaltungen. Unterstützt extrahierende Zusammenfassungen, die wichtige Sätze auswählen, abstrakte Zusammenfassungen, die präzise neue Sätze generieren, Unterhaltungszusammenfassungen, die Besprechungen mit Zeitstempeln zusammenfassen, und Zusammenfassungen für Callcenter.
Schlüsselbegriffserkennung Wertet die Hauptkonzepte in unstrukturiertem Text als Liste aus und gibt sie zurück.
Entitätsverknüpfung Disambiguiert Entitätsidentitäten, z. B. Wörter oder Ausdrücke, die in unstrukturiertem Text gefunden wurden, und gibt Links zu Wikipedia zurück. Entitätsverknüpfung wird am 1. September 2028 eingestellt. Es wird empfohlen, vorhandene Workloads zu NER zu migrieren.
Textanalyse im Gesundheitswesen Extrahiert und beschriftet relevante medizinische Informationen aus unstrukturierten Texten wie Arztnotizen, Entladungszusammenfassungen, klinischen Dokumenten und elektronischen Gesundheitsakten.

Wenn Sie Ihre Workload entwerfen, bewerten Sie den Verarbeitungsort und die Datenresidenz dieses in der Cloud gehosteten Features, um sicherzustellen, dass es Ihren Complianceerwartungen entspricht. Einige Workloads können Einschränkungen aufweisen, die ihre Kapazität zum Senden von Gesundheitsdaten an eine in der Cloud gehostete Plattform beschränken.

Sie können diese API als Docker-Container verwenden, um sie in Ihrem eigenen Compute in der Cloud oder lokal zu hosten. Dieser Prozess kann dabei helfen, Compliance-Bedenken im Zusammenhang mit der Nutzung von PaaS-Angeboten (Platform as a Service) zu beheben. Weitere Informationen finden Sie unter Textanalyse für Gesundheitscontainer verwenden.
Benutzerdefinierte Textklassifizierung Erstellt benutzerdefinierte KI-Modelle, um unstrukturierte Textdokumente in benutzerdefinierte Klassen zu klassifizieren, die Sie definieren.
Benutzerdefinierte NER Erstellt benutzerdefinierte KI-Modelle, um benutzerdefinierte Entitätskategorien wie Bezeichnungen für Wörter oder Ausdrücke mithilfe von unstrukturiertem Text zu extrahieren, den Sie bereitstellen.
Gesprächsverständnis (CLU) Erstellt benutzerdefinierte Verarbeitungsmodelle für natürliche Sprachen, um die Absicht des Benutzers von jeder Eingabe vorherzusagen und wichtige Informationen daraus zu extrahieren.
Orchestrierungsworkflow Verbindet CLU - und Frageantwortanwendungen .
Beantworten von Fragen Identifiziert die am besten geeignete Antwort für Benutzereingaben. Häufig verwendet, um Unterhaltungsclientanwendungen wie Social-Media-Anwendungen, Chatbots und sprachfähige Desktopanwendungen zu erstellen.

Auswählen eines Azure-Sprachfeatures

Die folgende Tabelle enthält eine Liste der möglichen Anwendungsfälle für Azure Language. Wenn ein Feature anpassbar ist, können Sie ein KI-Modell trainieren, indem Sie Microsoft-Tools verwenden, um Ihre spezifischen Daten anzupassen. Andernfalls ist die Funktion vorkonfiguriert, was bedeutet, dass ihre KI-Modelle unverändert bleiben. Sie stellen Ihre Daten bereit und verwenden die Ausgabe der Funktion in Ihren Anwendungen.

Anwendungsfall Anpassbar
Vorhersagen der Absicht von Benutzereingaben und Extrahieren von Informationen aus diesen Ja
Identifizieren und Redigieren vertraulicher Informationen wie personenbezogene Daten. No
Identifizieren Sie die Sprache, in der Text geschrieben ist. No
Extrahieren Sie medizinische Informationen aus klinischen oder medizinischen Dokumenten, ohne ein Modell zu erstellen. No
Extrahieren Sie medizinische Informationen aus klinischen oder medizinischen Dokumenten mithilfe eines Modells, das auf Ihre Daten trainiert wurde. Ja
Extrahieren von Informationskategorien, ohne ein benutzerdefiniertes Modell zu erstellen No
Extrahieren Sie Informationskategorien, indem Sie ein Modell verwenden, das für Ihre Daten spezifisch ist. Ja
Hauptthemen und wichtige Ausdrücke extrahieren No
Fassen Sie ein Dokument zusammen. No
Klassifizieren Sie Text mit Hilfe der Stimmungsanalyse. Ja
Klassifizieren Sie Text mit Hilfe von benutzerdefinierten Klassen. Ja
Klassifizieren von Elementen in Kategorien, die zum Zeitpunkt des Rückschlusses bereitgestellt werden. No
Verknüpfen Sie eine Entität mit Artikeln der Wissensdatenbank. No
Verstehen von generischen Fragen und Antworten Ja
Erstellen einer Unterhaltungsanwendung, die auf Benutzereingaben reagiert. No
Verbinden Sie Apps aus CLU und Fragebeantwortung. Ja

Azure Übersetzer

Azure Translator ist ein cloudbasierter neuraler Maschineller Übersetzungsdienst (NMT). Azure Translator betreibt viele Microsoft-Produkte und -Dienste, die Unternehmen weltweit für Sprachübersetzungen und andere sprachbezogene Aufgaben verwenden.

Verwenden von Azure Translator für diese Aufgaben Verwenden Sie Azure Translator nicht für diese Aufgaben.
Führen Sie die Übersetzung speziell aus. Azure Translator ist effektiver und kostengünstiger als allgemeine Foundation-Sprachmodelle aufgrund seiner gezielten Übersetzungsmodelle. Interagieren mit Chats.
Analysieren Sie Inhalte für die Stimmung. Verwenden Sie für die Stimmungsanalyse Azure Language.
Moderater Inhalt. Verwenden Sie für die Inhaltsmoderation die Inhaltssicherheit.

Funktionen und Entwicklungsoptionen

Die folgende Tabelle enthält eine Liste der features, die in Azure Translator verfügbar sind.

Funktion Beschreibung
Textübersetzung (Vorschau) Verwenden Sie die 2025-10-01-Preview-Version, um entweder standard NMT oder eine Sprachmodellbereitstellung (GPT-4o-mini oder GPT-4o) auszuwählen, um Text zu übersetzen. Sie benötigen eine Foundry-Ressource, um eine Sprachmodellbereitstellung zu verwenden.
Textübersetzung v3 (GA) Übersetzen Von Text zwischen unterstützten Quell- und Zielsprachen in Echtzeit. Erstellen Sie ein dynamisches Wörterbuch , und erfahren Sie, wie Sie Übersetzungen mithilfe der Azure Translator-API verhindern.
Asynchrone Dokumentübersetzung Übersetzen Sie Batchdateien und komplexe Dateien, wobei die Struktur und das Format der originalen Dokumente erhalten bleiben. Für den Batchübersetzungsprozess ist ein Azure Blob Storage-Konto erforderlich, das über Container für die Quelldokumente und die übersetzten Dokumente verfügt.
Synchrone Dokumentübersetzung Übersetzen Sie eine einzelne Dokumentdatei allein oder mit einer Glossardatei, wobei die Struktur und das Format des Originaldokuments beibehalten werden. Für den Dateikonvertierungsprozess ist kein Blob Storage-Konto erforderlich. Die endgültige Antwort enthält das übersetzte Dokument und wird direkt an den aufrufenden Client zurückgegeben.
Benutzerdefinierter Translator Erstellen Sie angepasste Modelle, um domänenspezifische und branchenspezifische Sprache, Terminologie und Stil zu übersetzen. Erstellen Sie ein Wörterbuch mit Ausdrücken oder Sätzen für benutzerdefinierte Übersetzungen.

Tipp

Verwenden Sie Foundry für Text- und synchrone Dokumentübersetzungsaufgaben über eine No-Code-Schnittstelle.

Anwendungsfälle

Die folgende Tabelle enthält eine Liste der möglichen Anwendungsfälle für Azure Translator.

Anwendungsfall Dokumentation
Übersetzen von branchenspezifischen Texten. Benutzerdefinierter Translator
Übersetzen Sie allgemeine Texte, die nicht branchenspezifisch sind. Textübersetzung

Azure Dokumentintelligenz

Verwenden Sie Azure Document Intelligence , um die Dokumentverarbeitung in Anwendungen und Workflows zu automatisieren, datengesteuerte Strategien zu verbessern und Dokumentsuchfunktionen zu erweitern.

Verwenden von Azure Document Intelligence für diese Aufgaben Verwenden Sie Azure Document Intelligence nicht für diese Aufgaben.
Extrahieren Sie bestimmte Felder aus bekannten Dokumenttypen, die über ein vordefiniertes Modell verfügen, z. B. Rechnungen, Belege, W-2s oder ID-Dokumente. Extrahieren Sie Felder aus benutzerdefinierten Dokumenttypen, die kein vordefiniertes Modell aufweisen und eine flexible, schemadefinierte Extraktion erfordern. Verwenden Sie stattdessen Azure Content Understanding .
Verarbeiten Sie große Mengen strukturierter oder semistrukturierter Dokumente, wenn Sie eine deterministische Extraktion mit geringer Variabilität benötigen. Erstellen Sie RAG-Pipelines, die eine Markdown-formatierte Ausgabe erfordern, welche eingebettete Abbildungen, eine Abschnittshierarchie und eine blockbereite Struktur umfasst. Verwenden Sie stattdessen Azure Content Understanding .
Schulen Sie benutzerdefinierte neuronale oder Vorlagenmodelle auf beschrifteten Datensätzen für Dokumenttypen, die speziell für Ihr Unternehmen sind. Für jedes extrahierte Feld sind Konfidenzbewertungen und Verankerungen erforderlich, um Workflows mit menschlicher Überprüfung zu ermöglichen. Verwenden Sie stattdessen Azure Content Understanding .
Identifizieren Sie wichtige Strukturen, z. B. Kopfzeilen, Fußzeilen und Kapitelumbrüche, in unterschiedlichen Sammlungen von Dokumenten, um mit dem Dokument programmgesteuert zu interagieren.

Dokumentanalysemodelle

Dokumentanalysemodelle extrahieren Text aus Formularen und Dokumenten und geben strukturierte, geschäftsbereite Inhalte zurück.

Modell Beschreibung
Lesen Extrahieren Sie gedruckten und handschriftlichen Text aus Dokumenten. Wird zum Digitalisieren von Dokumenten, Compliance- und Überwachungsaufgaben und zum Verarbeiten handschriftlicher Notizen verwendet.
Layout Extrahieren Sie Text, Tabellen und Dokumentstruktur. Wird für die Dokumentindizierung und -abrufung nach Struktur und für finanz- und medizinische Berichtsanalyse verwendet.

Vorkonfigurierte Dokumentmodelle

Vordefinierte Modelle fügen Ihren Apps und Flüssen intelligente Dokumentverarbeitung hinzu, ohne Ihre eigenen Modelle trainieren und erstellen zu müssen.

Modell Beschreibung
Rechnung Extrahieren Sie Kunden- und Lieferantendetails aus Rechnungen. Verwendung für die Verarbeitung von Verbindlichkeiten und die automatisierte Steuererfassung und -berichterstattung.
Beleg Extrahieren Sie Verkaufstransaktionsdetails aus Quittungen. Wird verwendet für die Spesenverwaltung, die Datenanalyse des Verbraucherverhaltens und die Rückerstattungsverarbeitung.
Identität Extrahieren Sie wichtige Informationen aus Passports, ID-Karten und Führerscheinen. Verwendung für Compliance,Verwaltung medizinischer Konten und Identitätsprüfpunkte (Know Your Customer, KYC).
Krankenversicherungskarte Extrahieren Sie wichtige Informationen aus US-Krankenversicherungskarten wie Versicherer, Mitglied und Gruppennummer. Wird zur Überprüfung von Abdeckung und Berechtigung sowie für wertbasierte Analysen verwendet.
Vertrag Extrahieren Sie Vereinbarungs- und Parteidetails aus Verträgen in verschiedenen Formaten, einschließlich gescannter Dokumente und digitaler PDF-Dateien.
Kreditkarte Extrahieren Sie Schlüsselfelder aus Kredit- und Debitkarten, z. B. Kartennummer, ausstellende Bank und Ablaufdatum.
Kontoauszug Extrahieren Sie Kontoinformationen und Transaktionsdetails aus Bankauszüge. Verwendung für die Steuerverarbeitung, Buchhaltungsverwaltung und Kreditdokumentationsverarbeitung.
Bankscheck Extrahieren Sie relevante Informationen aus Prüfungen. Verwendung für Kreditverwaltung und automatisiertes Kreditgebermanagement.
Lohnabrechnung Extrahieren Sie Gehaltsabrechnungsdetails. Wird für die Gehaltsabrechnungs-Detailüberprüfung und Betrugserkennung verwendet.
Heiratsurkunde Extrahieren sie zertifizierte Eheinformationen aus US-Ehescheinen.
US-Hypothekendokumente Extrahieren Sie die Kreditantragsdetails aus den Formularen 1003, 1004, 1005 und 1008 sowie den abschließenden Offenlegungen. Verwendung der Dokumentationsanforderungen für Fannie Mae und Freddie Mac.
US-Steuerdokumente Extrahieren Sie Informationen aus den Steuerformularvariationen W-2, 1098, 1099 und 1040. Verwendung für die automatisierte Steuerdokumentverwaltung und die Bearbeitung von Hypothekenkreditanträgen.

Benutzerdefinierte Modelle

Trainieren Sie benutzerdefinierte Modelle, indem Sie Ihre bezeichneten Datasets verwenden, um unterschiedliche Daten aus Formularen und Dokumenten zu extrahieren, die für Ihre Anwendungsfälle spezifisch sind.

Modell Beschreibung
Benutzerdefiniertes neuronales Modell Extrahieren Sie Daten aus gemischten Dokumenten, einschließlich strukturierter Dokumente wie Umfragen und Fragebogen, halbstrukturierte Dokumente wie Rechnungen und Bestellungen sowie unstrukturierte Dokumente wie Verträge und Briefe.
Benutzerdefiniertes Vorlagenmodell Extrahieren Sie beschriftete Werte und Felder aus strukturierten und semistrukturierten Dokumenten, die über definierte visuelle Vorlagen oder allgemeine visuelle Layouts verfügen.
Benutzerdefiniert zusammengesetzt Kombinieren Sie eine Sammlung von benutzerdefinierten Modellen, um ähnliche Formulartypen wie Bestellungen zu analysieren.
Benutzerdefinierter Klassifizierer Identifizieren Sie bestimmte Dokumenttypen oder Klassen, bevor Sie ein Extraktionsmodell aufrufen. Wird für Kreditantragspakete verwendet, die Antragsformulare, Zahlungsscheine und Bankauszüge enthalten.

Add-On-Funktionen

Azure Document Intelligence unterstützt die folgenden optionalen Features, die Sie je nach Dokumentextraktionsszenario aktivieren oder deaktivieren können:

  • Hochauflösende Extraktion
  • Formelextraktion
  • Extraktion von Schrifteigenschaften
  • Extrahieren von Barcodeeigenschaften
  • Durchsuchbare PDF
  • Abfragefelder
  • Schlüssel-Wert-Paare

Weitere Informationen zu Modellszenarien finden Sie unter Auswählen eines Azure Document Intelligence-Modells.

Azure Content Understanding (Inhaltsverständnis)

Azure Content Understanding verwendet generative KI, um strukturierte Felder aus Dokumenten basierend auf einem Schema zu extrahieren, das Sie in natürlicher Sprache definieren. Im Gegensatz zu Azure Document Intelligence, das auf vortrainierten oder benutzerdefinierten maschinellen Lernmodellen basiert, die an bestimmte Dokumentlayouts gebunden sind, verwendet Azure Content Understanding generative Modelle, um über Dokumentinhalte zu gründen und schemaorientierte JSON- oder RAG-ready Markdown-Ausgabe zu erzeugen. Darüber hinaus werden Vertrauenswerte pro Feld und Verankerung bereitgestellt. Verwenden Sie diese Features, um Workflows mit gezielter menschlicher Überprüfung zu automatisieren.

Verwenden von Azure Content Understanding für diese Aufgaben Verwenden Sie azure Content Understanding für diese Aufgaben nicht.
Extrahieren Sie Felder aus Dokumenttypen, die kein vordefiniertes Azure Document Intelligence-Modell aufweisen, indem Sie Schemadefinitionen verwenden, die in natürlicher Sprache geschrieben wurden. Extrahieren Sie Felder aus Standarddokumenttypen, die über ein vordefiniertes Azure Document Intelligence-Modell verfügen. Azure Document Intelligence ist kostengünstiger und deterministisch für diese Szenarien.
Erstellen Sie RAG-Pipelines, die eine Markdown-Ausgabe benötigen, welche für die Vektorindizierung das Layout, die Überschriften, Tabellen, Abbildungen und Anmerkungen beibehält. Verarbeiten Sie große Mengen einfacher, strukturierter Dokumente, wenn Sie die Sprachmodellvariabilität und -kosten minimieren müssen. Verwenden Sie stattdessen Azure Document Intelligence .
Steuern Sie Automatisierungsworkflows, die Konfidenzwerte pro Feld erfordern und die Fundierung, um Datensätze mit niedrigerer Zuverlässigkeit zur menschlichen Überprüfung weiterzuleiten. Führen Sie allgemeine Sprachaufgaben wie Zusammenfassungen oder Stimmungsanalysen aus. Verwenden Sie stattdessen Azure-Sprache oder -Modelle .
Klassifizieren Sie Dokumenttypen, bevor Sie sie an die entsprechende Analyse in einer Gemischtdokumentpipeline weiterleiten.

Verfügbare Azure Content Understanding-Features für Dokumente

Die folgende Tabelle enthält eine Liste der Dokumentfeatures, die in Azure Content Understanding verfügbar sind.

Funktion Beschreibung
Inhaltsextraktion Transformiert unstrukturierte Dokumente in strukturierte, maschinenlesbare Daten. Erfasst gedruckten und handschriftlichen Text, Auswahlmarken, Barcodes, mathematische Formeln, Bildelemente, Hyperlinks und Anmerkungen. Behält die Dokumentstruktur bei, einschließlich Absätzen, Tabellen, hierarchischen Abschnitten und Abbildungselementen.
Feldextraktion Extrahiert strukturierte Schlüsselwertpaare aus Dokumenten basierend auf einem von Ihnen definierten Schema. Extrahieren Sie Felder direkt aus der Quelle, klassifizieren Sie sie aus einer vordefinierten Gruppe von Kategorien, oder generieren Sie sie mithilfe eines generativen Modells. Konfidenzbewertungen und Verankerungen stehen für jedes Feld als Opt-In-Funktion zur Verfügung.
Vorgefertigte Dokumentanalyse Einsatzbereite Analysetools für gängige Unternehmensszenarien, einschließlich Vertragsmanagement über den Lebenszyklus, Darlehens- und Hypothekenanwendungen, Finanzberichten, Spesenverwaltung und Wissensdatenbankszenarien.
RAG-Ausgabe Erzeugt Markdown-formatierte Ausgabe, die die Dokumentstruktur für die Verwendung in Vektorspeichern und Suchindizes behält. Unterstützt Abbildungsbeschreibungen, Layoutanalyse und Anmerkungserkennung, sodass Abrufworkflows auf Inhalte zugreifen können, die von der standardmäßigen Unterteilung übersehen werden.

Anwendungsfälle

Die folgende Tabelle enthält eine Liste möglicher Anwendungsfälle für Azure Content Understanding für Dokumente.

Anwendungsfall Beschreibung
Lebenszyklusmanagement von Verträgen Extrahieren Sie Schlüsselfelder, Klauseln und Verpflichtungen aus verschiedenen Vertragstypen ohne Schulung eines layoutspezifischen Modells.
Kredit- und Hypothekenantragsverarbeitung Automatisieren Sie die Verarbeitung ergänzender Unterstützender Dokumentationen aus verschiedenen Formaten und Vorlagen, die über die Unterstützung von vorkonfigurierten Azure Document Intelligence-Hypothekenmodellen hinausgehen.
Ausgabenverwaltung Analysieren Sie Quittungen und Rechnungen aus verschiedenen Einzelhändlern und Formaten, indem Sie eine schemadefinierte Extraktion mit Konfidenzergebnissen verwenden, um Datensätze zu kennzeichnen, die eine menschliche Überprüfung benötigen.
RAG-Dokumentaufnahme Konvertieren Sie unstrukturierte Dokumente in strukturierte, durchsuchbare Datenressourcen mit layoutkonservierter Markdown-Ausgabe für die Verwendung in RAG-Suchpipelines und Agentworkflows.
Gemischte Dokumentklassifizierung und -routing Klassifizieren Sie eingehende Dokumente nach Typ, und leiten Sie jeden Typ an die entsprechende Analyse weiter. Dieser Ansatz ermöglicht die End-to-End-Automatisierung von Pipelines, die mehrere Dokumenttypen empfangen.

Modelle

Modelle bieten Zugriff auf einen Katalog von Foundation-Modellen von Microsoft, OpenAI und anderen führenden Anbietern. Diese Modelle können allgemeine Sprachaufgaben wie Inhaltsgenerierung, Zusammenfassung, Übersetzung und Unterhaltungsinteraktionen ausführen.

Verwenden von Modellen für diese Aufgaben Berücksichtigen Sie spezielle Dienste, wenn Sie diese Funktionen benötigen.
Erstellen Sie kreative Inhalte, Entwürfe oder Variationen von Text. Konsistente, wiederholbare Verarbeitungsaufgaben in natürlicher Sprache wie NER oder Stimmungsanalyse im Maßstab. Azure Language bietet optimierte, kostengünstige APIs für diese spezifischen Aufgaben.
Fassen Sie lange Dokumente oder Unterhaltungen zusammen. Übersetzung für große Mengen von Dokumenten bei beibehaltung der Formatierung. Azure Translator ist für die Erhaltung von Übersetzungsqualität und Dokumentstruktur optimiert.
Erstellen Sie unterhaltungliche KI-Erfahrungen und Chatbots. Strukturierte Datenextraktion aus Formularen und Rechnungen mit hoher Genauigkeit. Azure Document Intelligence bietet vorgefertigte Modelle, die speziell für Dokumenttypen trainiert wurden.
Beantworten Sie allgemeine Fragen basierend auf dem bereitgestellten Kontext.
Führen Sie ungeplante Sprachaufgaben mit flexibler Eingabeaufforderung aus.

Verfügbare Modelle

Modelle umfassen die folgenden KI-Modelle von mehreren Anbietern.

Modellfamilie Beschreibung
GPT-4o und GPT-4o mini OpenAI multimodale Modelle, die Sowohl Text als auch Bilder verarbeiten können, mit verbesserter Genauigkeit und Reaktionsfähigkeit für englische Text- und Codierungsaufgaben.
GPT-4.1-Serie OpenAI-Text- und Bildverarbeitungsmodelle mit großen Kontextfenstern (bis zu einer Million Token) für die Verarbeitung umfangreicher Dokumente.
GPT-5-Familie OpenAIs neueste Flaggschiff-Modelle der Generation mit fortschrittlichen Schlussfolgerungen, multimodalen Fähigkeiten und verbessertem Befolgen von Anweisungen. Diese Modelle entsprechen komplexen, mehrstufigen Sprachaufgaben, die eine hohe Genauigkeit erfordern.
o-Serie (o3, o4-mini) OpenAI-Begründungsmodelle, die für fortgeschrittene Problemlösungsaufgaben entwickelt wurden, die mehr Fokus und Fähigkeiten in Bereichen wie Wissenschaft, Codierung und Mathematik erfordern.
Phi-4-Familie Kleine Sprachmodelle (SLMs) von Microsoft, die für komplexes Denken optimiert sind. Phi-4 (14B-Parameter) zeichnet sich in Szenarien mit geringer Latenz aus, während Phi-4-Reasoning und Phi-4-mini-Reasoning spezialisierte Argumentationsfähigkeiten für mehrstufige Aufgaben zur Problemlösung bieten, die weniger Ressourcen erfordern. Unterstützt mehr als 40 Sprachen.
DeepSeek Open-weight Modelle, einschließlich DeepSeek-R1 für Aufgaben im Bereich logisches Denken und DeepSeek-V3 Serie für allgemeines Sprachverständnis. Bekannt für starke Leistung beim Codieren und mathematischen Begründungs-Benchmarks.
Grok xAI-Modelle, einschließlich Grok-3, Grok-4 und spezialisierte Varianten für Aufgaben des Nachdenkens und der Codierung. Verfügbar in schnell begründeten und nicht unangemessenen Konfigurationen.
Lama Die offenen Modelle von Meta, einschließlich Llama-3.3-70B-Instruct und Llama-4-Maverick für allgemeine Sprachaufgaben.
Mistral Europäische KI-Modelle, einschließlich Mistral-Large-3 und mistral-document-ai für Dokumentverarbeitungsszenarien.
Einbettungsmodelle Modelle von mehreren Anbietern, die Text in numerische Vektorform konvertieren, um die Textähnlichkeit und semantische Suche zu erleichtern.

Eine vollständige Liste der verfügbaren Modelle und der regionalen Verfügbarkeit finden Sie unter "Modelle", die direkt von Azure verkauft werden.

Erste Schritte

Um mit der Verwendung von Modellen für Sprachaufgaben zu beginnen, führen Sie einen der folgenden Ansätze aus:

  • No-Code-Ansatz: Verwenden Sie den Chat-Playground im Foundry-Portal, um Modelle bereitzustellen und Aufforderungen interaktiv zu testen.

  • Codebasierter Ansatz: Verwenden Sie das Foundry SDK , um Modelle mithilfe von Python, C#, TypeScript oder Java in Ihre Anwendungen zu integrieren.