Teilen über


Übersicht über die unstrukturierte Dokumentverarbeitung in Microsoft Syntex

Hinweis

Bis Juni 2025 können Sie die unstrukturierte Dokumentverarbeitung und andere ausgewählte Syntex-Dienste kostenlos testen, wenn Sie die abrechnungsbasierte Bezahlung eingerichtet haben. Informationen und Einschränkungen finden Sie unter Testen von Microsoft Syntex und Erkunden der zugehörigen Dienste.

Verwenden Sie das unstrukturierte Dokumentverarbeitungsmodell (Lehrmethode), um Dateien automatisch zu klassifizieren und Informationen zu extrahieren. Dies funktioniert am besten für unstrukturierte Dokumente, z. B. Briefe oder Verträge.

Hinweis

Microsoft respektiert den Datenschutz und den Besitz von Daten, die Sie zum Trainieren und Verarbeiten von Modellen in Syntex verwenden. Keine der Daten Ihrer Organisation wird von Microsoft verwendet oder übertragen, um KI-Modelle, großsprachige Modelle oder andere Modelle zu trainieren. Ihre Daten bleiben sicher im Mandanten Ihrer Organisation. Weitere Informationen finden Sie unter Datenschutz und Datenschutz von Microsoft.

Einführung in unstrukturierte Modelle

Das unstrukturierte Dokumentverarbeitungsmodell (früher als Dokumentverständnismodell bezeichnet) verwendet künstliche Intelligenz (KI), um Dokumente zu verarbeiten. Diese Dokumente müssen Text enthalten, der anhand von Phrasen oder Mustern erkannt werden kann. Der erkannte Text bestimmt sowohl den Dateityp (seine Klassifizierung) als auch das, was extrahiert werden soll (die Extraktoren).

Hinweis

Weitere Informationen zur Verwendung von Syntex und Szenariobeispielen finden Sie unter Erste Schritte bei der Einführung von Microsoft Syntex und Szenarien und Anwendungsfällen für Microsoft Syntex.

Unstrukturierte Dokumentverarbeitungsmodelle werden in einem SharePoint-Websitetyp erstellt und verwaltet, der als Inhaltscenter bezeichnet wird. Ein auf eine SharePoint-Dokumentbibliothek angewendetes Modell ist mit einem Inhaltstyp verknüpft und enthält Spalten zum Speichern der extrahierten Informationen. Der von Ihnen erstellte Inhaltstyp wird im SharePoint-Inhaltstypkatalog gespeichert. Sie können auch vorhandene Inhaltstypen verwenden, um deren Schema zu verwenden.

Hinweis

Schreibgeschützte oder versiegelte Inhaltstypen können nicht aktualisiert werden, sodass sie nicht in einem Modell verwendet werden können.

Fügen Sie Klassifizierer und Extraktoren zu Ihren unstrukturierten Dokumentverarbeitungsmodellen hinzu, um die folgenden Aktionen auszuführen:

  • Klassifizierungen werden verwendet, um Dokumente zu identifizieren und zu klassifizieren, die in die Dokumentbibliothek hochgeladen werden. So kann beispielsweise eine Klassifizierung "trainiert" werden, alle Vertragsverlängerungsdokumente zu erkennen, die in die Bibliothek hochgeladen werden. Der Inhaltstyp der Vertragsverlängerung wird von Ihnen bei der Erstellung der Klassifizierung definiert.

  • Extraktoren rufen Informationen aus diesen Dokumenten ab. Beispielsweise werden für jedes in Ihrer Dokumentbibliothek identifizierte Vertragsverlängerungsdokument Spalten angezeigt, die das Startdatum des Diensts und den Client für jedes Dokument anzeigen.

Sie können Beispieldateien verwenden, um Ihre Klassifizierungen und Extraktoren im Modell zu trainieren und zu testen. Beispieldateien liefern Ihrem Modell Beispiele für das, wonach gesucht werden soll, wenn nach zu extrahierenden Daten in Dateien gesucht wird. So würden Sie beispielsweise Ihre Klassifizierungen und Extraktoren für Vertragsverlängerungen mit Beispielen für Vertragsverlängerungsdokumente trainieren, die in Ihrem Unternehmen verwendet werden. Sie können Beispieldateien auch dazu verwenden, die Effektivität Ihres Modells zu testen.

Nach dessen Veröffentlichung können Sie das Modell über das Inhaltscenter auf eine beliebige SharePoint-Dokumentbibliothek anwenden, auf die Sie Zugriff haben.

Anforderungen und Einschränkungen

Informationen zu den Anforderungen, die bei der Auswahl dieses Modells zu berücksichtigen sind, finden Sie unter Anforderungen und Einschränkungen für Modelle in Microsoft Syntex.