Schritt 1. Verwenden von Microsoft Syntex zum Identifizieren von Vertragsdateien und Extrahieren von Daten

Ihre Organisation benötigt eine Möglichkeit, alle Vertragsdokumente aus den vielen Dateien zu identifizieren und zu klassifizieren, die Sie erhalten. Sie möchten auch in der Lage sein, schnell mehrere wichtige Elemente in jeder der identifizierten Vertragsdateien (z. B. Kunde, Auftragnehmer und Gebührenbetrag) anzuzeigen. Dazu können Sie syntex] verwenden, um ein unstrukturiertes Dokumentverarbeitungsmodell zu erstellen und es auf eine Dokumentbibliothek anzuwenden.

Übersicht über den Vorgang

Unstrukturierte Dokumentverarbeitungsmodelle verwenden künstliche Intelligenz (KI), um die Klassifizierung von Dateien und die Extraktion von Informationen zu automatisieren. Diese Modelltypen eignen sich auch optimal für das Extrahieren von Informationen aus unstrukturierten und teilweise strukturierten Dokumenten, bei denen die benötigten Informationen nicht in Tabellen oder Formularen enthalten sind, z. B. Verträge.

Unstrukturierte Dokumentverarbeitungsmodelle verwenden OCR-Technologie (Optische Zeichenerkennung), um PDFs, Bilder und TIFF-Dateien zu scannen, sowohl beim Trainieren eines Modells mit Beispieldateien als auch beim Ausführen des Modells für Dateien in einer Dokumentbibliothek.

  1. Zunächst müssen Sie mindestens fünf Beispieldateien finden, mit denen Sie das Modell "trainieren" können, um nach Merkmalen zu suchen, die für den Inhaltstyp spezifisch sind, den Sie identifizieren möchten (ein Vertrag).

  2. Erstellen Sie mithilfe von Syntex ein neues unstrukturiertes Dokumentverarbeitungsmodell. Mithilfe Ihrer Beispieldateien müssen Sie einen Klassifizierer erstellen. Indem Sie den Klassifizierer mit Ihren Beispieldateien trainieren, bringen Sie ihm bei, nach Merkmalen zu suchen, die spezifisch für das sind, was Sie in den Verträgen Ihres Unternehmens sehen würden. Erstellen Sie beispielsweise eine "Erklärung", die nach bestimmten Zeichenfolgen sucht, die in Ihren Verträgen enthalten sind, z. B. Servicevertrag, Vertragsbedingungen und Vergütung. Sie können ihre Erklärung sogar trainieren, um in bestimmten Abschnitten des Dokuments oder neben anderen Zeichenfolgen nach diesen Zeichenfolgen zu suchen. Wenn Sie der Meinung sind, dass Sie Ihren Klassifizierer mit den benötigten Informationen trainiert haben, können Sie Ihr Modell anhand eines Beispielsatzes von Beispieldateien testen, um zu sehen, wie effizient es ist. Nach dem Testen können Sie bei Bedarf Änderungen an Ihren Erklärungen vornehmen, um sie effizienter zu gestalten.

  3. In Ihrem Modell können Sie einen Extraktor erstellen , um bestimmte Daten aus jedem Vertrag herauszuziehen. Für jeden Vertrag sind z. B. die Informationen, über die Sie am meisten besorgt sind, wer der Kunde ist, der Name des Auftragnehmers und die Gesamtkosten.

  4. Nachdem Sie Ihr Modell erfolgreich erstellt haben, wenden Sie es auf eine SharePoint-Dokumentbibliothek an. Wenn Sie Dokumente in die Dokumentbibliothek hochladen, wird Ihr unstrukturiertes Dokumentverarbeitungsmodell ausgeführt und identifiziert und klassifizieren alle Dateien, die dem in Ihrem Modell definierten Vertragsinhaltstyp entsprechen. Alle Dateien, die als Verträge klassifiziert sind, werden in einer benutzerdefinierten Bibliotheksansicht angezeigt. Die Dateien zeigen auch die Werte aus jedem Vertrag an, den Sie in Ihrem Extraktor definiert haben.

    Verträge in der Dokumentbibliothek.

  5. Wenn Sie Aufbewahrungs- oder Sicherheitsanforderungen für Ihre Verträge haben, können Sie Ihr Modell auch verwenden, um eine Aufbewahrungsbezeichnung oder eine Vertraulichkeitsbezeichnung anzuwenden, die verhindert, dass Ihre Verträge für einen bestimmten Zeitraum gelöscht werden, oder um einzuschränken, wer auf die Verträge zugreifen kann.

Schritte zum Erstellen und Trainieren Ihres Modells

Hinweis

Für diese Schritte können Sie die Beispieldateien im Repository "Contracts Management Solution Assets" verwenden. Die Beispiele in diesem Repository enthalten sowohl die Modelldateien als auch die Dateien, die zum Trainieren des Modells verwendet werden.

Erstellen eines Vertragsmodells

Der erste Schritt besteht darin, Ihr Vertragsmodell zu erstellen.

  1. Wählen Sie im Inhaltscenter neue>Modelllernmethode> aus.

  2. Geben Sie im Bereich Modell mit der Lehrmethode erstellen im Feld Name den Namen des Modells ein. Für diese Vertragsverwaltungslösung können Sie das Modell Contract nennen.

  3. Wählen Sie Erstellen. Dadurch wird eine Homepage für das Modell erstellt.

    Screenshot der Vertragsstartseite.

Trainieren Ihres Modells zum Klassifizieren eines Dateityps

Hinzufügen von Beispieldateien für Ihr Modell

Sie müssen mindestens fünf Beispieldateien hinzufügen, bei denen es sich um Vertragsdokumente handelt, und eine Beispieldatei, die kein Vertragsdokument ist (z. B. eine Arbeitserklärung).

  1. Wählen Sie auf der Seite Modellvertrag > unter Schlüsselaktionen>Beispieldateien hinzufügendie Option Dateien hinzufügen aus.

    Screenshot: Seite

  2. Öffnen Sie auf der Seite Beispieldateien für Ihr Modell auswählen den Ordner Vertrag, wählen Sie die dateien aus, die Sie verwenden möchten, und wählen Sie dann Hinzufügen aus. Wenn Keine Beispieldateien vorhanden sind, wählen Sie Hochladen aus, um sie hinzuzufügen.

Bezeichnen der Dateien als positive oder negative Beispiele

  1. Wählen Sie auf der Seite Modellvertrag > unter Schlüsselaktionen>Dateien klassifizieren und Training ausführen die Option Klassifizierer trainieren aus.

    Screenshot: Seite

  2. Auf der Seite Modellvertragsklassifizierer >> wird im Viewer oben in der ersten Beispieldatei Text mit der Frage angezeigt, ob die Datei ein Beispiel für das von Ihnen erstellte Vertragsmodell ist. Wenn es sich um ein positives Beispiel handelt, wählen Sie Ja aus. Wenn es sich um ein negatives Beispiel handelt, wählen Sie Nein aus.

  3. Wählen Sie in der Liste Bezeichnete Beispiele auf der linken Seite andere Dateien aus, die Sie als Beispiele verwenden möchten, und bezeichnen Sie sie.

    Homepage des Klassifizierers

Fügen Sie mindestens eine Erklärung hinzu, um den Klassifizierer zu trainieren.

  1. Wählen Sie auf der Seite Modellvertragsklassifizierer >> die Registerkarte Trainieren aus.

  2. Im Abschnitt Trainierte Dateien wird eine Liste der Beispieldateien angezeigt, die Sie zuvor beschriftet haben. Wählen Sie eine der positiven Dateien aus der Liste aus, um sie im Viewer anzuzeigen.

  3. Wählen Sie im Abschnitt Erläuterungendie Option Neu und dann Leer aus.

  4. Auf der Seite Erklärung erstellen:

    a. Geben Sie im Feld Name den Namen der Erklärung ein (z. B. "Vereinbarung").

    b. Wählen Sie im Feld Erklärungstyp die Option Ausdrucksliste aus, da Sie eine Textzeichenfolge hinzufügen.

    c. Geben Sie im Feld Ausdrucksliste die Zeichenfolge ein (z. B. "AGREEMENT"). Sie können Groß-/Kleinschreibung beachten auswählen, wenn bei der Zeichenfolge die Groß-/Kleinschreibung beachtet werden muss.

    d. Wählen Sie Speichern und trainieren aus.

    Screenshot des Bereichs

Testen Ihres Modells

Sie können Ihr Vertragsmodell mit Beispieldateien testen, die es noch nicht gesehen hat. Dies ist optional, kann aber eine nützliche bewährte Methode sein.

  1. Wählen Sie auf der Seite Modellvertragsklassifizierer >> die Registerkarte Test aus. Dadurch wird das Modell für Ihre Nichtbeschriftungsbeispieldateien ausgeführt.

  2. In der Liste Testdateien werden Ihre Beispieldateien angezeigt und zeigen an, ob das Modell sie als positiv oder negativ vorhergesagt hat. Mithilfe dieser Informationen können Sie ermitteln, wie effektiv Ihr Klassifizierer bei der Identifizierung Ihrer Dokumente ist.

    Screenshot: Dateien ohne Bezeichnung in der Liste

  3. Wenn Sie fertig sind, wählen Sie Training beenden aus.

Erstellen und Trainieren eines Extraktors

  1. Wählen Sie auf der Seite Modellvertrag > unter Schlüsselaktionen>Extraktoren erstellen und trainieren die Option Extraktor erstellen aus.

    Screenshot: Seite

  2. Geben Sie im Bereich Neue Entitätsextraktion im Feld Neuer Name den Namen Ihres Extraktors ein. Nennen Sie ihn z. B . Client , wenn Sie den Namen des Clients aus jedem Vertrag extrahieren möchten.

  3. Wenn Sie fertig sind, wählen Sie Erstellen aus.

Bezeichnen der Entität, die Sie extrahieren möchten

Wenn Sie den Extraktor erstellen, wird die Extraktorseite geöffnet. Dort sehen Sie eine Liste Ihrer Beispieldateien, wobei die erste Datei auf der Liste im Viewer angezeigt wird.

Screenshot der Seite mit beschrifteten Beispielen für den Clientextraktor.

So bezeichnen Sie die Entität:

  1. Wählen Sie im Viewer die Daten, die aus den Dateien extrahiert werden sollen. Wenn Sie beispielsweise den Client extrahieren möchten, markieren Sie den Clientwert in der ersten Datei (in diesem Beispiel Best For You Organics), und wählen Sie dann Speichern aus. Der Wert aus der Datei wird in der Liste bezeichneter Beispiele unter der Spalte Bezeichnung angezeigt.

  2. Wählen Sie Nächste Datei aus, um automatisch zu speichern, und öffnen Sie die nächste Datei in der Liste im Viewer. Oder wählen Sie Speichern aus, und wählen Sie dann eine andere Datei aus der Liste Bezeichnete Beispiele aus.

  3. Wiederholen Sie im Viewer die Schritte 1 und 2, und wiederholen Sie dann, bis Sie die Bezeichnung in allen Dateien gespeichert haben.

Nachdem Sie die Dateien beschriftet haben, wird ein Benachrichtigungsbanner angezeigt, das Sie informiert, zum Training zu wechseln. Sie können wählen, ob Sie weitere Dokumente beschriften oder zum Training wechseln möchten.

Hinzufügen einer Erläuterung

Sie können eine Erklärung erstellen, die einen Hinweis auf das Entitätsformat selbst und Variationen enthält, die in den Beispieldateien auftreten können. Beispielsweise kann ein Datumswert in vielen verschiedenen Formaten vorliegen, z. B.:

  • 14/10/2019
  • 14. Oktober 2019
  • Montag, 14. Oktober 2019

Um das Vertragsanfangsdatum zu ermitteln, können Sie eine Erklärung erstellen.

  1. Wählen Sie im Abschnitt Erläuterungendie Option Neu und dann Leer aus.

  2. Auf der Seite Erklärung erstellen:

    a. Geben Sie im Feld Name den Namen der Erklärung ein (z. B. Datum).

    b. Wählen Sie im Feld Erklärungstyp die Option Ausdrucksliste aus.

    c. Geben Sie im Feld Wert die Datumsvariation an, die in den Beispieldateien angezeigt wird. Wenn Sie z. B. Daten im Format 0/00/0000 haben, geben Sie sämtliche Varianten ein, die in Ihren Dokumenten angezeigt werden, wie z. B.:

    • 0/0/0000
    • 0/00/0000
    • 00/0/0000
    • 00/00/0000
  3. Wählen Sie Speichern und trainieren aus.

Testen Sie Ihr Modell erneut.

Sie können Ihr Vertragsmodell mit Beispieldateien testen, die es noch nicht gesehen hat. Dies ist optional, kann aber eine nützliche bewährte Methode sein.

  1. Wählen Sie auf der Seite Modellvertragsklassifizierer >> die Registerkarte Test aus. Dadurch wird das Modell für Ihre Nichtbeschriftungsbeispieldateien ausgeführt.

  2. In der Liste Testdateien werden Ihre Beispieldateien angezeigt und zeigt an, ob das Modell in der Lage ist, die benötigten Informationen zu extrahieren. Mithilfe dieser Informationen können Sie ermitteln, wie effektiv Ihr Klassifizierer bei der Identifizierung Ihrer Dokumente ist.

  3. Wenn Sie fertig sind, wählen Sie Training beenden aus.

Anwenden Ihres Modells auf eine Dokumentbibliothek

So wenden Sie Ihr Modell auf eine SharePoint-Dokumentbibliothek an:

  1. Wählen Sie auf der Seite Modellvertrag > unter Schlüsselaktionen>Modell auf Bibliotheken anwenden die Option Modell anwenden aus.

    Screenshot: Seite

  2. Wählen Sie im Bereich Vertrag hinzufügen die SharePoint-Website aus, die die Dokumentbibliothek enthält, auf die Sie das Modell anwenden möchten. Wenn die Website in der Liste nicht angezeigt wird, verwenden Sie das Suchfeld, um Sie zu finden. Klicken Sie auf Hinzufügen.

    Hinweis

    Sie müssen über die Berechtigung Listen verwalten oder Bearbeiten für die Dokumentbibliothek verfügen, auf die Sie das Modell anwenden möchten.

  3. Nachdem Sie die Website ausgewählt haben, wählen Sie die Dokumentbibliothek aus, auf die Sie das Modell anwenden möchten.

  4. Da das Modell einem Inhaltstyp zugeordnet ist, fügt es beim Anwenden auf die Bibliothek den Inhaltstyp und seine Ansicht mit den von Ihnen extrahierten Bezeichnungen hinzu, die als Spalten angezeigt werden. Diese Ansicht ist standardmäßig die Standardansicht der Bibliothek. Optional können Sie jedoch festlegen, dass sie nicht die Standardansicht ist, indem Sie Erweiterte Einstellungen auswählen und das Kontrollkästchen Diese neue Ansicht als Standard festlegen deaktivieren.

  5. Wählen Sie Hinzufügen aus, um das Modell auf die Bibliothek anzuwenden.

  6. Auf der Seite Modellvertrag > wird im Abschnitt Bibliotheken mit diesem Modell die URL zur SharePoint-Website aufgelistet.

    Screenshot der Vertragsstartseite mit dem Abschnitt

  7. Unter Einstellungen>Bibliothekseinstellungen:

    • Fügen Sie eine Spalte mit dem Namen Status hinzu, und wählen Sie Auswahl als Spaltentyp aus.
    • Wenden Sie die Werte In review( In review), Approved (Genehmigt) und Rejected (Abgelehnt) an .

Nachdem Sie das Modell auf die Dokumentbibliothek angewendet haben, können Sie mit dem Hochladen von Dokumenten auf die Website beginnen und die Ergebnisse anzeigen.

Nächster Schritt

Schritt 2. Verwenden von Microsoft Teams zum Erstellen Ihres Vertragsverwaltungskanals