Bearbeiten

Share via


Automatisieren der PDF-Formularverarbeitung

Azure KI Dokument Intelligenz
Azure KI Services
Azure Logic Apps
Azure-Funktionen

In diesem Artikel wird eine Azure-Architektur beschrieben, mit der Sie kostspielige und unflexible Formularverarbeitungsmethoden durch kostengünstige und flexible automatisierte PDF-Verarbeitung ersetzen können.

Aufbau

Diagramm der Architektur für die PDF-Formularverarbeitung

Laden Sie eine PowerPoint-Datei zu dieser Architektur herunter.

Workflow

  1. Ein bestimmtes Outlook-E-Mail-Konto empfängt PDF-Dateien als Anlagen. Das Eintreffen einer E-Mail löst eine Logik-App zum Verarbeiten der E-Mail aus. Die Logik-App wird mithilfe der Funktionen von Azure Logic Apps erstellt.
  2. Die Logik-App lädt die PDF-Dateien in einen Container in Azure Data Lake Storage hoch.
  3. Sie können PDF-Dateien auch manuell oder programmgesteuert in denselben PDF-Container hochladen.
  4. Das Eintreffen einer PDF-Datei im PDF-Container löst eine weitere Logik-App zum Verarbeiten der PDF-Formulare aus, die sich in der PDF-Datei befinden.
  5. Die Logik-App sendet den Speicherort der PDF-Datei zur Verarbeitung an eine Funktions-App. Die Funktions-App wird mithilfe der Funktionen von Azure Functions erstellt.
  6. Die Funktions-App empfängt den Speicherort der Datei und führt die diese Aktionen aus:
    1. Sie teilt die Datei in einzelne Seiten auf, wenn sie mehrere Seiten enthält. Jede Seite enthält ein unabhängiges Formular. Geteilte Dateien werden in einem zweiten Container in Data Lake Storage gespeichert.
    2. Sie verwendet HTTPS POST, eine Azure REST-API, um den Speicherort der Einzelseiten-PDF-Datei zur Verarbeitung an KI Dokument Intelligenz zu senden. Wenn Azure KI Dokument Intelligenz die Verarbeitung abgeschlossen hat, sendet es eine Antwort zurück an die Funktions-App, welche die Informationen in einer Datenstruktur platziert.
    3. Sie erstellt eine JSON-Datendatei, welche die Antwortdaten enthält, und speichert die Datei in einem dritten Container in Data Lake Storage.
  7. Die Logik-App für die Formularverarbeitung empfängt die verarbeiteten Antwortdaten.
  8. Die Logik-App für die Formularverarbeitung sendet die verarbeiteten Daten an Azure Cosmos DB, das die Daten in einer Datenbank und in Sammlungen speichert.
  9. Power BI ruft die Daten aus Azure Cosmos DB ab und bietet Erkenntnisse und Dashboards.
  10. Sie können bei Bedarf eine weitere Verarbeitung für die Daten implementieren, die sich in Azure Cosmos DB befinden.

Komponenten

  • Azure KI Services ist eine Kategorie von Azure KI-Produkten, die Azure KI Services, aufgabenspezifische KI und Geschäftslogik verwenden, um schlüsselfertige KI-Dienste für gängige Geschäftsprozesse bereitzustellen. Eines dieser Produkte ist Azure KI Dokument Intelligenz, bei dem Machine Learning-Modelle verwendet werden, um Schlüssel/Wert-Paare, Text und Tabellen aus Dokumenten zu extrahieren.
  • Azure Logic Apps ist ein serverloser Clouddienst zum Erstellen und Ausführen automatisierter Workflows, die Apps, Daten, Dienste und Systeme integrieren.
  • Azure Functions ist eine serverlose Lösung, die es Ihnen ermöglicht, weniger Code zu schreiben, weniger Infrastruktur zu verwalten und Kosten zu sparen.
  • Azure Data Lake Storage ist die Grundlage für das Erstellen von Unternehmens-Data Lakes in Azure.
  • Azure Cosmos DB ist eine vollständig verwaltete und relationale NoSQL-Datenbank für die moderne App-Entwicklung.
  • Power BI ist eine Sammlung von Softwarediensten, Apps und Connectors, die zusammenarbeiten, damit Sie Ihre unabhängigen Datenquellen in kohärente, visuell ansprechende und interaktive Erkenntnisse umwandeln können.

Alternativen

  • Sie können Azure SQL Database anstelle von Azure Cosmos DB verwenden, um die verarbeiteten Formulardaten zu speichern.
  • Sie können Azure Data Explorer verwenden, um die verarbeiteten Formulardaten zu visualisieren, die in Data Lake Storage gespeichert sind.

Szenariodetails

Die Formularverarbeitung ist häufig eine kritische Geschäftsfunktion. Viele Unternehmen verlassen sich noch immer auf manuelle Prozesse, die kostspielig, zeitaufwendig und fehleranfällig sind. Das Ersetzen manueller Prozesse reduziert Kosten und Risiken und macht ein Unternehmen agiler.

In diesem Artikel wird eine Architektur beschrieben, mit der Sie die manuelle Verarbeitung von PDF-Formularen oder teure Legacy-Systeme ersetzen können, welche die Verarbeitung von PDF-Formularen automatisieren. Azure KI Dokument Intelligenz verarbeitet die PDF-Formulare, Logic Apps stellt den Workflow bereit, und Functions bietet Datenverarbeitungsfunktionen.

Bereitstellungsinformationen finden Sie unter Dieses Szenario bereitstellen in diesem Artikel.

Mögliche Anwendungsfälle

Die in diesem Artikel beschriebene Lösung kann viele Arten von Formularen verarbeiten, einschließlich:

  • Invoices
  • Zahlungsdatensätze
  • Sicherheitsdatensätze
  • Vorfallsdatensätze
  • Konformitätsdatensätze
  • Bestellungen
  • Zahlungsautorisierungsformulare
  • Gesundheitsuntersuchungsformulare
  • Umfrageformulare

Überlegungen

Diese Überlegungen setzen die Säulen des Azure Well-Architected Framework um, das aus einer Reihe von Leitprinzipien besteht, die zur Verbesserung der Qualität einer Workload verwendet werden können. Weitere Informationen finden Sie unter Microsoft Azure Well-Architected Framework.

Zuverlässigkeit

Zuverlässigkeit stellt sicher, dass Ihre Anwendung Ihre Verpflichtungen gegenüber den Kunden erfüllen kann. Weitere Informationen finden Sie in der Überblick über die Säule „Zuverlässigkeit“.

Eine zuverlässige Workload muss robust und verfügbar sein. Resilienz ist die Fähigkeit des Systems, nach Systemausfällen eine Wiederherstellung auszuführen und die Funktionsfähigkeit sicherzustellen. Das Ziel der Resilienz besteht darin, nach einem Ausfall wieder die volle Funktionsfähigkeit einer Anwendung herzustellen. Verfügbarkeit ist ein Maßstab dafür, ob Ihre Benutzer bei Bedarf jederzeit auf Ihre Workload Zugriff haben.

Diese Architektur ist als Startarchitektur gedacht, die Sie schnell bereitstellen und als Prototyp für eine Geschäftslösung verwenden können. Wenn Ihr Prototyp erfolgreich ist, können Sie die Architektur bei Bedarf erweitern und verbessern, um zusätzliche Anforderungen zu erfüllen.

Diese Architektur nutzt skalierbare und resiliente Azure-Infrastruktur und -Technologien. Azure Cosmos DB verfügt beispielsweise über integrierte Redundanz und globale Abdeckung, die Sie konfigurieren können, um Ihren Anforderungen zu entsprechen.

Die Verfügbarkeitsgarantien der Azure-Dienste, die von dieser Lösung verwendet werden, finden Sie unter Vereinbarungen zum Servicelevel (Service Level Agreements, SLAs) für Onlinedienste.

Sicherheit

Sicherheit bietet Schutz vor vorsätzlichen Angriffen und dem Missbrauch Ihrer wertvollen Daten und Systeme. Weitere Informationen finden Sie unter Übersicht über die Säule „Sicherheit“.

Das Outlook-E-Mail-Konto, das in dieser Architektur verwendet wird, ist ein dediziertes E-Mail-Konto, das PDF-Formulare als Anlagen empfängt. Es empfiehlt sich, die Absender nur auf vertrauenswürdige Parteien zu beschränken und zu verhindern, dass böswillige Akteure das E-Mail-Konto mit Spam füllen.

Die Implementierung dieser Architektur, die unter Dieses Szenario bereitstellen beschrieben wird, ergreift die folgenden Maßnahmen, um die Sicherheit zu erhöhen:

  • Die PowerShell- und Bicep-Bereitstellungsskripts verwenden Azure Key Vault, um vertrauliche Informationen zu speichern, sodass diese nicht auf Terminalbildschirmen angezeigt oder in Bereitstellungsprotokollen gespeichert werden.
  • Verwaltete Identitäten bieten eine automatisch verwaltete Identität in Microsoft Entra ID, die Anwendungen verwenden können, wenn sie sich mit Ressourcen verbinden, die die Microsoft Entra-Authentifizierung unterstützen. Die Funktions-App verwendet verwaltete Identitäten, damit der Code nicht von einzelnen Prinzipalen abhängt und keine vertraulichen Identitätsinformationen enthält.

Kostenoptimierung

Bei der Kostenoptimierung geht es um die Suche nach Möglichkeiten, unnötige Ausgaben zu reduzieren und die Betriebseffizienz zu verbessern. Weitere Informationen finden Sie unter Übersicht über die Säule „Kostenoptimierung“.

Hier finden Sie einige Richtlinien für die Kostenoptimierung:

  • Nutzen Sie für Ihre Architektur die Strategie mit nutzungsbasierter Bezahlung, und skalieren Sie nach Bedarf auf, anstatt bereits zu Beginn in umfangreiche Ressourcen zu investieren.
  • Die Implementierung der Architektur, die unter Dieses Szenario bereitstellen beschrieben wird, stellt eine Startlösung bereit, die für den Proof of Concept geeignet ist. Die Bereitstellungsskripts erstellen eine funktionierende Architektur mit minimalen Ressourcenanforderungen. Beispielsweise erstellen die Bereitstellungsskripts einen kleinsten serverlosen Linux-Host, um die Funktions-App auszuführen.

Effiziente Leistung

Leistungseffizienz ist die Fähigkeit Ihrer Workload, auf effiziente Weise zu skalieren, um die Anforderungen zu erfüllen, die von den Benutzer gestellt werden. Weitere Informationen finden Sie unter Übersicht über die Säule „Leistungseffizienz“.

Diese Architektur verwendet Dienste, die über integrierte Skalierungsfunktionen verfügen, mit denen Sie die Leistungseffizienz verbessern können. Hier einige Beispiele:

Bereitstellen dieses Szenarios

Sie können eine rudimentäre Version dieser Architektur, einen Solution Accelerator, bereitstellen und als Startpunkt für die Bereitstellung Ihrer eigenen Lösung verwenden. Die Referenzimplementierung für den Beschleuniger umfasst Code, Bereitstellungsskripts und einen Bereitstellungsleitfaden.

Die Beschleuniger empfängt die PDF-Formulare, extrahiert die Datenfelder und speichert die Daten in Azure Cosmos DB. Power BI visualisiert die Daten. Das Design verwendet eine modulare, metadatengesteuerte Methodik. Es gibt keine hartcodierten Formularfelder. Er kann beliebige PDF-Formulare verarbeiten.

Sie können den Beschleuniger unverändert ohne Codeänderung verwenden, um einzelne PDF-Formulare wie Sicherheitsformulare, Rechnungen, Vorfallsdatensätze und viele andere zu verarbeiten und zu visualisieren. Um es zu verwenden, müssen Sie nur Beispiel-PDF-Formulare sammeln, ein neues Modell trainieren, um das Layout der Formulare zu erlernen, und das Modell an die Lösung anschließen. Außerdem müssen Sie den Power BI-Bericht für Ihre Datasets neu gestalten, damit er die von Ihnen gewünschten Erkenntnisse liefert.

Die Implementierung verwendet das Azure KI Dokument Intelligenz-Studio zum Erstellen benutzerdefinierter Modelle. Der Beschleuniger verwendet die Feldnamen, die im Machine Learning-Modell gespeichert sind, als Referenz für die Verarbeitung anderer Formulare. Zum Erstellen eines benutzerdefinierten Machine Learning-Modells sind nur fünf Beispielformulare erforderlich. Sie können bis zu 100 benutzerdefinierte Modelle zusammenführen, um ein zusammengesetztes Machine Learning-Modell zu erstellen, das eine Vielzahl von Formularen verarbeiten kann.

Bereitstellungsrepository

Das GitHub-Repository für den Lösungsbeschleuniger befindet sich unter Azure PDF Form Automation Solution Accelerator, das den Bereitstellungsleitfaden für diese Lösung enthält.

Voraussetzungen für die Bereitstellung

Sie benötigen ein Azure-Abonnement, um bereitzustellen. Informationen zu kostenlosen Abonnements finden Sie unter Erstellen in der Cloud mit einem kostenlosen Azure-Konto.

Informationen zu den Diensten, die im Beschleuniger verwendet werden, finden Sie in den Übersichts- und Referenzartikeln, die hier aufgeführt sind:

Überlegungen zur Bereitstellung

Um einen neuen Typ von PDF-Formularen zu verarbeiten, verwenden Sie Beispiel-PDF-Dateien, um ein neues Machine Learning-Modell zu erstellen. Wenn das Modell bereit ist, schließen Sie die Modell-ID an die Lösung an.

Dieser Containername kann in den Bereitstellungsskripts konfiguriert werden, die Sie aus dem GitHub-Repository abrufen.

Die Architektur adressiert keine Anforderungen an Hochverfügbarkeit (High Availability, HA) oder Notfallwiederherstellung (Disaster Recovery, DR). Wenn Sie die aktuelle Architektur für die Produktionsbereitstellung erweitern und verbessern möchten, berücksichtigen Sie die folgenden Empfehlungen und Best Practices:

  • Entwerfen Sie die Architektur für Hochverfügbarkeit/Notfallwiederherstellung basierend auf Ihren Anforderungen, und verwenden Sie gegebenenfalls die integrierten Redundanzfunktionen.
  • Aktualisieren Sie den Bicep-Bereitstellungscode, um eine Computingumgebung zu erstellen, die Ihre Verarbeitungsvolumen verarbeiten kann.
  • Aktualisieren Sie den Bicep-Bereitstellungscode, um weitere Instanzen der Architekturkomponenten zu erstellen, um Ihre Anforderungen an Hochverfügbarkeit/Notfallwiederherstellung zu erfüllen.
  • Befolgen Sie die Anleitungen in Azure Storage-Redundanz, wenn Sie Speicher entwerfen und bereitstellen.
  • Befolgen Sie die Anleitungen in Business Continuity & Disaster Recovery, wenn Sie die Logik-Apps entwerfen und bereitstellen.
  • Befolgen Sie die Anleitungen in Zuverlässigkeit in Azure Functions, wenn Sie die Funktions-App entwerfen und bereitstellen.
  • Befolgen Sie die Anleitungen in Erreichen von Hochverfügbarkeit mit Azure Cosmos DB, wenn Sie eine Datenbank entwerfen und bereitstellen, die mithilfe von Azure Cosmos DB erstellt wurde.
  • Wenn Sie erwägen, dieses System in die Produktion zu verschieben, um große Mengen von PDF-Formularen zu verarbeiten, können Sie die Bereitstellungsskripts ändern, um einen Linux-Host mit mehr Ressourcen zu erstellen. Ändern Sie dazu den Code in deploy-functionsapp.bicep

Beitragende

Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:

Hauptautor:

Andere Mitwirkende:

Melden Sie sich bei LinkedIn an, um nicht öffentliche LinkedIn-Profile anzuzeigen.

Nächste Schritte