Azure-Formularerkennung: Visitenkartenmodell

Dieser Artikel gilt für:Häkchen für Formularerkennung v3.0Formularerkennung v3.0. Ältere Version:Formularerkennung v2.1

Dieser Artikel gilt für:Häkchen für Formularerkennung v2.1Formularerkennung v2.1. Höhere Version:Formularerkennung v3.0

Das Visitenkartenmodell der Formularerkennung kombiniert leistungsstarke OCR (Optical Character Recognition)-Funktionen mit Deep Learning-Modellen, um Daten aus Visitenkartenbildern zu analysieren und zu extrahieren. Die API analysiert gedruckte Visitenkarten, extrahiert Schlüsselinformationen wie Vorname, Nachname, Firmenname, E-Mail-Adresse und Telefonnummer und gibt eine strukturierte JSON-Datendarstellung zurück.

Datenextraktion aus Visitenkarten

Visitenkarten stellen sowohl für ein Unternehmen als auch für seine Mitarbeiter eine hervorragende Präsentationsmöglichkeit dar. Das Firmenlogo, die Schriftarten und die Hintergrundbilder auf den Visitenkarten stärken das Branding des Unternehmens und heben es von anderen ab. Die Anwendung von OCR und auf maschinellem Lernen basierenden Techniken zur Automatisierung des Scannens von Visitenkarten ist ein gängiges Bildverarbeitungsszenario. Unternehmenssysteme, die von Vertriebs- und Marketingteams genutzt werden, verfügen in der Regel über eine integrierte Funktion zur Extraktion von Visitenkartendaten, die den Benutzern zugute kommt.

Beispielvisitenkarte, die mit Formularerkennung Studio verarbeitet wurde

Screenshot einer Beispiel-Visitenkarte, die im Formularerkennungsstudio analysiert wurde.

Mustervisitenkarte, bearbeitet mit dem Beispielbeschriftungstool aus der Formularerkennung

Screenshot einer Beispiel-Visitenkarte, die mit dem Beispielbeschriftungstool aus der Formularerkennung analysiert wurde.

Entwicklungsoptionen

Die Formularerkennung v3.0 unterstützt folgende Tools:

Funktion Ressourcen Modell-ID
Modell für Visitenkarten prebuilt-businessCard

Die Formularerkennung v2.1 unterstützt folgende Tools:

Funktion Ressourcen
Modell für Visitenkarten

Testen der Datenextraktion aus Visitenkarten

Erfahren Sie, wie Daten, einschließlich Name, Position, Adresse, E-Mail und Firmenname, aus Visitenkarten extrahiert werden. Sie benötigen die folgenden Ressourcen:

  • Azure-Abonnement – Sie können ein kostenloses Abonnement erstellen

  • Eine Formularerkennungsinstanz im Azure-Portal Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunktspeicherort im Azure-Portal

Formularerkennung Studio

Hinweis

Formularerkennungsstudio ist mit der v3.0-API verfügbar.

  1. Wählen Sie auf der Startseite von Azure-Formularerkennung Studio die Option Visitenkarten aus.

  2. Sie können entweder die Beispielvisitenkarte analysieren oder die Schaltfläche + Hinzufügen auswählen, um Ihr eigenes Beispiel hochzuladen.

  3. Wählen Sie die Schaltfläche Analysieren aus:

    Screenshot: Menü „Visitenkarte analysieren“

Tool zum Bezeichnen von Beispielen für die Formularerkennung

  1. Wechseln Sie zum Beispieltool für die Formularerkennung.

  2. Wählen Sie auf der Startseite des Beispieltools die Kachel Use prebuilt model to get data (Vordefiniertes Modell zum Abrufen von Daten verwenden) aus.

    Screenshot des Vorgangs zur Ergebnisanalyse des Layoutmodells.

  3. Wählen Sie im Dropdownfenster den zu analysierenden Formulartyp aus.

  4. Wählen Sie aus den folgenden Optionen eine URL zu der Datei aus, die Sie analysieren möchten:

  5. Wählen Sie im Feld Quelle die URL aus dem Dropdownmenü aus, fügen Sie die ausgewählte URL ein, und wählen Sie die Schaltfläche Abrufen aus.

    Screenshot des Dropdown-Menüs für den Quellort.

  6. Fügen Sie in das Feld Form recognizer service endpoint (Dienstendpunkt der Formularerkennung) den Endpunkt ein, den Sie mit Ihrem Abonnement für die Formularerkennung abgerufen haben.

  7. Fügen Sie in das Feld Schlüssel den Schlüssel ein, den Sie aus Ihrer Ressource für die Formularerkennung abgerufen haben.

    Screenshot: Dropdownmenü zum Auswählen des Formulartyps.

  8. Wählen Sie Run Analysis (Analyse ausführen) aus. Das Tool für die Beschriftung von Beispielen der Formularerkennung ruft die „Analyze Prebuilt“-API auf und analysiert das Dokument.

  9. Zeigen Sie die Ergebnisse an. Sehen Sie sich die extrahierten Schlüssel-Wert-Paare, die Positionen, den extrahierten markierten Text und die erkannten Tabellen an.

    Screenshot des Vorgangs zur Ergebnisanalyse des Visitenkartenmodells.

Hinweis

Das Tool für die Beschriftung von Beispielen unterstützt nicht das BMP-Dateiformat. Dies ist eine Einschränkung des Tools, nicht des Formularerkennungsdienstes.

Eingabeanforderungen

  • Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

  • Unterstützte Dateiformate:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP und TIFF
    Microsoft Office:
    Word (DOCX), Excel (XLS), PowerPoint (PPT) und HTML
    Lesen REST-API-Version
    2022/06/30-preview
    Layout
    Allgemeines Dokument
    Vordefiniert
    Benutzerdefiniert

    ✱ Microsoft Office-Dateien werden derzeit für andere Modelle oder Versionen nicht unterstützt.

  • In den Formaten PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße zur Dokumentanalyse muss kleiner als 500 MB für den kostenpflichtigen Tarif (S0) und 4 MB für den kostenlosen Tarif (F0) sein.

  • Die Bildgrößen müssen im Bereich zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.

  • Die PDF-Abmessungen sind bis zu 17 × 17 Zoll, sodass die Papierformate Legal oder A3 hineinpassen, oder kleiner.

  • Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.

  • Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkt-Text bei 150 Punkten pro Zoll (Dots per Inch, DPI).

  • Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.

  • Für das Training des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neuronale Modell.

  • Für das Training des benutzerdefinierten Klassifizierungsmodells beträgt die Gesamtgröße der Trainingsdaten 1GB mit einem Maximum von 10 000 Seiten.

  • Unterstützte Dateiformate: JPEG, PNG, PDF und TIFF
  • In den Formaten PDF und TIFF werden bis zu 2.000 Seiten verarbeitet. Bei Abonnements im Free-Tarif werden nur die ersten beiden Seiten verarbeitet.
  • Die Dateigröße muss weniger als 50 MB betragen, und die Abmessungen müssen mindestens 50 × 50 Pixel und höchstens 10.000 × 10.000 Pixel betragen.

Unterstützte Sprachen und Regionen

Hinweis

Es ist nicht erforderlich, ein Gebietsschema anzugeben. Dies ist ein optionaler Parameter. Die Deep Learning-Technologie der Formularerkennung erkennt automatisch die Sprache des Texts in Ihrem Bild.

Modell Sprache – Gebietsschemacode Standard
Visitenkarte (v3.0 API)
  • Englisch (USA) – en-US
  • Englisch (Australien) – en-AU
  • Englisch (Kanada) – en-CA
  • Englisch (Vereinigtes Königreich) – en-GB
  • Englisch (Indien) – en-IN
  • Englisch (Japan) – en-JP
  • Japanisch (Japan) – ja-JP
Automatisch erkannt (en-US oder ja-JP)
Visitenkarte (v2.1 API)
  • Englisch (USA) – en-US
  • Englisch (Australien) – en-AU
  • Englisch (Kanada) – en-CA
  • Englisch (Vereinigtes Königreich) – en-GB
  • Englisch (Indien) – en-IN
Automatisch erkannt

Feldextraktionen

Name type BESCHREIBUNG Standardisierte Ausgabe
ContactNames Array von Objekten Kontaktname
FirstName String Vorname des Kontakts
LastName String Nachname des Kontakts
CompanyNames Array von Zeichenfolgen Name(n) des Unternehmens
Departments Array von Zeichenfolgen Abteilung(en) oder Kontaktorganisation(en)
JobTitles Array von Zeichenfolgen Aufgeführte Position(en) des Kontakts
E-Mails Array von Zeichenfolgen E-Mail-Adresse(n) des Kontakts
Websites Array von Zeichenfolgen Website(s) des Unternehmens
Adressen Array von Zeichenfolgen Aus der Visitenkarte extrahierte Adresse(n)
MobilePhones Array aus Telefonnummern Mobiltelefonnummer(n) von der Visitenkarte +1 xxx xxx xxxx
Faxnummern Array aus Telefonnummern Faxnummer(n) von der Visitenkarte +1 xxx xxx xxxx
WorkPhones Array aus Telefonnummern Telefonnummer(n) (geschäftlich) von der Visitenkarte +1 xxx xxx xxxx
OtherPhones Array aus Telefonnummern Andere Telefonnummer(n) von der Visitenkarte +1 xxx xxx xxxx

Extrahierte Felder

Name type BESCHREIBUNG Text
ContactNames Array von Objekten Aus der Visitenkarte extrahierter Name des Kontakts [{ "FirstName": "John", "LastName": "Doe" }]
FirstName Zeichenfolge Vorname des Kontakts „John“
LastName Zeichenfolge Nachname des Kontakts „Doe“
CompanyNames array of strings Aus der Visitenkarte extrahierter Unternehmensname ["Contoso"]
Departments array of strings Abteilung oder Organisation des Kontakts ["R&D"]
JobTitles array of strings Aufgeführte Position des Kontakts ["Software Engineer"]
E-Mails array of strings Aus der Visitenkarte extrahierte E-Mail-Adresse des Kontakts ["johndoe@contoso.com"]
Websites array of strings Aus der Visitenkarte extrahierte Website ["https://www.contoso.com"]
Adressen array of strings Aus der Visitenkarte extrahierte Adresse ["123 Main Street, Redmond, WA 98052"]
MobilePhones Array aus Telefonnummern Aus der Visitenkarte extrahierte Mobiltelefonnummer ["+19876543210"]
Faxnummern Array aus Telefonnummern Aus der Visitenkarte extrahierte Faxnummer ["+19876543211"]
WorkPhones Array aus Telefonnummern Aus der Visitenkarte extrahierte geschäftliche Telefonnummer ["+19876543231"]
OtherPhones Array aus Telefonnummern Aus der Visitenkarte extrahierte weitere Telefonnummern ["+19876543233"]

Unterstützte Gebietsschemas

Vordefinierte Visitenkarten v2.1 unterstützt die folgenden Gebietsschemas:

  • de-de
  • en-au
  • en-ca
  • en-gb
  • .en-in

Migrationsleitfaden und REST-API v3.0

Nächste Schritte