Udostępnij za pośrednictwem


Model karty kredytowej analizy dokumentów

Ta zawartość dotyczy: Znacznik wersja 4.0 (wersja zapoznawcza) Znacznik

Model karty kredytowej/debetowej analizy dokumentów wykorzystuje zaawansowane funkcje optycznego rozpoznawania znaków (OCR) do analizowania i wyodrębniania kluczowych pól z kart kredytowych i debetowych. Karty kredytowe i karty debetowe mogą mieć różne formaty i jakość, w tym obrazy przechwycone przez telefon, zeskanowane dokumenty i cyfrowe pliki PDF. Interfejs API analizuje tekst dokumentu; wyodrębnia kluczowe informacje, takie jak numer karty, bank wystawiający i data wygaśnięcia; funkcja zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie formaty dokumentów w języku angielskim.

Automatyczne przetwarzanie kart

Zautomatyzowane przetwarzanie kart kredytowych/debetowych to proces wyodrębniania pól kluczy z kart bankowych. W przeszłości proces analizy kart bankowych jest uzyskiwany ręcznie i dlatego bardzo czasochłonny. Dokładne wyodrębnianie kluczowych danych z kart bankowych jest zazwyczaj pierwszym i jednym z najważniejszych kroków w procesie automatyzacji kontraktu.

Opcje programowania

Analiza dokumentów w wersji 4.0 (2024-02-29-preview) obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja Zasoby Model ID
Model kontraktu • Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
JavaScript SDK
wstępnie utworzona karta kredytowa

Wymagania dotyczące danych wejściowych

  • Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

  • Obsługiwane formaty plików:

    Model PDF Obraz:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTML
    Przeczytaj
    Układ ✔ (2024-02-29-preview, 2023-10-31-preview)
    Dokument ogólny
    Wstępnie utworzona
    Niestandardowe wyodrębnianie
    Klasyfikacja niestandardowa ✔ (2024-02-29-preview)
  • W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko pierwsze dwie strony).

  • Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).

  • Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.

  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.

  • Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około 8-point text na 150 kropek na cal (DPI).

  • W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.

    • W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1GB maksymalnie 10 000 stron.

Wypróbuj wyodrębnianie danych karty kredytowej

Aby zobaczyć, jak działa wyodrębnianie danych w usłudze kart kredytowych/debetowych, potrzebne są następujące zasoby:

  • Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.

  • Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (F0). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.

Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Document Intelligence Studio

  1. Na stronie głównej Usługi Document Intelligence Studio wybierz pozycję Karta kredytowa/debetowa.

  2. Możesz przeanalizować przykładowe dokumenty podatkowe lub przekazać własne pliki.

  3. Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:

    Zrzut ekranu przedstawiający przyciski Run analysis and Analyze (Uruchamianie analizy i analizowanie) w narzędziu Document Intelligence Studio.

Obsługiwane języki i ustawienia regionalne

Zobacz naszą stronę Obsługa języków — wstępnie utworzone modele , aby uzyskać pełną listę obsługiwanych języków.

Wyodrębnianie pól

Poniżej przedstawiono pola wyodrębnione z kontraktu w odpowiedzi wyjściowej JSON.

Nazwisko Pisz Opis Przykładowe dane wyjściowe
Numer karty String Unikatowy identyfikator karty 4275 0000 0000 0000
Wystawianie banków String Nazwa banku, który wystawił kartę Woodgrove Bank
PaymentNetwork String Sieć płatności, która przetwarza transakcję karty VISA
CardHolderName String Nazwisko osoby, która jest właścicielem karty JAN SMITH
CardHolderCompanyName String Nazwa firmy, z którą jest skojarzona karta Contoso, Ltd.
Data weryfikacji Data Prawidłowa od daty 01/16
Data wygaśnięcia Data Data wygaśnięcia 01/19
CardVerificationValue String Wartość weryfikacji karty (CVV) 764
CustomerServicePhoneNumbers Tablica Lista numerów pomocy technicznej +1 (555) 123-4567

Pary klucz-wartość kart bankowych i wyodrębnione elementy wiersza znajdują się w documentResults sekcji danych wyjściowych JSON.

Następne kroki