Model certyfikatu małżeństwa analizy dokumentów
Ta zawartość dotyczy: wersja 4.0 (wersja zapoznawcza)
Model certyfikatu małżeństwa analizy dokumentów korzysta z zaawansowanych funkcji optycznego rozpoznawania znaków (OCR) do analizowania i wyodrębniania kluczowych pól z certyfikatów małżeństwa. Certyfikaty małżeństwa mogą mieć różne formaty i jakość, w tym obrazy przechwycone przez telefon, zeskanowane dokumenty i cyfrowe pliki PDF. Interfejs API analizuje tekst dokumentu; wyodrębnia kluczowe informacje, takie jak nazwiska małżonków, data wydania i miejsce małżeństwa; funkcja zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie formaty dokumentów w języku angielskim.
Automatyczne przetwarzanie certyfikatu małżeństwa
Zautomatyzowane przetwarzanie certyfikatów małżeńskich to proces wyodrębniania pól kluczy z certyfikatów małżeńskich. W przeszłości proces analizy certyfikatu małżeństwa jest uzyskiwany ręcznie, a zatem bardzo czasochłonny. Dokładne wyodrębnianie kluczowych danych z certyfikatów małżeńskich jest zazwyczaj pierwszym i jednym z najważniejszych kroków w procesie automatyzacji certyfikatu małżeństwa.
Opcje programowania
Analiza dokumentów w wersji 4.0 (2024-02-29-preview) obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
Wymagania dotyczące danych wejściowych
Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
Obsługiwane formaty plików:
Model PDF Obraz:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTMLPrzeczytaj ✔ ✔ ✔ Układ ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Dokument ogólny ✔ ✔ Wstępnie utworzona ✔ ✔ Niestandardowe wyodrębnianie ✔ ✔ Klasyfikacja niestandardowa ✔ ✔ ✔ (2024-02-29-preview) W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji w warstwie Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).
Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około
8
-point text na 150 kropek na cal (DPI).W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.
W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi
1GB
maksymalnie 10 000 stron.
Wypróbowanie wyodrębniania danych dokumentu certyfikatu małżeństwa
Aby zobaczyć, jak działa wyodrębnianie danych dla usługi kart certyfikatu małżeństwa, potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0
). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Document Intelligence Studio
Na stronie głównej Document Intelligence Studio wybierz pozycję Certyfikat małżeństwa.
Możesz przeanalizować przykładowe certyfikaty małżeństwa lub przekazać własne pliki.
Wybierz przycisk Run analysis (Uruchom analizę), a w razie potrzeby skonfiguruj opcje Analizuj:
Obsługiwane języki i ustawienia regionalne
Zobacz naszą stronę Obsługa języków — wstępnie utworzone modele , aby uzyskać pełną listę obsługiwanych języków.
Wyodrębnianie pól
Poniżej przedstawiono pola wyodrębnione z certyfikatu małżeństwa w odpowiedzi wyjściowej JSON.
Nazwisko | Pisz | Opis | Przykładowe dane wyjściowe |
---|---|---|---|
Spouse1FirstName |
String | Imię małżonka 1 | Wesley |
Spouse1MiddleName |
String | Drugie imię współmałżonka 1 | M. |
Spouse1LastName |
String | Nazwisko małżonka 1 | Perry |
Spouse1Age |
Integer | Wiek małżonka 1 | 26 |
Spouse1BirthDate |
Data | Data urodzenia małżonka 1 | 16 listopada 1997 r. |
Spouse1Address |
Adres | Adres małżonka 1 | 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302 |
Spouse1BirthPlace |
String | Miejsce urodzenia małżonka 1 | Michigan |
Spouse2FirstName |
String | Imię małżonka 2 | Beth |
Spouse2MiddleName |
String | Drugie imię współmałżonka 2 | R. |
Spouse2LastName |
String | Nazwisko małżonka 2 | Murarz |
Spouse2Age |
Integer | Współmałżonek 2 wieku | 23 |
Spouse2BirthDate |
Data | Data urodzenia małżonka 2 | 22 lipca 2000 r. |
Spouse2Address |
Adres | Adres małżonka 2 | 2671 Comfort Court, Madison, Wisconsin 53704 |
Spouse2BirthPlace |
String | Miejsce urodzenia małżonka 2 | Wisconsin |
DocumentNumber |
String | Numer dokumentu | 01976/202 |
IssueDate |
Data | Data wystawienia certyfikatu | 10 października 2023 r. |
IssuePlace |
String | Miejsce wystawiania certyfikatu | 2398 Echo Lane, Hastings, Michigan 49058 |
MarriageDate |
Data | Data małżeństwa | 10 października 2023 r. |
MarriagePlace |
String | Miejsce małżeństwa | 105 Coal Street, Galloway, Wisconsin 54432 |
Pary klucz-wartość certyfikatu małżeństwa i wyodrębnione elementy wiersza znajdują się w documentResults
sekcji danych wyjściowych JSON.
Następne kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla