Wyodrębnianie informacji z formularzy za pomocą usługi Azure Document Intelligence
Usługa Azure Document Intelligence jest przeznaczona do obsługi złożonych scenariuszy przetwarzania dokumentów i formularzy. Usługa Azure Content Understanding umożliwia również wyodrębnianie pól z formularzy i dokumentów, jednak usługa Azure Document Intelligence oferuje dużą bibliotekę wstępnie utworzonych modeli— od prostych paragonów do złożonych formularzy podatkowych. Możesz również tworzyć zaawansowane modele niestandardowe własnego autorstwa.
Korzystanie ze wstępnie utworzonych modeli
Przyjrzyjmy się przykładowi użycia usługi Azure Document Intelligence do wyodrębniania danych z formularza.
Załóżmy, że firma zajmująca się pożyczkami finansowymi musi przetwarzać setki wniosków hipotecznych każdego dnia. Oto przykład pierwszej strony standardowej 11-stronicowej formularza wniosku o kredyt hipoteczny:
Usługa Azure Document Intelligence zawiera wstępnie utworzony model dla tego typu formularza, co ułatwia tworzenie rozwiązania, które umożliwia lokalizowanie i wyodrębnianie pól, takich jak:
- Nazwa kredytobiorcy
- Adres
- Numer telefonu
- Numer ubezpieczenia społecznego
- Data urodzenia
- Stan cywilny
- Status zatrudnienia
- Imię i nazwisko pracodawcy
- Adres pracodawcy
- Dochód
- Obywatelstwo
- i nie tylko
Tworzenie modeli niestandardowych
Za pomocą usługi Azure Document Intelligence można trenować modele niestandardowe przy użyciu oznaczonych etykietami przykładów dokumentów, które chcesz analizować. Etykietowanie dokumentów obejmuje używanie OCR do definiowania układu dokumentu i identyfikowania dyskretnych pól w dokumentach, które chcesz wyodrębnić.