Korzystanie z programu Azure Document Intelligence Studio
Oprócz zestawów SDK i interfejsu API REST usługi Azure Document Intelligence services można uzyskać dostęp za pośrednictwem interfejsu użytkownika o nazwie Azure Document Intelligence Studio, narzędzia online do wizualnego eksplorowania, zrozumienia i integrowania funkcji z usługi Azure Document Intelligence. Program Studio może służyć do analizowania układów formularzy, wyodrębniania danych ze wstępnie utworzonych modeli i trenowania modeli niestandardowych.
Program Azure Document Intelligence Studio obsługuje obecnie następujące projekty:
-
Modele analizy dokumentów
- Odczyt: Wyodrębnij drukowane i odręczne wiersze tekstu, wyrazy, lokalizacje i wykryte języki z dokumentów i obrazów.
- Układ: Wyodrębnij tekst, tabele, znaczniki zaznaczenia i informacje o strukturze z dokumentów (PDF i TIFF) oraz obrazów (JPG, PNG i BMP).
- Dokumenty ogólne: wyodrębnianie par klucz-wartość, znaczniki wyboru i jednostki z dokumentów.
- Wstępnie utworzone modele
- Modele niestandardowe
Tworzenie projektów modelu analizy dokumentów
Aby wyodrębnić tekst, tabele, strukturę, pary klucz-wartość i nazwane jednostki z modelami analizy dokumentów:
- Tworzenie zasobu narzędzia Azure Document Intelligence lub Foundry Tools
- Wybierz pozycję "Odczyt", "Układ" lub "Dokumenty ogólne" w kategorii Modele analizy dokumentów
- Analizowanie dokumentu. Potrzebujesz punktu końcowego i klucza narzędzi Azure Document Intelligence lub Foundry Tools.
Kompilowanie wstępnie utworzonych projektów modeli
Aby wyodrębnić dane z typowych formularzy przy użyciu wstępnie utworzonych modeli:
- Tworzenie zasobu narzędzia Azure Document Intelligence lub Foundry Tools
- Wybierz jeden z "wstępnie utworzonych modeli", w tym W-2s, Invoices, Receipts, ID documents, Health insurance, szczepień i wizytówek.
- Analizowanie dokumentu. Potrzebujesz punktu końcowego i klucza narzędzi Azure Document Intelligence lub Foundry Tools.
Tworzenie niestandardowych projektów modelu
Usługę niestandardową usługi Azure Document Intelligence Studio można używać do całego procesu trenowania i testowania modeli niestandardowych.
Gdy używasz Azure Document Intelligence Studio do tworzenia modeli niestandardowych, pliki ocr.json, labels.json i fields.json potrzebne do trenowania są automatycznie tworzone i przechowywane na Twoim koncie magazynowym.
Aby wytrenować model niestandardowy i użyć go do wyodrębnienia danych z modelami niestandardowymi:
- Tworzenie zasobu narzędzia Azure Document Intelligence lub Foundry Tools
- Zbierz co najmniej 5–6 przykładowych formularzy na potrzeby trenowania i przekaż je do kontenera konta magazynu.
- Konfigurowanie współużytkowania zasobów między domenami (CORS). Mechanizm CORS umożliwia usłudze Azure Document Intelligence Studio przechowywanie plików oznaczonych etykietami w kontenerze magazynu.
- Utwórz projekt modelu niestandardowego w usłudze Azure Document Intelligence Studio. Musisz podać konfiguracje łączące kontener przechowywania oraz zasób Azure Document Intelligence lub narzędzi Foundry ze swoim projektem.
- Użyj programu Azure Document Intelligence Studio, aby zastosować etykiety do tekstu.
- Szkolenie modelu. Po wytrenowanym modelu otrzymasz identyfikator modelu i średnią dokładność tagów.
- Przetestuj model, analizując nowy formularz, który nie był używany podczas trenowania.