Korzystanie z programu Document Intelligence Studio

Ukończone

Wskazówka

Aby uzyskać więcej szczegółów, zobacz kartę Tekst i obrazy .

Azure Document Intelligence Studio to narzędzie online umożliwiające wizualne eksplorowanie, zrozumienie i integrowanie funkcji z usługi Analizy dokumentów. Za pomocą programu Studio można analizować układy formularzy, wyodrębniać dane ze wstępnie utworzonych modeli i trenować modele niestandardowe — wszystko za pośrednictwem interfejsu wizualnego.

Dostęp do programu Studio można uzyskać w documentintelligence.ai.azure.com.

Zrzut ekranu przedstawiający stronę główną programu Document Intelligence Studio.

Możliwości programu Studio

Program Document Intelligence Studio obsługuje następujące typy projektów:

  • Modele analizy dokumentów: przetestuj modele odczytu i układu względem własnych dokumentów, aby zobaczyć wyodrębniony tekst, tabele i strukturę.

  • Wstępnie utworzone modele: analizowanie dokumentów przy użyciu dowolnego dostępnego wstępnie utworzonego modelu, takiego jak faktury, paragony, dokumenty identyfikatorów i formularze podatkowe.

  • Modele niestandardowe: tworzenie, etykietowanie, trenowanie i testowanie niestandardowych modeli wyodrębniania oraz niestandardowych klasyfikatorów.

Analizowanie dokumentów przy użyciu wstępnie utworzonych modeli

Aby wyodrębnić dane z dokumentów przy użyciu wstępnie utworzonych modeli w programie Studio:

  1. Utwórz zasób narzędzia Azure Document Intelligence lub Foundry Tools w witrynie Azure Portal.
  2. Otwórz program Document Intelligence Studio i wybierz wstępnie utworzony model (na przykład Faktura, Potwierdzenie lub Dokument identyfikatora).
  3. Podaj punkt końcowy zasobu i klucz.
  4. Przekaż lub podaj adres URL do dokumentu, który chcesz przeanalizować.
  5. Przejrzyj wyodrębnione pola i ich wyniki ufności.

Tworzenie niestandardowych projektów modeli

Program Studio umożliwia obsługę całego procesu etykietowania, trenowania i testowania modeli niestandardowych — bez ręcznego tworzenia plików JSON. Program Studio automatycznie generuje wymagane ocr.jsonpliki , labels.jsoni fields.json .

Ogólny wysokopoziomowy przepływ pracy to:

  1. Utwórz zasób usługi Azure Document Intelligence lub Foundry.
  2. Przekaż co najmniej 5–6 przykładowe formularze do kontenera usługi Azure Blob Storage.
  3. Skonfiguruj współużytkowanie zasobów między źródłami (CORS), aby Studio mogło uzyskać dostęp do kontenera magazynowania.
  4. Utwórz projekt modelu niestandardowego w narzędziu Studio, łącząc kontener pamięci i zasób Document Intelligence.
  5. Oznacz pola w przykładowych dokumentach za pomocą interfejsu wizualnego Studio.
  6. Trenowanie modelu i przeglądanie metryk dokładności.
  7. Przetestuj model pod kątem nowego dokumentu, który nie był używany podczas trenowania.

Więcej informacji na temat typów modeli niestandardowych oraz alternatywnego workflow trenowania z użyciem interfejsu API REST/zestawu SDK znajdziesz w jednostce Trenowanie i używanie modeli niestandardowych.

Możliwości dodatków

Analiza dokumentów obsługuje opcjonalne funkcje, które można włączyć w zależności od scenariusza wyodrębniania:

Zdolność Opis
Wyodrębnianie o wysokiej rozdzielczości Wyodrębnianie tekstu z dokumentów o wysokiej rozdzielczości z większą dokładnością.
Wyodrębnianie formuł Wykrywanie i wyodrębnianie formuł matematycznych z dokumentów.
Wyodrębnianie właściwości czcionki Wyodrębnij informacje o czcionkach, takie jak styl, waga i kolor.
Wyodrębnianie kodów kreskowych Wykrywanie i odczytywanie kodów kreskowych w dokumentach.
Plik PDF z możliwością wyszukiwania Konwertowanie zeskanowanych dokumentów na pliki PDF z możliwością wyszukiwania.
Pola zapytania Użyj zapytań języka naturalnego, aby wyodrębnić określone pola z dokumentów.
Pary klucz-wartość Wyodrębnij relacje par klucz-wartość z dokumentów przy użyciu modelu układu.

Uwaga / Notatka

Niektóre funkcje dodatku to funkcje w warstwie Premium, które generują dodatkowe koszty. Sprawdź stronę cennika , aby uzyskać szczegółowe informacje.

Dowiedz się więcej