Co to jest usługa Azure Document Intelligence?

Ukończone

Wskazówka

Aby uzyskać więcej szczegółów, zobacz kartę Tekst i obrazy .

Azure Document Intelligence to oparta na chmurze usługa sztucznej inteligencji w firmie Microsoft Foundry, która używa modeli OCR i uczenia głębokiego do wyodrębniania par tekstowych, par klucz-wartość, znaków wyboru i tabel z dokumentów.

Funkcja OCR przechwytuje strukturę dokumentów, tworząc pola ograniczenia wokół wykrytych obiektów na obrazie. Lokalizacje pól ograniczenia są rejestrowane jako współrzędne w odniesieniu do pozostałej części strony. Usługa Azure Document Intelligence zwraca dane dotyczące ramek ograniczających i inne informacje w ustrukturyzowanym formacie JSON, który zachowuje relacje z oryginalnego dokumentu.

Zrzut ekranu przedstawiający analizę dokumentów analizującą przykładowy dokument z wyodrębnionymi polami i polami ograniczenia.

Aby utworzyć model wyodrębniania dokumentów o wysokiej dokładności od podstaw, wymaga wiedzy z zakresu uczenia głębokiego, dużych ilości obliczeń i długich czasów trenowania. Usługa Azure Document Intelligence udostępnia podstawowe modele już wytrenowane na tysiącach przykładów formularzy, dzięki czemu można osiągnąć wyodrębnianie danych o wysokiej dokładności przy minimalnym nakładzie pracy.

Składniki usługi Analizy dokumentów

Usługa Azure Document Intelligence składa się z trzech kategorii modeli:

  • Modele analizy dokumentów: wyodrębnianie tekstu, struktury, tabel i znaków zaznaczenia z dokumentów. Model odczytu wyodrębnia tekst i wykrywa języki, podczas gdy model układu dodaje wyodrębnianie tabel i struktur. Zapoznasz się ze szczegółowymi informacjami na temat tych modeli w jednostce Korzystanie ze wstępnie utworzonych modeli .

  • Wstępnie utworzone modele: wyodrębnianie informacji z typowych typów dokumentów — takich jak faktury, paragony, formularze podatkowe, dokumenty identyfikatorów i inne — bez konieczności trenowania. Pełna lista dostępnych wstępnie utworzonych modeli zostanie wyświetlona w lekcji Korzystanie ze wstępnie utworzonych modeli .

  • Modele niestandardowe: wyodrębnianie danych z formularzy specyficznych dla firmy przy użyciu własnych zestawów danych z etykietami. Opcje obejmują niestandardowe modele szablonów (szybkie i ekonomiczne dla stałych układów), niestandardowe modele neuronowe (wyższa dokładność dla różnych układów), modele złożone i klasyfikatory niestandardowe. Dowiesz się więcej na temat trenowania i używania modeli niestandardowych w lekcji Trenowanie i używanie modeli niestandardowych .

Uzyskiwanie dostępu do usług analizy dokumentów

Dostęp do usługi Azure Document Intelligence można uzyskać na kilka sposobów:

  • Interfejs API REST: wywołaj usługę bezpośrednio przy użyciu żądań HTTP.
  • Zestawy SDK biblioteki klienta: użyj zestawów SDK dla języków Python, C#, Java i JavaScript.
  • Document Intelligence Studio: narzędzie online do wizualnego eksplorowania, testowania i tworzenia rozwiązań analizy dokumentów.
  • Portal Microsoft Foundry: integracja analizy dokumentów z innymi narzędziami foundry.

Wskazówka

Ćwiczenie tego modułu koncentruje się na SDK Python. Podstawowe usługi REST mogą być używane przez dowolny język.

Tworzenie zasobu analizy dokumentów

Do korzystania z usługi Azure Document Intelligence potrzebny jest zasób platformy Azure. Możesz użyć jednej z następujących opcji:

  • Zasób Foundry: Subskrypcja obejmująca wiele usług, która zapewnia dostęp do wielu usług sztucznej inteligencji w ramach jednego punktu końcowego i klucza.
  • Zasób analizy dokumentów platformy Azure: zasób pojedynczej usługi używany tylko z analizą dokumentów.

Uwaga / Notatka

Utwórz zasób Foundry, jeśli planujesz uzyskać dostęp do wielu narzędzi Foundry przy użyciu jednego punktu końcowego i klucza. W przypadku dostępu tylko do analizy dokumentów utwórz dedykowany zasób analizy dokumentów.

Wymagania dotyczące danych wejściowych

Usługa Azure Document Intelligence działa na dokumentach wejściowych, które spełniają następujące wymagania:

  • Format musi mieć format JPEG, PNG, BMP, PDF (tekst lub skanowanie) lub TIFF. Model odczytu akceptuje również formaty plików pakietu Microsoft Office.
  • Rozmiar pliku musi być mniejszy niż 500 MB dla warstwy Standardowa i 4 MB dla warstwy Bezpłatna.
  • Obrazy muszą mieć wymiary od 50 x 50 pikseli do 10 000 x 10 000 pikseli.
  • Dokumenty PDF muszą mieć wymiary mniejsze niż 17 x 17 cali (rozmiar papieru A3).
  • Dokumenty PDF nie mogą być chronione hasłem.

Dowiedz się więcej