Co to jest usługa Azure Document Intelligence?

8 min

Wskazówka

Aby uzyskać więcej szczegółów, zobacz kartę Tekst i obrazy .

Azure Document Intelligence to oparta na chmurze usługa sztucznej inteligencji w firmie Microsoft Foundry, która używa modeli OCR i uczenia głębokiego do wyodrębniania par tekstowych, par klucz-wartość, znaków wyboru i tabel z dokumentów.

Funkcja OCR przechwytuje strukturę dokumentów, tworząc pola ograniczenia wokół wykrytych obiektów na obrazie. Lokalizacje pól ograniczenia są rejestrowane jako współrzędne w odniesieniu do pozostałej części strony. Usługa Azure Document Intelligence zwraca dane dotyczące ramek ograniczających i inne informacje w ustrukturyzowanym formacie JSON, który zachowuje relacje z oryginalnego dokumentu.

Zrzut ekranu przedstawiający analizę dokumentów analizującą przykładowy dokument z wyodrębnionymi polami i polami ograniczenia.

Aby utworzyć model wyodrębniania dokumentów o wysokiej dokładności od podstaw, wymaga wiedzy z zakresu uczenia głębokiego, dużych ilości obliczeń i długich czasów trenowania. Usługa Azure Document Intelligence udostępnia podstawowe modele już wytrenowane na tysiącach przykładów formularzy, dzięki czemu można osiągnąć wyodrębnianie danych o wysokiej dokładności przy minimalnym nakładzie pracy.

Składniki usługi Analizy dokumentów

Usługa Azure Document Intelligence składa się z trzech kategorii modeli:

Modele analizy dokumentów: wyodrębnianie tekstu, struktury, tabel i znaków zaznaczenia z dokumentów. Model odczytu wyodrębnia tekst i wykrywa języki, podczas gdy model układu dodaje wyodrębnianie tabel i struktur. Zapoznasz się ze szczegółowymi informacjami na temat tych modeli w jednostce Korzystanie ze wstępnie utworzonych modeli .
Wstępnie utworzone modele: wyodrębnianie informacji z typowych typów dokumentów — takich jak faktury, paragony, formularze podatkowe, dokumenty identyfikatorów i inne — bez konieczności trenowania. Pełna lista dostępnych wstępnie utworzonych modeli zostanie wyświetlona w lekcji Korzystanie ze wstępnie utworzonych modeli .
Modele niestandardowe: wyodrębnianie danych z formularzy specyficznych dla firmy przy użyciu własnych zestawów danych z etykietami. Opcje obejmują niestandardowe modele szablonów (szybkie i ekonomiczne dla stałych układów), niestandardowe modele neuronowe (wyższa dokładność dla różnych układów), modele złożone i klasyfikatory niestandardowe. Dowiesz się więcej na temat trenowania i używania modeli niestandardowych w lekcji Trenowanie i używanie modeli niestandardowych .

Uzyskiwanie dostępu do usług analizy dokumentów

Dostęp do usługi Azure Document Intelligence można uzyskać na kilka sposobów:

Interfejs API REST: wywołaj usługę bezpośrednio przy użyciu żądań HTTP.
Zestawy SDK biblioteki klienta: użyj zestawów SDK dla języków Python, C#, Java i JavaScript.
Document Intelligence Studio: narzędzie online do wizualnego eksplorowania, testowania i tworzenia rozwiązań analizy dokumentów.
Portal Microsoft Foundry: integracja analizy dokumentów z innymi narzędziami foundry.

Wskazówka

Ćwiczenie tego modułu koncentruje się na SDK Python. Podstawowe usługi REST mogą być używane przez dowolny język.

Tworzenie zasobu analizy dokumentów

Do korzystania z usługi Azure Document Intelligence potrzebny jest zasób platformy Azure. Możesz użyć jednej z następujących opcji:

Zasób Foundry: Subskrypcja obejmująca wiele usług, która zapewnia dostęp do wielu usług sztucznej inteligencji w ramach jednego punktu końcowego i klucza.
Zasób analizy dokumentów platformy Azure: zasób pojedynczej usługi używany tylko z analizą dokumentów.

Uwaga / Notatka

Utwórz zasób Foundry, jeśli planujesz uzyskać dostęp do wielu narzędzi Foundry przy użyciu jednego punktu końcowego i klucza. W przypadku dostępu tylko do analizy dokumentów utwórz dedykowany zasób analizy dokumentów.

Wymagania dotyczące danych wejściowych

Usługa Azure Document Intelligence działa na dokumentach wejściowych, które spełniają następujące wymagania:

Format musi mieć format JPEG, PNG, BMP, PDF (tekst lub skanowanie) lub TIFF. Model odczytu akceptuje również formaty plików pakietu Microsoft Office.
Rozmiar pliku musi być mniejszy niż 500 MB dla warstwy Standardowa i 4 MB dla warstwy Bezpłatna.
Obrazy muszą mieć wymiary od 50 x 50 pikseli do 10 000 x 10 000 pikseli.
Dokumenty PDF muszą mieć wymiary mniejsze niż 17 x 17 cali (rozmiar papieru A3).
Dokumenty PDF nie mogą być chronione hasłem.

Dowiedz się więcej

Opinia

Czy ta strona była pomocna?