Co to jest usługa Azure Document Intelligence?
Wskazówka
Aby uzyskać więcej szczegółów, zobacz kartę Tekst i obrazy .
Azure Document Intelligence to oparta na chmurze usługa sztucznej inteligencji w firmie Microsoft Foundry, która używa modeli OCR i uczenia głębokiego do wyodrębniania par tekstowych, par klucz-wartość, znaków wyboru i tabel z dokumentów.
Funkcja OCR przechwytuje strukturę dokumentów, tworząc pola ograniczenia wokół wykrytych obiektów na obrazie. Lokalizacje pól ograniczenia są rejestrowane jako współrzędne w odniesieniu do pozostałej części strony. Usługa Azure Document Intelligence zwraca dane dotyczące ramek ograniczających i inne informacje w ustrukturyzowanym formacie JSON, który zachowuje relacje z oryginalnego dokumentu.
Aby utworzyć model wyodrębniania dokumentów o wysokiej dokładności od podstaw, wymaga wiedzy z zakresu uczenia głębokiego, dużych ilości obliczeń i długich czasów trenowania. Usługa Azure Document Intelligence udostępnia podstawowe modele już wytrenowane na tysiącach przykładów formularzy, dzięki czemu można osiągnąć wyodrębnianie danych o wysokiej dokładności przy minimalnym nakładzie pracy.
Składniki usługi Analizy dokumentów
Usługa Azure Document Intelligence składa się z trzech kategorii modeli:
Modele analizy dokumentów: wyodrębnianie tekstu, struktury, tabel i znaków zaznaczenia z dokumentów. Model odczytu wyodrębnia tekst i wykrywa języki, podczas gdy model układu dodaje wyodrębnianie tabel i struktur. Zapoznasz się ze szczegółowymi informacjami na temat tych modeli w jednostce Korzystanie ze wstępnie utworzonych modeli .
Wstępnie utworzone modele: wyodrębnianie informacji z typowych typów dokumentów — takich jak faktury, paragony, formularze podatkowe, dokumenty identyfikatorów i inne — bez konieczności trenowania. Pełna lista dostępnych wstępnie utworzonych modeli zostanie wyświetlona w lekcji Korzystanie ze wstępnie utworzonych modeli .
Modele niestandardowe: wyodrębnianie danych z formularzy specyficznych dla firmy przy użyciu własnych zestawów danych z etykietami. Opcje obejmują niestandardowe modele szablonów (szybkie i ekonomiczne dla stałych układów), niestandardowe modele neuronowe (wyższa dokładność dla różnych układów), modele złożone i klasyfikatory niestandardowe. Dowiesz się więcej na temat trenowania i używania modeli niestandardowych w lekcji Trenowanie i używanie modeli niestandardowych .
Uzyskiwanie dostępu do usług analizy dokumentów
Dostęp do usługi Azure Document Intelligence można uzyskać na kilka sposobów:
- Interfejs API REST: wywołaj usługę bezpośrednio przy użyciu żądań HTTP.
- Zestawy SDK biblioteki klienta: użyj zestawów SDK dla języków Python, C#, Java i JavaScript.
- Document Intelligence Studio: narzędzie online do wizualnego eksplorowania, testowania i tworzenia rozwiązań analizy dokumentów.
- Portal Microsoft Foundry: integracja analizy dokumentów z innymi narzędziami foundry.
Wskazówka
Ćwiczenie tego modułu koncentruje się na SDK Python. Podstawowe usługi REST mogą być używane przez dowolny język.
Tworzenie zasobu analizy dokumentów
Do korzystania z usługi Azure Document Intelligence potrzebny jest zasób platformy Azure. Możesz użyć jednej z następujących opcji:
- Zasób Foundry: Subskrypcja obejmująca wiele usług, która zapewnia dostęp do wielu usług sztucznej inteligencji w ramach jednego punktu końcowego i klucza.
- Zasób analizy dokumentów platformy Azure: zasób pojedynczej usługi używany tylko z analizą dokumentów.
Uwaga / Notatka
Utwórz zasób Foundry, jeśli planujesz uzyskać dostęp do wielu narzędzi Foundry przy użyciu jednego punktu końcowego i klucza. W przypadku dostępu tylko do analizy dokumentów utwórz dedykowany zasób analizy dokumentów.
Wymagania dotyczące danych wejściowych
Usługa Azure Document Intelligence działa na dokumentach wejściowych, które spełniają następujące wymagania:
- Format musi mieć format JPEG, PNG, BMP, PDF (tekst lub skanowanie) lub TIFF. Model odczytu akceptuje również formaty plików pakietu Microsoft Office.
- Rozmiar pliku musi być mniejszy niż 500 MB dla warstwy Standardowa i 4 MB dla warstwy Bezpłatna.
- Obrazy muszą mieć wymiary od 50 x 50 pikseli do 10 000 x 10 000 pikseli.
- Dokumenty PDF muszą mieć wymiary mniejsze niż 17 x 17 cali (rozmiar papieru A3).
- Dokumenty PDF nie mogą być chronione hasłem.