Model faktury analizy dokumentów
Ważne
- Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane. Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
- Publiczna wersja zapoznawcza bibliotek klienckich analizy dokumentów jest domyślna dla interfejsu API REST w wersji 2024-07-31-preview.
- Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure. Należy pamiętać, że niestandardowy model generowania (wyodrębniania pól dokumentów) w programie AI Studio jest dostępny tylko w regionie Północno-środkowe stany USA:
- Wschodnie stany USA
- Zachodnie stany USA 2
- Europa Zachodnia
- Północno-środkowe stany USA
Ta zawartość dotyczy: v4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja: v4.0 (wersja zapoznawcza) | | Poprzednie wersje: v3.0 v2.1
Ta zawartość dotyczy: wersja 3.0 (GA) | Najnowsze wersje: wersja 4.0 (wersja zapoznawcza) 3.1 | Poprzednia wersja: wersja 2.1
Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)
Model faktur analizy dokumentów korzysta z zaawansowanych funkcji optycznego rozpoznawania znaków (OCR) do analizowania i wyodrębniania kluczowych pól i elementów liniowych z faktur sprzedaży, rachunków za narzędzia i zamówień zakupu. Faktury mogą mieć różne formaty i jakość, w tym obrazy przechwycone przez telefon, zeskanowane dokumenty i cyfrowe pliki PDF. Interfejs API analizuje tekst faktury; Wyodrębnia kluczowe informacje, takie jak nazwa klienta, adres rozliczeniowy, data ukończenia i kwota należna; funkcja zwraca ustrukturyzowaną reprezentację danych JSON. Model obsługuje obecnie faktury w 27 językach.
Obsługiwane typy dokumentów:
- Faktury
- Rachunki za usługi użyteczności publicznej
- Zamówienia sprzedaży
- Zamówienia zakupu
Automatyczne przetwarzanie faktur
Automatyczne przetwarzanie faktur to proces wyodrębniania pól kluczy accounts payable
z dokumentów konta rozliczeniowego. Wyodrębnione dane obejmują elementy wierszy z faktur zintegrowanych z przepływami pracy płatnych kont (AP) na potrzeby przeglądów i płatności. W przeszłości proces płatności jest wykonywany ręcznie, a zatem bardzo czasochłonny. Dokładne wyodrębnianie kluczowych danych z faktur jest zazwyczaj pierwszym i jednym z najważniejszych kroków w procesie automatyzacji faktur.
Przykładowa faktura przetworzona za pomocą programu Document Intelligence Studio:
Przykładowa faktura przetworzona za pomocą narzędzia do etykietowania przykładowego analizy dokumentów:
Opcje programowania
Analiza dokumentów w wersji 4.0 (2024-07-31-preview) obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
Model faktury | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
wstępnie utworzona faktura |
Narzędzie Document Intelligence w wersji 3.1 obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
Model faktury | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
wstępnie utworzona faktura |
Narzędzie Document Intelligence w wersji 3.0 obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby | Model ID |
---|---|---|
Model faktury | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK |
wstępnie utworzona faktura |
Narzędzie Document Intelligence w wersji 2.1 obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby |
---|---|
Model faktury | • Narzędzie do etykietowania analizy dokumentów• Interfejs API REST• Zestaw SDK biblioteki klienckiej• Kontener docker analizy dokumentów |
Wymagania dotyczące danych wejściowych
Obsługiwane formaty plików:
Model PDF Obraz: JPEG/JPG
, ,BMP
PNG
, ,TIFF
HEIF
Microsoft Office:
Word (), Excel (XLSX
DOCX
), PowerPoint (PPTX
), HTMLPrzeczytaj ✔ ✔ ✔ Układ ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Dokument ogólny ✔ ✔ Wstępnie utworzona ✔ ✔ Niestandardowe wyodrębnianie ✔ ✔ Klasyfikacja niestandardowa ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i
4
MB za bezpłatną (F0).Wymiary obrazu muszą mieć od 50 pikseli x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada tekstowi
8
punktowemu na 150 kropek na cal (DPI).W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i
1
GB dla modelu neuronowego.W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi
1
GB z maksymalnie 10 000 stron. W przypadku wersji 2024-07-31-preview i nowszych łączny rozmiar danych treningowych wynosi2
GB z maksymalnie 10 000 stron.
- Obsługiwane formaty plików: JPEG, PNG, PDF i TIFF.
- Obsługiwane pliki PDF i TIFF, przetwarzane są maksymalnie 2000 stron. W przypadku subskrybentów warstwy Bezpłatna przetwarzane są tylko dwie pierwsze strony.
- Obsługiwany rozmiar pliku musi być mniejszy niż 50 MB i wymiary co najmniej 50 x 50 pikseli i maksymalnie 10 000 x 10 000 pikseli.
Wyodrębnianie danych modelu faktury
Zobacz, jak dane, w tym informacje o kliencie, szczegóły dostawcy i elementy wiersza, są wyodrębniane z faktur. Potrzebne są następujące zasoby:
Subskrypcja platformy Azure — możesz utworzyć jedną bezpłatnie.
Wystąpienie analizy dokumentów w witrynie Azure Portal. Aby wypróbować usługę, możesz użyć bezpłatnej warstwy cenowej (
F0
). Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby uzyskać klucz i punkt końcowy.
Narzędzie do etykietowania przykładowego analizy dokumentów
Przejdź do narzędzia przykładowego analizy dokumentów.
Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .
Wybierz typ formularza do przeanalizowania z menu rozwijanego.
Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:
- Przykładowy dokument faktury.
- Przykładowy dokument o identyfikatorze.
- Przykładowy obraz potwierdzenia.
- Przykładowy obraz wizytówki.
W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.
W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.
W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.
Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.
Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.
Uwaga
Przykładowe narzędzie etykietowania nie obsługuje formatu pliku BMP. Jest to ograniczenie narzędzia, a nie usługi analizy dokumentów.
Obsługiwane języki i ustawienia regionalne
Aby uzyskać pełną listę obsługiwanych języków, zobacz naszą wstępnie utworzoną stronę obsługi języka modelu.
Wyodrębnianie pól
W przypadku obsługiwanych pól wyodrębniania dokumentów zapoznaj się ze stroną schematu modelu faktury w naszym przykładowym repozytorium GitHub.
Pary klucz-wartość faktury i wyodrębnione elementy wiersza znajdują się w
documentResults
sekcji danych wyjściowych JSON.
Pary klucz-wartość
Wstępnie utworzona faktura 2022-06-30 i nowsze wersje obsługują opcjonalne zwracanie par klucz-wartość. Domyślnie zwracanie par klucz-wartość jest wyłączone. Pary klucz-wartość są określonymi zakresami na fakturze, które identyfikują etykietę lub klucz oraz skojarzona odpowiedź lub wartość. Na fakturze te pary mogą być etykietą i wartością wprowadzoną przez użytkownika dla tego pola lub numeru telefonu. Model sztucznej inteligencji jest trenowany w celu wyodrębniania możliwych do zidentyfikowania kluczy i wartości w oparciu o szeroką gamę typów dokumentów, formatów i struktur.
Klucze mogą również istnieć w izolacji, gdy model wykryje, że klucz istnieje, bez skojarzonej wartości lub podczas przetwarzania pól opcjonalnych. Na przykład pole nazwy środkowej może być puste w formularzu w niektórych przypadkach. Pary klucz-wartość są zawsze zakresami tekstu zawartego w dokumencie. W przypadku dokumentów, w których ta sama wartość jest opisana na różne sposoby, na przykład klient/użytkownik, skojarzony klucz jest klientem lub użytkownikiem (na podstawie kontekstu).
Wyodrębnione pola
Usługa Faktura wyodrębnia tekst, tabele i 26 pól faktur. Poniżej przedstawiono pola wyodrębnione z faktury w odpowiedzi wyjściowej JSON (poniższe dane wyjściowe używają tej przykładowej faktury).
Nazwisko | Pisz | Opis | Tekst | Wartość (standardowe dane wyjściowe) |
---|---|---|---|---|
CustomerName | string | Klient jest fakturowany | Microsoft Corp | |
CustomerId | string | Identyfikator odwołania klienta | CID-12345 | |
PurchaseOrder | string | Numer referencyjny zamówienia zakupu | PO-3333 | |
InvoiceId | string | Identyfikator tej konkretnej faktury (często "Numer faktury") | INV-100 | |
InvoiceDate (Data wystawienia faktury) | data | Data wystawienia faktury | 11/15/2019 | 2019-11-15 |
DueDate | data | Data płatności za tę fakturę jest należna | 15.12.2019 | 2019-12-15 |
VendorName | string | Dostawca, który utworzył fakturę | CONTOSO | |
VendorAddress | string | Adres wysyłkowy dostawcy | 123 456th St New York, NY, 10001 | |
VendorAddressRecipient | string | Nazwa skojarzona z elementem VendorAddress | Siedziba firmy Contoso | |
CustomerAddress | string | Adres wysyłkowy klienta | 123 Other Street, Redmond, Waszyngton, 98052 | |
CustomerAddressRecipient | string | Nazwa skojarzona z elementem CustomerAddress | Microsoft Corp | |
BillingAddress | string | Jawny adres rozliczeniowy klienta | 123 Bill Street, Redmond, Waszyngton, 98052 | |
BillingAddressRecipient | string | Nazwa skojarzona z elementem BillingAddress | Microsoft Services | |
ShippingAddress | string | Jawny adres wysyłkowy klienta | 123 Ship Street, Redmond, Waszyngton, 98052 | |
ShippingAddressRecipient | string | Nazwa skojarzona z elementem ShippingAddress | Dostarczanie firmy Microsoft | |
Suma częściowa | Liczba | Pole sumy częściowej zidentyfikowane na tej fakturze | 100,00 $ | 100 |
TotalTax | Liczba | Pole całkowitego podatku zidentyfikowane na tej fakturze | 10,00 $ | 10 |
InvoiceTotal | Liczba | Łączna liczba nowych opłat skojarzonych z tą fakturą | 110,00 USD | 110 |
AmountDue | Liczba | Łączna kwota ze względu na dostawcę | 610,00 USD | 610 |
ServiceAddress | string | Jawny adres usługi lub adres właściwości klienta | 123 Service Street, Redmond, Waszyngton, 98052 | |
ServiceAddressRecipient | string | Nazwa skojarzona z elementem ServiceAddress | Microsoft Services | |
Address usługi Remittance | string | Jawne przelewy lub adres płatności dla klienta | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | string | Nazwa skojarzona z funkcją RemittanceAddress | Rozliczenia firmy Contoso | |
ServiceStartDate | data | Pierwsza data okresu usługi (na przykład okres usługi rozliczanej za pomocą narzędzia) | 10/14/2019 | 2019-10-14 |
ServiceEndDate | data | Data zakończenia okresu usługi (na przykład okres usługi rozliczanej za pomocą usługi) | 11/14/2019 | 2019-11-14 |
PreviousUnpaidBalance | Liczba | Jawne wcześniej niezapłacone saldo | 500,00 USD | 500 |
Poniżej przedstawiono elementy wiersza wyodrębnione z faktury w odpowiedzi wyjściowej JSON i używają tej przykładowej faktury:
Nazwisko | Pisz | Opis | Tekst (element wiersza nr 1) | Wartość (standardowe dane wyjściowe) |
---|---|---|---|---|
Elementy | string | Pełny wiersz tekstowy ciągu elementu wiersza | 3/4/2021 A123 Usługi konsultingowe 2 godziny $30.00 10% $60.00 | |
Kwota | Liczba | Ilość elementu wiersza | 60,00 USD | 100 |
opis | string | Opis tekstu dla elementu wiersza faktury | Usługa konsultingowa | Usługa konsultingowa |
Ilość | Liczba | Ilość dla tego elementu wiersza faktury | 2 | 2 |
UnitPrice | Liczba | Cena netto lub brutto (w zależności od ustawienia faktury brutto) jednej jednostki tego elementu | 30,00 $ | 30 |
Kod produktu | string | Kod produktu, numer produktu lub jednostka SKU skojarzona z określonym elementem wiersza | A123 | |
Jednostka | string | Jednostka elementu wiersza, np. kg, lb itp. | godziny | |
Data | data | Data odpowiadająca każdemu elementowi wiersza. Często jest to data wysłania elementu wiersza | 3/4/2021 | 2021-03-04 |
Podatek | Liczba | Podatek skojarzony z każdym elementem wiersza. Możliwe wartości obejmują kwotę podatku, podatek %i podatek Y/N | 10% |
Poniżej przedstawiono złożone pola wyodrębnione z faktury w odpowiedzi wyjściowej JSON:
TaxDetails
Szczegóły podatkowe definiują określone podatki stosowane do sumy faktury.
Nazwisko | Pisz | Opis | Tekst (element wiersza nr 1) | Wartość (standardowe dane wyjściowe) |
---|---|---|---|---|
Elementy | string | Pełny wiersz tekstowy elementu podatkowego | V.A.T. 15% $60.00 | |
Kwota | Liczba | Kwota podatku od pozycji podatkowej | 60,00 | 60 |
Stawka | string | Stawka podatkowa pozycji podatkowej | 15% |
PaymentDetails
Wyświetl listę wszystkich wykrytych opcji płatności wykrytych w polu.
Nazwisko | Pisz | Opis | Tekst (element wiersza nr 1) | Wartość (standardowe dane wyjściowe) |
---|---|---|---|---|
IBAN |
string | Wewnętrzny numer konta bankowego | GB33BUKB20201555555555 | |
SWIFT |
string | Kod SWIFT | BUKBGB22 | |
BankAccountNumber | string | Numer konta bankowego, unikatowy identyfikator konta bankowego | 123456 | |
BPayBillerCode | string | Australian B-Pay Biller Code | 12345 | |
BPayReference | string | Australijski kod referencyjny B-Pay | 98765432100 |
Dane wyjściowe JSON
Dane wyjściowe JSON mają trzy części:
"readResults"
węzeł zawiera wszystkie rozpoznane znaczniki tekstu i zaznaczenia. Tekst jest uporządkowany za pomocą strony, a następnie według wierszy, a następnie według pojedynczych wyrazów."pageResults"
węzeł zawiera tabele i komórki wyodrębnione z ich pól ograniczenia, ufności i odwołania do wierszy i wyrazów w readResults."documentResults"
węzeł zawiera wartości specyficzne dla faktury i elementy wiersza odnalezione przez model. W tym miejscu można znaleźć wszystkie pola z faktury, takie jak identyfikator faktury, wysyłka do, rachunek, klient, suma, elementy wiersza i wiele innych.
Przewodnik migracji
- Postępuj zgodnie z naszym przewodnikiem migracji do analizy dokumentów w wersji 3.1, aby dowiedzieć się, jak używać wersji 3.0 w aplikacjach i przepływach pracy.
Następne kroki
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.
Spróbuj przetwarzać własne formularze i dokumenty za pomocą narzędzia do etykietowania przykładowego analizy dokumentów.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.