Co to jest analiza dokumentów sztucznej inteligencji platformy Azure?
Ważne
- Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane.
- Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
- Publiczna wersja zapoznawcza bibliotek klienckich usługi Document Intelligence jest domyślna dla interfejsu API REST w wersji 2024-02-29-preview.
- Publiczna wersja zapoznawcza 2024-02-29-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:
- Wschodnie stany USA
- Zachodnie stany USA 2
- Europa Zachodnia
Ta zawartość dotyczy: v4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja: v4.0 (wersja zapoznawcza) | | Poprzednie wersje: v3.0 v2.1
Ta zawartość dotyczy: wersja 3.0 (GA) | Najnowsze wersje: wersja 4.0 (wersja zapoznawcza) 3.1 | Poprzednia wersja: wersja 2.1
Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)
Uwaga
Rozpoznawanie formularzy to teraz usługa Azure AI Document Intelligence!
- Od lipca 2023 r. usługi Azure AI obejmują wszystkie wcześniej znane usługi Cognitive Services i aplikacja systemu Azure lied AI Services.
- Nie ma żadnych zmian w cenach.
- Nazwy usług Cognitive Services i aplikacja systemu Azure lied AI nadal są używane w rozliczeniach platformy Azure, analizie kosztów, cenniku i interfejsach API cen.
- Nie ma żadnych zmian powodujących niezgodność w interfejsach programowania aplikacji (API) lub zestawach SDK przed i włącznie z wersją 3.1. Począwszy od wersji 4.0, interfejsy API i zestawy SDK są aktualizowane do analizy dokumentów.
- Niektóre platformy nadal czekają na zmianę nazwy aktualizacji. Wszystkie wzmianki o rozpoznawaniu formularzy lub analizie dokumentów w naszej dokumentacji odnoszą się do tej samej usługi platformy Azure.
Azure AI Document Intelligence to oparta na chmurze usługa Azure AI, która umożliwia tworzenie inteligentnych rozwiązań do przetwarzania dokumentów. Ogromne ilości danych obejmujące szeroką gamę typów danych są przechowywane w formularzach i dokumentach. Analiza dokumentów umożliwia efektywne zarządzanie szybkością zbierania i przetwarzania danych oraz kluczem do ulepszonych operacji, świadomych decyzji opartych na danych i oświecenia innowacji.
| ✔️ Modele analizy dokumentów | ✔️ Wstępnie utworzone modele | ✔️ Modele niestandardowe |
Modele analizy dokumentów
Modele analizy dokumentów umożliwiają wyodrębnianie tekstu z formularzy i dokumentów oraz zwracanie zawartości gotowej do działania, użycia lub programowania w organizacji.
Odczyt | Wyodrębnij tekst drukowany
i odręczny.
Układ | Wyodrębnianie tekstu, tabel
i struktury dokumentów.
Odczyt | Wyodrębnij tekst drukowany
i odręczny.
Układ | Wyodrębnianie tekstu, tabel
i struktury dokumentów.
Dokument ogólny | Wyodrębnianie par tekstu,
struktury i klucz-wartość.
Wstępnie utworzone modele
Wstępnie utworzone modele umożliwiają dodawanie inteligentnego przetwarzania dokumentów do aplikacji i przepływów bez konieczności trenowania i tworzenia własnych modeli.
Faktura | Wyodrębnij szczegóły klienta i dostawcy.
Potwierdzenie | Wyodrębnij szczegóły transakcji sprzedaży.
Tożsamość | Wyodrębnianie szczegółów weryfikacji.
Kredyt hipoteczny w USA 1003 | Wyodrębnij szczegóły aplikacji pożyczki.
Kredyt hipoteczny w USA 1008 | Wyodrębnij szczegóły przekazywania pożyczki.
Ujawnienie kredytu hipotecznego w USA | Wyodrębnij końcowe warunki pożyczki zamykającej.
Karta ubezpieczenia zdrowotnego | Wyodrębnij szczegóły ubezpieczenia.
Kontrakt | Wyodrębnij umowę i szczegóły strony.
Karta kredytowa/debetowa | Wyodrębnianie informacji o karcie płatniczej.
Akt małżeństwa | Wyodrębnij certyfikowane informacje o małżeństwie.
Formularz podatku W-2 w USA | Wyodrębnij szczegóły odszkodowania podlegającego opodatkowaniu.
Formularz podatku amerykańskiego 1098 | Wyodrębnij szczegóły odsetek hipotecznych.
Formularz podatku 1098-E w USA | Wyodrębnij szczegóły odsetek pożyczek studenckich.
Formularz podatku 1098-T w USA | Wyodrębnij szczegóły kwalifikowanego czesnego.
Formularz podatku 1099 w USA | Wyodrębnij szczegóły odmiany formularza 1099.
Formularz podatku amerykańskiego 1040 | Wyodrębnij szczegóły odmiany formularza 1040.
Faktura | Wyodrębnij szczegóły klienta
i dostawcy.
Potwierdzenie | Wyodrębnij szczegóły transakcji sprzedaży
.
Tożsamość | Wyodrębnij szczegóły identyfikacji
i weryfikacji.
Karta ubezpieczenia zdrowotnego | Wyodrębnij szczegóły ubezpieczenia zdrowotnego.
Wizytówka | Wyodrębnianie danych kontaktowych firmy.
Kontrakt | Wyodrębnij umowę
i szczegóły strony.
Formularz podatku W-2 w USA | Wyodrębnij szczegóły odszkodowania podlegającego
opodatkowaniu.
Formularz podatku amerykańskiego 1098 | Wyodrębnij szczegóły odsetek hipotecznych.
Formularz podatku 1098-E w USA | Wyodrębnij szczegóły odsetek pożyczek studenckich.
Formularz podatku 1098-T w USA | Wyodrębnij szczegóły kwalifikowanego czesnego.
Modele niestandardowe
- Modele niestandardowe są trenowane przy użyciu oznaczonych zestawów danych w celu wyodrębniania odrębnych danych z formularzy i dokumentów, specyficznych dla przypadków użycia.
- Autonomiczne modele niestandardowe można łączyć w celu utworzenia złożonych modeli.
- Modele wyodrębniania Niestandardowe modele
✔️ wyodrębniania są trenowane w celu wyodrębniania pól oznaczonych etykietami z dokumentów.
Szablon niestandardowy | Wyodrębnianie danych z układów statycznych.
Niestandardowe neuronowe | Wyodrębnianie danych z dokumentów mieszanych.
Komponowane niestandardowe | Wyodrębnianie danych przy użyciu kolekcji modeli.
✔️ Klasyfikatory niestandardowe modelu klasyfikacji identyfikują typy dokumentów przed wywołaniem modelu wyodrębniania.
Klasyfikator niestandardowy | Zidentyfikuj wyznaczone typy dokumentów (klasy)
przed wywołaniem modelu wyodrębniania.
Możliwości dodatków
Analiza dokumentów obsługuje opcjonalne funkcje, które można włączyć i wyłączyć w zależności od scenariusza wyodrębniania dokumentów. Następujące funkcje dodatku są dostępne dla 2023-07-31 (GA)
wersji i nowszych:
Analiza dokumentów obsługuje opcjonalne funkcje, które można włączyć i wyłączyć w zależności od scenariusza wyodrębniania dokumentów. Dostępne są następujące funkcje dodatku dla2024-02-29-preview
wersji , 2023-10-31-preview
i nowszych:
Funkcje analizy
Model ID | Wyodrębnianie zawartości | Pola zapytania | Ustępów | Role akapitu | Znaczniki zaznaczenia | Tabele | Pary klucz-wartość | Języki | Kody kreskowe | Analiza dokumentów | Formuły* | Czcionka stylu* | Wysoka rozdzielczość* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
odczyt wstępnie utworzony | ✓ | O | O | O | O | O | |||||||
wstępnie utworzony układ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
wstępnie utworzony dokument | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |
wstępnie utworzona karta biznesowa | ✓ | ✓ | ✓ | ||||||||||
wstępnie utworzony kontrakt | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
wstępnie utworzona faktura | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | ||
wstępnie utworzone potwierdzenie | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
wstępnie utworzona karta kredytowa | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1099(odmiany) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1040(odmiany) | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
√ - Włączone
O - Opcjonalne
* - Funkcje w warstwie Premium generują dodatkowe koszty
Modele i opcje programowania
Uwaga
Poniższe informacje o modelach i opcjach programowania są obsługiwane przez usługę Analizy dokumentów w wersji 3.0.
Za pomocą analizy dokumentów można zautomatyzować przetwarzanie dokumentów w aplikacjach i przepływach pracy, ulepszyć strategie oparte na danych i wzbogacić możliwości wyszukiwania dokumentów. Skorzystaj z linków w tabeli, aby dowiedzieć się więcej o poszczególnych modelach i przeglądać opcje programowania.
Przeczytaj
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
odczyt wstępnie utworzony | ● Wyodrębnij tekst z dokumentów. ● Wyodrębnianie danych |
● Cyfryzacja dowolnego dokumentu. ● Zgodność i inspekcja. ● Przetwarzanie notatek odręcznych przed tłumaczeniem. |
● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Układ
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
wstępnie utworzony układ | ● Wyodrębnij informacje o tekście i układzie z dokumentów. ● Wyodrębnianie danych |
● Indeksowanie i pobieranie dokumentów według struktury. ● Analiza raportów finansowych i medycznych. |
● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Dokument ogólny (przestarzały w wersji 2023-10-31-preview)
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
wstępnie utworzony dokument | ● Wyodrębnij pary tekstowe, układ i klucz-wartość z dokumentów. ● Wyodrębnianie danych i pól |
● Wyodrębnianie par klucz-wartość. ● Przetwarzanie formularzy. ● Zbieranie i analiza danych ankiety. |
● Document Intelligence Studio ● INTERFEJS API REST |
Faktura
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
wstępnie utworzona faktura | ● Wyodrębnij kluczowe informacje z faktur. ● Wyodrębnianie danych i pól |
● Rozliczanie płatnego przetwarzania. ● Automatyczne rejestrowanie i raportowanie podatków. |
● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Przyjęcie
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
wstępnie utworzone potwierdzenie | ● Wyodrębnij kluczowe informacje z paragonów. ● Dane i wyodrębnianie pól● Model paragonu v3.0 obsługuje przetwarzanie paragonów hotelowych jednostronicowych. |
● Zarządzanie wydatkami. ● Analiza danych zachowania konsumentów. ● Program lojalnościowy klienta. ● Przetwarzanie zwrotów towarów. ● Automatyczne rejestrowanie i raportowanie podatków. |
● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Tożsamość (identyfikator)
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
prebuilt-idDocument | ● Wyodrębnij kluczowe informacje z paszportów i kart identyfikacyjnych. ● Typy dokumentów● Wyodrębnij zatwierdzenia, ograniczenia i klasyfikacje pojazdów z licencji kierowców w USA. |
● Poznaj zgodność z wytycznymi dotyczącymi usług finansowych dla klienta (KYC). ● Zarządzanie kontami medycznymi. ● Punkty kontrolne i bramy tożsamości. ● Rejestracja hotelu. |
● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Amerykańska forma kredytu hipotecznego 1003
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
prebuilt-mortgage.us.1003 | ● Wyodrębnij kluczowe informacje z 1003 wniosków o pożyczkę. ● Wyodrębnianie danych i pól |
● Wymagania dotyczące dokumentacji Fannie Mae i Freddie Mac. | ● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Amerykańska forma kredytu hipotecznego 1008
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
prebuilt-mortgage.us.1008 | ● Wyodrębnij kluczowe informacje z jednolitego pisma i podsumowania przesyłania. ● Wyodrębnianie danych i pól |
● Przetwarzanie ubezpieczania pożyczek przy użyciu danych podsumowania. | ● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Formularz ujawnienia kredytu hipotecznego w USA
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
prebuilt-mortgage.us.closingDisclosure | ● Wyodrębnij kluczowe informacje z jednolitego pisma i podsumowania przesyłania. ● Wyodrębnianie danych i pól |
● Ostateczne wymagania dotyczące kredytu hipotecznego. | ● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Karta ubezpieczenia zdrowotnego
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
prebuilt-healthInsuranceCard.us | ● Wyodrębnij kluczowe informacje z amerykańskich kart ubezpieczenia zdrowotnego. ● Wyodrębnianie danych i pól |
● Weryfikacja pokrycia i uprawnień. ● Modelowanie predykcyjne. ● Analiza oparta na wartościach. |
● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Model kontraktu
Model ID | opis | Opcje programowania |
---|---|---|
wstępnie utworzony kontrakt | Wyodrębnij umowę kontraktową i szczegóły strony. ● Wyodrębnianie danych i pól |
● Document Intelligence Studio ● INTERFEJS API REST● INTERFEJS API REST● Zestaw SDK języka C# Python● Zestaw JAVA SDK ● JavaScript |
Model karty kredytowej
Model ID | opis | Opcje programowania |
---|---|---|
wstępnie utworzona karta kredytowa | Wyodrębnij umowę kontraktową i szczegóły strony. ● Wyodrębnianie danych i pól |
● Document Intelligence Studio ● INTERFEJS API REST● INTERFEJS API REST● Zestaw SDK języka C# Python● Zestaw JAVA SDK ● JavaScript |
Model certyfikatu małżeństwa
Model ID | opis | Opcje programowania |
---|---|---|
prebuilt-marriageCertificate.us | Wyodrębnij umowę kontraktową i szczegóły strony. ● Wyodrębnianie danych i pól |
● Document Intelligence Studio ● INTERFEJS API REST● INTERFEJS API REST● Zestaw SDK języka C# Python● Zestaw JAVA SDK ● JavaScript |
Model us Tax W-2
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
prebuilt-tax.us.W-2 | ● Wyodrębnij kluczowe informacje z formularzy podatkowych IRS US W2 (rok 2018-2021). ● Wyodrębnianie danych i pól |
● Zautomatyzowane zarządzanie dokumentami podatkowymi. ● Przetwarzanie wniosków o kredyt hipoteczny. |
● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Formularz podatku amerykańskiego 1098
Model ID | opis | Opcje programowania |
---|---|---|
prebuilt-tax.us.1098 | Wyodrębnij informacje o odsetkach kredytów hipotecznych i szczegóły. ● Wyodrębnianie danych i pól |
● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Formularz 1098-E podatku amerykańskiego
Model ID | opis | Opcje programowania |
---|---|---|
prebuilt-tax.us.1098E | Wyodrębnij informacje i szczegóły dotyczące pożyczki studenckiej. ● Wyodrębnianie danych i pól |
● Document Intelligence Studio ● ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Formularz 1098-T podatku amerykańskiego
Model ID | opis | Opcje programowania |
---|---|---|
prebuilt-tax.us.1098T | Wyodrębnij informacje i szczegóły czesnego. ● Wyodrębnianie danych i pól |
● Document Intelligence Studio ● INTERFEJS API REST |
Formularz podatku amerykańskiego 1099 (i odmian)
Model ID | opis | Opcje programowania |
---|---|---|
wstępnie utworzony podatek.us.1099{variation } |
Wyodrębnij informacje z odmian formularza 1099. | ● Wyodrębnianie danych i pól Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Formularz podatku amerykańskiego 1040
Model ID | opis | Opcje programowania |
---|---|---|
prebuilt-tax.us.1040 | Wyodrębnij informacje z odmian 1040 formularzy. | ● Wyodrębnianie danych i pól Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Karta biznesowa
Model ID | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
wstępnie utworzona karta biznesowa | ● Wyodrębnij kluczowe informacje z wizytówek. ● Wyodrębnianie danych i pól |
● Kierownik ds. sprzedaży i zarządzanie marketingem. | ● Document Intelligence Studio ● INTERFEJS API REST● C# SDK ● Python SDK● Java SDK ● JavaScript |
Omówienie modelu niestandardowego
Informacje | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
Model niestandardowy | Wyodrębnia informacje z formularzy i dokumentów do danych strukturalnych na podstawie modelu utworzonego na podstawie zestawu reprezentatywnych zestawów dokumentów szkoleniowych. | Wyodrębnij odrębne dane z formularzy i dokumentów specyficznych dla twojej firmy i przypadków użycia. | ● Document Intelligence Studio ● INTERFEJS API REST● Zestaw SDK języka C# Java● Zestaw SDK języka JavaScript ● Zestaw SDK języka Python |
Szablon niestandardowy
Uwaga
Aby wytrenować niestandardowy model szablonu, ustaw buildMode
właściwość na template
.
Aby uzyskać więcej informacji, zobacz Trenowanie modelu szablonu
Informacje | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
Niestandardowy model szablonu | Model szablonu niestandardowego wyodrębnia wartości i pola z dokumentów ustrukturyzowanych i częściowo ustrukturyzowanych. |
Wyodrębnianie kluczowych danych z dokumentów o wysokiej strukturze przy użyciu zdefiniowanych szablonów wizualnych lub typowych układów wizualnych, formularzy. | ● Document Intelligence Studio ● INTERFEJS API REST● Zestaw SDK języka C# Python● Zestaw JAVA SDK ● Zestaw SDK języka JavaScript |
Niestandardowe neuronowe
Uwaga
Aby wytrenować niestandardowy model neuronowy, ustaw buildMode
właściwość na neural
wartość .
Aby uzyskać więcej informacji, zobacz Trenowanie modelu neuronowego
Informacje | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
Niestandardowy model neuronowy | Niestandardowy model neuronowy służy do wyodrębniania danych oznaczonych etykietami ze strukturą (ankiet, kwestionariuszy), częściowo ustrukturyzowanych (faktur, zamówień zakupu) i dokumentów bez struktury (kontraktów, listów). | Wyodrębnianie danych tekstowych, pól wyboru i pól tabelarycznych z dokumentów ze strukturą i bez struktury. | Document Intelligence Studio ● INTERFEJS API REST● Zestaw SDK języka C# Java● Zestaw SDK języka JavaScript ● Zestaw SDK języka Python |
Komponowane niestandardowe
Informacje | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
Tworzenie modeli niestandardowych | Utworzony model jest tworzony przez pobranie kolekcji modeli niestandardowych i przypisanie ich do pojedynczego modelu utworzonego na podstawie typów formularzy. | Przydatne podczas trenowania kilku modeli i grupowania ich w celu analizowania podobnych typów formularzy, takich jak zamówienia zakupu. | ● Document Intelligence Studio ● INTERFEJS API REST● Zestaw SDK języka C# Java● Zestaw SDK języka JavaScript ● Zestaw SDK języka Python |
Niestandardowy model klasyfikacji
Informacje | opis | Przypadki użycia automatyzacji | Opcje programowania |
---|---|---|---|
Model klasyfikacji złożonej | Niestandardowe modele klasyfikacji łączą funkcje układu i języka w celu wykrywania, identyfikowania i klasyfikowania dokumentów w pliku wejściowym. | ● Wniosek o pożyczkę spakowany zawierający formularz wniosku, payslip i, wyciąg bankowy. ● Kolekcja zeskanowanych faktur. |
● Document Intelligence Studio ● INTERFEJS API REST |
Azure AI Document Intelligence to oparta na chmurze usługa Azure AI, która umożliwia deweloperom tworzenie inteligentnych rozwiązań do przetwarzania dokumentów. Analiza dokumentów stosuje optyczne rozpoznawanie znaków oparte na uczeniu maszynowym (OCR) i technologie rozumienia dokumentów w celu wyodrębniania tekstu, tabel, struktury i par klucz-wartość z dokumentów. Można również oznaczać i trenować modele niestandardowe, aby zautomatyzować wyodrębnianie danych ze struktur, częściowo ustrukturyzowanych i nieustrukturyzowanych dokumentów. Aby dowiedzieć się więcej na temat każdego modelu, zobacz artykuły Pojęcia:
Typ modelu | Nazwa modelu |
---|---|
Model analizy dokumentów | ● Model analizy układu |
Wstępnie utworzone modele | ● Model faktur● Model paragonu ● Model dokumentu tożsamości (ID) ● Model wizytówki |
Modele niestandardowe | ● Model niestandardowy ● Model złożony |
Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)
Modele analizy dokumentów i opcje programowania
Napiwek
- Aby uzyskać ulepszone środowisko i zaawansowaną jakość modelu, wypróbuj narzędzie Document Intelligence w wersji 3.0 Studio.
- Program Studio w wersji 3.0 obsługuje dowolny model trenowany z danymi oznaczonymi etykietami w wersji 2.1.
- Szczegółowe informacje na temat migracji z wersji 2.1 do wersji 3.0 można znaleźć w przewodniku migracji interfejsu API.
Uwaga
Następujące modele i opcje programowania są obsługiwane przez usługę Analizy dokumentów w wersji 2.1.
Skorzystaj z linków w tabeli, aby dowiedzieć się więcej o każdym modelu i przejrzeć odwołania do interfejsu API:
Model | opis | Opcje programowania |
---|---|---|
Analiza układu | Wyodrębnianie i analizowanie tekstu, znaczników zaznaczenia, tabel i współrzędnych pola ograniczenia z formularzy i dokumentów. | ● Narzędzie do etykietowania analizy dokumentów● Interfejs API REST● Zestaw SDK biblioteki klienckiej● Kontener docker analizy dokumentów |
Model niestandardowy | Wyodrębnianie i analizowanie danych z formularzy i dokumentów specyficznych dla odrębnych danych biznesowych i przypadków użycia. | ● Narzędzie do etykietowania analizy dokumentów● Interfejs API REST● Narzędzie do etykietowania próbek● Kontener docker analizy dokumentów |
Model faktury | Zautomatyzowane przetwarzanie danych i wyodrębnianie kluczowych informacji z faktur sprzedaży. | ● Narzędzie do etykietowania analizy dokumentów● Interfejs API REST● Zestaw SDK biblioteki klienckiej● Kontener docker analizy dokumentów |
Model paragonu | Zautomatyzowane przetwarzanie danych i wyodrębnianie kluczowych informacji z paragonów sprzedaży. | ● Narzędzie do etykietowania analizy dokumentów● Interfejs API REST● Zestaw SDK biblioteki klienckiej● Kontener docker analizy dokumentów |
Model dokumentu tożsamości (ID) | Zautomatyzowane przetwarzanie danych i wyodrębnianie kluczowych informacji z licencji kierowców w USA i międzynarodowych paszportów. | ● Narzędzie do etykietowania analizy dokumentów● Interfejs API REST● Zestaw SDK biblioteki klienckiej● Kontener docker analizy dokumentów |
Model wizytówek | Zautomatyzowane przetwarzanie danych i wyodrębnianie kluczowych informacji z wizytówek. | ● Narzędzie do etykietowania analizy dokumentów● Interfejs API REST● Zestaw SDK biblioteki klienckiej● Kontener docker analizy dokumentów |
Prywatność i zabezpieczenia danych
Podobnie jak we wszystkich usługach sztucznej inteligencji, deweloperzy korzystający z usługi Analizy dokumentów powinni mieć świadomość zasad firmy Microsoft dotyczących danych klientów. Zobacz naszą stronę Dane, prywatność i zabezpieczenia na potrzeby analizy dokumentów.
Następne kroki
Wybierz model analizy dokumentów.
Spróbuj przetwarzać własne formularze i dokumenty za pomocą programu Document Intelligence Studio.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.
Spróbuj przetwarzać własne formularze i dokumenty za pomocą narzędzia do etykietowania przykładowego analizy dokumentów.
Ukończ przewodnik Szybki start dotyczący analizy dokumentów i rozpocznij tworzenie aplikacji do przetwarzania dokumentów w wybranym języku programowania.
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla