Przeczytaj w języku angielskim

Udostępnij za pośrednictwem


Często zadawane pytania dotyczące przetwarzania dokumentów

Ten artykuł zawiera odpowiedzi na często zadawane pytania dotyczące modelu przetwarzania dokumentów w AI Builder. Jeśli nie znajdziesz tutaj swojego pytania, przejrzyj przegląd modelu AI przetwarzania dokumentów lub prześlij swoje pytanie do Power Automate społeczność dla AI Builder.

Funkcje

Co można zrobić dzięki przetwarzaniu dokumentów?

Dzięki przetwarzaniu dokumentów można zbudować niestandardowy model sztucznej inteligencji w celu wyodrębniania informacji z różnych rodzajów dokumentów.

  • Opcja Dokumenty ze stałym szablonem jest idealna, jeśli elementy dokumentów można znaleźć w podobnych miejscach. Zazwyczaj dotyczy to faktur, zleceń zakupu, zleceń dostawy i formularzy podatkowych.
  • Dokumenty ogólne opcja jest idealna dla każdego rodzaju dokumentów, w tym tych obsługiwanych przez pierwszą opcję, ale także umów, zestawień prac, listów i innych. Ta opcja może być bardziej wydajna w wyodrębnianiu danych, ale wymaga dłuższego czasu szkolenia.

Dowiedz się więcej: Omówienie modelu przetwarzania dokumentów

Jakie rodzaje dokumentów mogą być przetwarzane w procesie przetwarzania dokumentów?

Obsługiwane typy plików to PDF, JPG i PNG.

Jakie dane mogę wydobyć z dokumentów za pomocą przetwarzania dokumentów?

Przetwarzanie formularzy może wyodrębniać pola, tabele i pola wyboru z dokumentów.

Więcej informacji: Określ informacje do wyodrębnienia

Czy mogę wyodrębnić odręczny tekst z dokumentów?

Tak. Przetwarzanie dokumentów może wyodrębnić z dokumentów tekst drukowany i pisany odręcznie.

Ile próbek potrzebuję, aby wytrenować model przetwarzania dokumentów?

W przypadku wysokiej jakości dokumentów o tym samym układzie wystarczy pięć przykładowych dokumentów. W przypadku dokumentów o niskiej jakości (na przykład słabo zeskanowanych dokumentów) może być potrzebnych więcej dokumentów przykładowych. Aby poprawić wyniki, użyj od 15 do 20 przykładowych dokumentów.

Czy pojedynczy model przetwarzania formularzy może wyodrębniać informacje z dokumentów, które mają różne układy lub szablony?

Tak. Korzystając z funkcji kolekcje, szkolisz jeden model przetwarzania formularzy do obsługi dokumentów o różnych układach.

Dowiedz się więcej: Grupowanie dokumentów według kolekcji

Czy przetwarzanie dokumentów może obsługiwać wiele formularzy w jednym dokumencie?

Każdy formularz musi znajdować się w osobnym pliku. Na przykład, jeśli masz dokument PDF z wieloma fakturami, przed wysłaniem go do modelu przetwarzania dokumentów utwórz osobny plik dla każdej faktury.

Możesz też określić strony, które mają być obsługiwane przez model przetwarzania dokumentów. W ten sposób można wykorzystać funkcjonalność modelu do zapętlania strona po stronie i przetwarzania po jednym formularzu na raz.

Więcej informacji: Zakres stron

Wytrenowałem model przetwarzania dokumentów, ale nie uzyskuję dobrych wyników, jeśli chodzi o wyodrębnione dane. Jak ulepszyć model?

Jeśli po przeszkoleniu model zwraca słabe wyniki, należy edytować model i dostarczyć więcej próbek do przeszkolenia. Im więcej próbek dostarczysz, tym lepiej model AI nauczy się wyodrębniać dane z Twoich dokumentów.

Dowiedz się więcej: Poprawianie wydajności swojego modelu przetwarzania dokumentów

Ograniczenia

Jaka jest maksymalna liczba dokumentów, które mogę przetworzyć?

Możesz przetwarzać do 360 dokumentów na środowisko co 60 sekund.

Dlaczego niektóre postacie są nieprawidłowo rozpoznawane?

  • Może się zdarzyć, że niektóre znaki zostaną pomieszane: 0 (cyfra) i O (litera), 1 (cyfra) i l (litera), 4 (cyfra) i A (litera) i inne.
  • Może się zdarzyć, że niektóre znaki znajdujące się nad innymi lub blisko nich zostaną nieprawidłowo rozpoznane: O (litera) nad linią pionową staje się 0 (cyfra), 5 (cyfra) nad linią staje się $ (znak dolara amerykańskiego), i (mała litera, podkreślenie) zmienia się w L (wielką literę) i więcej.
  • Może się zdarzyć, że niektóre znaki na dokumentach o złej jakości zostaną rozpoznane nieprawidłowo lub wcale.

W powyższych przypadkach nie można nic zrobić w AI Builder, by poprawić rozpoznawalność. Zalecamy poprawę jakości i układu dokumentu źródłowego, aby rozwiązać podobne problemy.

Uwaga

Technologia OCR do wykrywania znaków jest stale udoskonalana przez firmę Microsoft, dzięki czemu takie problemy zdarzają się rzadziej.

Czy mogę stworzyć model z wieloma kolekcjami?

Można tworzyć do 200 zbiorów na model. Jednak trenowanie modeli Dokumenty ogólne z dziesiątkami kolekcji może zająć kilka godzin i – w rzadkich przypadkach – może zostać przerwane. Jeśli twój model ma dużą liczbę kolekcji, spodziewaj się czekać do 24 godzin na ukończenie szkolenia modelu.

Czy mogę stworzyć model w rozwiązaniu?

Obecnie nie ma możliwości stworzenia modelu w rozwiązaniu.

Czy mogę używać umów i listów w moim modelu przetwarzania dokumentów?

Tak, dokumenty nieustrukturyzowane, takie jak umowy i pisma, są obsługiwane przez przetwarzanie dokumentów przy użyciu opcji Dokumenty ogólne.

Porównania

Jakie są różnice między przetwarzaniem dokumentów, przetwarzaniem faktur, przetwarzaniem paragonów, czytnikiem dokumentów tożsamości, czytnikiem wizytówek i rozpoznawaniem tekstu?

W zależności od sytuacji może być konieczne użycie konkretnego modelu lub ich kombinacji.

Rozpoznawania tekstu można użyć, aby wyodrębnić cały tekst ze obrazu lub pliku PDF. Możesz wtedy na przykład wyszukać słowo kluczowe w wyodrębnionym tekście lub zbudować pewne stałe reguły, aby wyodrębnić określone elementy.

Jeśli chcesz uzyskać informacje z faktur, paragonów, paszportów, praw jazdy lub wizytówek, zacznij od odpowiedniego gotowego modelu:

Z tych gotowych modeli można korzystać od razu, bez konieczności tworzenia nowego modelu. Modele te mogą wyodrębnić wspólne informacje znalezione w odpowiadającym im typie dokumentu.

Dla każdego innego typu dokumentu możesz stworzyć własny model przetwarzania dokumentu, który wyodrębni potrzebne pola i tabele. Dotyczy to również sytuacji, gdy potrzebujesz dodatkowych informacji, których nie zapewnia gotowy model.

Dowiedz się więcej: Niestandardowy model przetwarzania dokumentów

Jaka jest różnica między przetwarzaniem dokumentów w AI Builder a rozpoznawaniem formularzy Azure?

Przetwarzanie dokumentów AI Builder jest wbudowane na platformie Azure Form Recognizer. Zapewnia to obu produktom najnowsze osiągnięcia w zakresie sztucznej inteligencji firmy Microsoft.

  • AI Builder to część Microsoft Power Platform. Dzięki temu każdy może dodać sztuczną inteligencję do aplikacji i automatyzacji za pomocą łatwego w użyciu interfejsu. Nie trzeba być deweloperem ani badaczem danych.

  • Aparat rozpoznawania formularzy Azure jest ukierunkowany na profesjonalnych deweloperów. Mogą używać prostych interfejsów API REST, aby dodać możliwości sztucznej inteligencji do swoich niestandardowych rozwiązań kodu.

Opcje kosztów

Ile kosztuje AI Builder przetwarzanie dokumentów?

Możesz zacząć bezpłatnie korzystać z przetwarzania dokumentów, zaczynając wersję próbną. Po zakończeniu oceny należy zakupić środki AI Builder, aby korzystać z przetwarzania dokumentów. Każda strona przetwarzana przy użyciu przetwarzania dokumentów zużywa środki AI Builder, nawet jeśli nie zawiera danych do wyodrębnienia. Kredyty AI Builder można kupić za pośrednictwem dodatków AI Builder.

Dowiedz się więcej: licencja AI Builder