Omówienie przetwarzania dokumentów bez struktury w Microsoft Syntex

Uwaga

Do czerwca 2024 r. możesz wypróbować nieustrukturyzowane przetwarzanie dokumentów i inne wybrane usługi Syntex bez żadnych kosztów, jeśli masz skonfigurowane rozliczenia zgodnie z rzeczywistym użyciem . Aby uzyskać informacje i ograniczenia, zobacz Wypróbuj Microsoft Syntex i zapoznaj się z jej usługami.

Użyj modelu przetwarzania dokumentów bez struktury (metody nauczania), aby automatycznie klasyfikować pliki i wyodrębniać informacje. Najlepiej sprawdza się w przypadku dokumentów bez struktury, takich jak listy lub umowy.

Uwaga

Firma Microsoft szanuje prywatność i własność danych używanych do trenowania i przetwarzania modeli w aplikacji Syntex. Żadne dane organizacji nie są używane ani przesyłane przez firmę Microsoft do trenowania modeli sztucznej inteligencji, modeli w dużym języku ani innych modeli. Dane pozostają bezpiecznie w dzierżawie organizacji. Aby uzyskać więcej informacji, zobacz Ochrona danych i prywatność firmy Microsoft.

Wprowadzenie do modeli bez struktury

Model przetwarzania dokumentów bez struktury (wcześniej znany jako model zrozumienia dokumentów) używa sztucznej inteligencji (AI) do przetwarzania dokumentów. Dokumenty te muszą zawierać tekst, który można zidentyfikować na podstawie fraz lub wzorców. Zidentyfikowany tekst określa zarówno typ pliku, który jest (jego klasyfikacja), jak i to, co chcesz wyodrębnić (jego wyodrębniacze).

Uwaga

Aby uzyskać więcej informacji na temat używania przykładów syntex i scenariuszy, zobacz Wprowadzenie do wdrażania Microsoft Syntex i scenariuszy oraz przypadków użycia Microsoft Syntex.

Modele przetwarzania dokumentów bez struktury są tworzone i zarządzane w typie witryny programu SharePoint nazywanej centrum zawartości. Po zastosowaniu do biblioteki dokumentów programu SharePoint model jest skojarzony z typem zawartości ma kolumny do przechowywania wyodrębnianych informacji. Utworzony typ zawartości jest przechowywany w galerii typów zawartości programu SharePoint. Możesz również użyć istniejących typów zawartości do używania ich schematu.

Uwaga

Nie można aktualizować typów zawartości tylko do odczytu lub zapieczętowanej zawartości, więc nie można ich używać w modelu.

Dodaj klasyfikatory i wyodrębniacze do modeli przetwarzania dokumentów bez struktury, aby wykonać następujące czynności:

  • Klasyfikatory służą do identyfikowania i klasyfikowania dokumentów przekazanych do biblioteki dokumentów. Na przykład klasyfikator można "wytrenować", aby zidentyfikować wszystkie dokumenty odnawiania kontraktu przekazane do biblioteki. Typ zawartości odnawiania kontraktu jest definiowany przez Użytkownika podczas tworzenia klasyfikatora.

  • Wyodrębniacze pobierają informacje z tych dokumentów. Na przykład dla każdego dokumentu odnawiania kontraktu określonego w bibliotece dokumentów zostaną wyświetlone kolumny zawierające datę rozpoczęcia usługi i klienta dla każdego dokumentu.

Przykładowe pliki umożliwiają trenowanie i testowanie klasyfikatorów i wyodrębniaczy w modelu. Przykładowe pliki zawierają przykłady modelu, na które należy zwrócić uwagę podczas próby zidentyfikowania i wyodrębnienia danych z plików. Na przykład należy wytrenować klasyfikatory i wyodrębniacze odnawiania kontraktów przy użyciu przykładów dokumentów odnawiania kontraktu, z których współpracuje firma. Możesz również użyć przykładowych plików, aby przetestować skuteczność modelu.

Po opublikowaniu modelu użyj centrum zawartości, aby zastosować go do dowolnej biblioteki dokumentów programu SharePoint, do których masz dostęp.

Wymagania i ograniczenia

Aby uzyskać informacje o wymaganiach, które należy wziąć pod uwagę podczas wybierania tego modelu, zobacz Wymagania i ograniczenia dotyczące modeli w Microsoft Syntex.