Składniki jednostki
W zrozumieniu języka konwersacyjnego jednostki są odpowiednimi elementami informacji wyodrębnianych z wypowiedzi. Jednostkę można wyodrębnić przy użyciu różnych metod. Można je nauczyć za pomocą kontekstu, dopasowanego z listy lub wykrytego przez wstępnie rozpoznaną jednostkę. Każda jednostka w projekcie składa się z co najmniej jednej z tych metod, które są zdefiniowane jako składniki jednostki.
Gdy jednostka jest definiowana przez więcej niż jeden składnik, ich przewidywania mogą się nakładać. Zachowanie przewidywania jednostki można określić, gdy jego składniki nakładają się na siebie, używając stałego zestawu opcji w opcjach jednostki.
Typy składników
Składnik jednostki określa sposób wyodrębniania jednostki. Jednostka może zawierać jeden składnik, który określa jedyną metodę, która ma zostać użyta do wyodrębnienia jednostki. Jednostka może również zawierać wiele składników, aby rozszerzyć sposoby definiowania i wyodrębniania jednostki.
Poznany składnik
Poznany składnik używa tagów jednostek, za pomocą których oznaczysz wypowiedzi, aby wytrenować model poznany na maszynie. Model uczy się przewidywać, gdzie jednostka jest oparta na kontekście w wypowiedzi. Etykiety zawierają przykłady, w których jednostka ma być obecna w wypowiedzi, na podstawie znaczenia wokół niej słów i jako wyrazów, które zostały oznaczone etykietą.
Ten składnik jest definiowany tylko w przypadku dodawania etykiet przez tagowanie wypowiedzi dla jednostki. Jeśli nie oznaczysz żadnych wypowiedzi za pomocą jednostki, nie ma on wyuczonego składnika.
Składnik listy
Składnik listy reprezentuje stały, zamknięty zestaw powiązanych wyrazów wraz z ich synonimami. Składnik wykonuje dokładne dopasowanie tekstu względem listy wartości podanych jako synonimy. Każdy synonim należy do klucza listy, który może być używany jako znormalizowana, standardowa wartość synonimu zwracanego w danych wyjściowych, jeśli składnik listy jest zgodny. Klucze listy nie są używane do dopasowywania.
W projektach wielojęzycznych można określić inny zestaw synonimów dla każdego języka. Gdy używasz interfejsu API przewidywania, możesz określić język w żądaniu wejściowym, który odpowiada tylko synonimom skojarzonym z tym językiem.
Wstępnie utworzony składnik
Wstępnie utworzony składnik umożliwia wybranie z biblioteki typowych typów, takich jak liczby, daty/godziny i nazwy. Po dodaniu zostanie automatycznie wykryty wstępnie utworzony składnik. Na jednostkę może być maksymalnie pięć wstępnie utworzonych składników. Aby uzyskać więcej informacji, zobacz listę obsługiwanych wstępnie utworzonych składników.
Składnik wyrażeń regularnych
Składnik wyrażenia regularnego pasuje do wyrażeń regularnych w celu przechwytywania spójnych wzorców. Po dodaniu wyodrębniony jest dowolny tekst zgodny z wyrażeniem regularnym. W ramach tej samej jednostki można mieć wiele wyrażeń regularnych, z których każdy ma inny identyfikator klucza. Dopasowane wyrażenie zwraca klucz w ramach odpowiedzi przewidywania.
W projektach wielojęzycznych można określić inne wyrażenie dla każdego języka. Gdy używasz interfejsu API przewidywania, możesz określić język w żądaniu wejściowym, który odpowiada tylko wyrażeniu regularnemu skojarzonemu z tym językiem.
Opcje jednostek
Jeśli dla jednostki zdefiniowano wiele składników, ich przewidywania mogą się nakładać. Gdy wystąpi nakładanie, ostateczne przewidywanie każdej jednostki jest określane przez jedną z następujących opcji.
Łączenie składników
Połącz składniki jako jedną jednostkę, gdy nakładają się, przyjmując związek wszystkich składników.
Użyj tej opcji, aby połączyć wszystkie składniki, gdy nakładają się na siebie. Po połączeniu składników uzyskujesz wszystkie dodatkowe informacje powiązane z listą lub wstępnie utworzonym składnikiem, gdy są obecne.
Przykład
Załóżmy, że masz jednostkę o nazwie Oprogramowanie , która zawiera składnik listy zawierający "Proseware OS" jako wpis. W danych wypowiedzi masz "Chcę kupić proseware OS 9" z tagiem "Proseware OS 9":
Dzięki użyciu połączonych składników jednostka zwraca pełny kontekst jako "Proseware OS 9" wraz z kluczem ze składnika listy:
Załóżmy, że masz tę samą wypowiedź, ale przez poznany składnik przewidział tylko "system operacyjny 9":
W przypadku połączonych składników jednostka nadal zwraca wartość "Proseware OS 9" z kluczem ze składnika listy:
Nie łącz składników
Każdy nakładając się składnik zwraca jako osobne wystąpienie jednostki. Zastosuj własną logikę po przewidywaniu za pomocą tej opcji.
Przykład
Załóżmy, że masz jednostkę o nazwie Software z składnikiem listy zawierającym wpis "Proseware Desktop". W danych wypowiedzi masz etykietę "Chcę kupić Proseware Desktop Pro" z tagiem "Proseware Desktop Pro":
Gdy nie łączysz składników, jednostka zwraca dwa razy:
Wymagane składniki
Czasami jednostka może być zdefiniowana przez wiele składników, ale wymaga obecności co najmniej jednej z nich. Każdy składnik można ustawić zgodnie z wymaganiami, co oznacza, że jednostka nie zostanie zwrócona, jeśli ten składnik nie był obecny. Jeśli na przykład masz jednostkę ze składnikiem listy i wymaganym składnikiem poznanym, gwarantuje to, że każda zwrócona jednostka zawiera poznany składnik. Jeśli tak nie jest, jednostka nie zostanie zwrócona.
Wymagane składniki są najczęściej używane ze poznanymi składnikami, ponieważ mogą ograniczać inne typy składników do określonego kontekstu, który jest często skojarzony z rolami. Możesz również wymagać od wszystkich składników, aby upewnić się, że każdy składnik jest obecny dla jednostki.
W programie Language Studio każdy składnik w jednostce ma przełącznik obok niego, który umożliwia ustawienie go zgodnie z potrzebami.
Przykład
Załóżmy, że masz jednostkę o nazwie Ticket Quantity , która próbuje wyodrębnić liczbę biletów, które chcesz zarezerwować na loty, dla wypowiedzi, takich jak "Zarezerwuj dwa bilety jutro do Kairu".
Zazwyczaj dodaje się wstępnie utworzony składnik, Quantity.Number
który wyodrębnia już wszystkie liczby. Jeśli jednostka została zdefiniowana tylko za pomocą wstępnie utworzonego składnika, wyodrębnia również inne numery w ramach jednostki Ticket Quantity , np. "Zarezerwuj dwa bilety jutro do Kairu o godzinie 15 :00".
Aby rozwiązać ten scenariusz, oznaczysz poznany składnik w danych treningowych dla wszystkich liczb, które mają być ilością biletów. Jednostka ma teraz dwa składniki: wstępnie utworzony składnik, który zna wszystkie liczby, i poznany, który przewiduje, gdzie ilość biletu znajduje się w zdaniu. Jeśli potrzebujesz poznanego składnika, upewnij się, że funkcja Ticket Quantity zwraca wartość tylko wtedy, gdy poznany składnik przewidzi go w odpowiednim kontekście. Jeśli potrzebujesz również wstępnie utworzonego składnika, możesz zagwarantować, że zwrócona jednostka Ticket Quantity jest zarówno liczbą, jak i prawidłową pozycją.
Używanie składników i opcji
Składniki zapewniają elastyczność definiowania jednostki w więcej niż jeden sposób. Podczas łączenia składników upewnij się, że każdy składnik jest reprezentowany i zmniejsza liczbę jednostek zwracanych w przewidywaniach.
Typowym rozwiązaniem jest rozszerzenie wstępnie utworzonego składnika o listę wartości, których wstępnie skompilowany może nie obsługiwać. Jeśli na przykład masz jednostkę Organizacji , która ma General.Organization
dodany wstępnie utworzony składnik, jednostka może nie przewidzieć wszystkich organizacji specyficznych dla twojej domeny. Możesz użyć składnika listy, aby rozszerzyć wartości jednostki Organizacji i rozszerzyć wstępnie utworzony składnik za pomocą własnych organizacji.
Innym razem może cię zainteresować wyodrębnienie jednostki za pomocą kontekstu, takiego jak Produkt w projekcie detalicznym. Etykietujesz poznany składnik produktu, aby dowiedzieć się , gdzie produkt jest oparty na jego pozycji w zdaniu. Możesz również mieć listę produktów, które już wiesz wcześniej, że chcesz zawsze wyodrębnić. Połączenie obu składników w jednej jednostce umożliwia uzyskanie obu opcji dla jednostki.
Gdy składniki nie są łączone, można zezwolić każdemu składnikowi na działanie jako niezależny moduł wyodrębniania jednostek. Jednym ze sposobów użycia tej opcji jest oddzielenie jednostek wyodrębnionych z listy do tych wyodrębnionych za pośrednictwem poznanych lub wstępnie utworzonych składników w celu obsługi i traktowania ich inaczej.
Uwaga
Wcześniej w publicznej wersji zapoznawczej usługi dostępne były cztery dostępne opcje: Najdłuższe nakładanie się, Dokładne nakładanie, Nakładanie się na unię i Zwracanie wszystkich oddzielnie. Najdłuższe nakładanie się i Dokładne nakładanie są przestarzałe i są obsługiwane tylko w przypadku projektów, które wcześniej miały wybrane opcje. Zmieniono nazwę łączenia składników na Łączenie, natomiast zmieniono nazwę Funkcji Zwracaj wszystkie oddzielnie na Nie łącz składników.