Udostępnij za pośrednictwem


Obsługa języka na potrzeby niestandardowej analizy tekstu na potrzeby kondycji

Skorzystaj z tego artykułu, aby dowiedzieć się więcej o językach obsługiwanych obecnie przez niestandardowe analiza tekstu dla kondycji.

Opcja obsługi wielu języków

Dzięki niestandardowym analiza tekstu dla kondycji można wytrenować model w jednym języku i użyć go do wyodrębniania jednostek z dokumentów innych języków. Ta funkcja pozwala zaoszczędzić problemy z tworzeniem oddzielnych projektów dla każdego języka, a zamiast tego łączenie zestawów danych w jednym projekcie, co ułatwia skalowanie projektów do wielu języków. Możesz wytrenować projekt w całości przy użyciu dokumentów angielskich i wykonać zapytanie w: francuski, niemiecki, włoski i inne. Możesz włączyć opcję wielojęzyczną w ramach procesu tworzenia projektu lub później za pomocą ustawień projektu.

Nie oczekuje się dodania tej samej liczby dokumentów dla każdego języka. Większość projektu należy utworzyć w jednym języku i dodać tylko kilka dokumentów w językach, które obserwujesz, nie działają prawidłowo. Jeśli utworzysz projekt, który jest głównie w języku angielskim i zaczniesz testować go w języku francuskim, niemieckim i hiszpańskim, możesz zauważyć, że język niemiecki nie działa, a także inne dwa języki. W takim przypadku rozważ dodanie 5% oryginalnych dokumentów w języku angielskim w języku niemieckim, wytrenuj nowy model i ponownie przetestuj go w języku niemieckim. Na stronie etykietowania danych w programie Language Studio możesz wybrać język dodawanego dokumentu. Powinny zostać wyświetlone lepsze wyniki dla niemieckich zapytań. Tym bardziej oznaczone dokumenty, tym bardziej prawdopodobne, że wyniki będą lepsze. Podczas dodawania danych w innym języku nie należy oczekiwać, że będzie ona negatywnie wpływać na inne języki.

Język hebrajski nie jest obsługiwany w projektach wielojęzycznych. Jeśli podstawowym językiem projektu jest hebrajski, nie będzie można dodawać danych szkoleniowych w innych językach ani wykonywać zapytań względem modelu w innych językach. Podobnie, jeśli podstawowym językiem projektu nie jest hebrajski, nie będzie można dodawać danych treningowych w języku hebrajskim ani wykonywać zapytań względem modelu w języku hebrajskim.

Obsługa języków

Niestandardowe analiza tekstu dla kondycji obsługują .txt pliki w następujących językach:

Język Kod języka
angielski en
Francuski fr
Niemiecki de
Hiszpański es
włoski it
portugalski (Portugalia) pt-pt
Hebrajski he

Następne kroki