Wprowadzenie do przetwarzania języka naturalnego za pomocą biblioteki TensorFlow

Ukończone

W tym module zapoznamy się z różnymi architekturami sieci neuronowych do obsługi tekstu w języku naturalnym. W ostatnich latach przetwarzanie języka naturalnego (NLP) doświadczyło szybkiego wzrostu jako dziedziny, zarówno ze względu na ulepszenia architektur modelu języka, jak i dlatego, że zostały wytrenowane na coraz większych zbiorach tekstów. W rezultacie ich zdolność do "zrozumienia" tekstu znacznie się poprawiła, a duże wstępnie wytrenowane modele, takie jak, stały się powszechnie używane.

Skupimy się na podstawowych aspektach reprezentowania nlp jako tensorów w tensorFlow i klasycznych architekturach NLP, takich jak używanie słów bag-of-words, osadzanie i rekursja sieci neuronowych.

Zadania języka naturalnego

Istnieje kilka zadań nlp, które możemy rozwiązać przy użyciu sieci neuronowych:

  • Klasyfikacja tekstu jest używana, gdy musimy sklasyfikować fragment tekstu w jednej z kilku wstępnie zdefiniowanych klas. Przykłady obejmują wykrywanie wiadomości e-mail, kategoryzacja wiadomości, przypisywanie wniosku o pomoc techniczną do kategorii i nie tylko.
  • Klasyfikacja intencji to jeden konkretny przypadek klasyfikacji tekstu, w którym chcemy zamapować wypowiedź wejściową w konwersacyjnym systemie sztucznej inteligencji na jedną z intencji reprezentujących rzeczywiste znaczenie frazy lub intencji użytkownika.
  • Analiza sentymentu to zadanie regresji, w którym chcemy zrozumieć stopień pozytywności danego fragmentu tekstu. Możemy chcieć oznaczyć tekst w zestawie danych z większości ujemnych (-1) na najbardziej dodatni (+1) i wytrenować model, który zwróci liczbę reprezentującą pozytywność tekstu wejściowego.
  • Rozpoznawanie jednostek nazwanych (NER) to zadanie wyodrębniania jednostek z tekstu, takich jak daty, adresy, nazwy osób itp. Wraz z klasyfikacją intencji funkcja NER jest często używana w systemach dialogowych do wyodrębniania parametrów z wypowiedzi użytkownika.
  • Podobne zadanie wyodrębniania słów kluczowych może służyć do znajdowania najbardziej znaczących słów wewnątrz tekstu, które następnie mogą być używane jako tagi.
  • Podsumowanie tekstu wyodrębnia najbardziej znaczące fragmenty tekstu, dając użytkownikowi skompresowaną wersję oryginalnego tekstu.
  • Odpowiadanie na pytanie to zadanie wyodrębniania odpowiedzi z fragmentu tekstu. Ten model przyjmuje fragment tekstu i pytanie jako dane wejściowe i znajduje dokładne miejsce w tekście zawierającym odpowiedź. Na przykład tekst "John jest 22-letnim studentem, który uwielbia korzystać z usługi Microsoft Learn", a pytanie Jak stary jest Jan powinien dostarczyć nam odpowiedź 22.

W tym module skupimy się głównie na zadaniu klasyfikacji tekstu . Jednak poznamy wszystkie ważne pojęcia, które musimy obsługiwać trudniejsze zadania w przyszłości.

Cele szkolenia

  • Informacje o sposobie przetwarzania tekstu dla zadań NLP
  • Dowiedz się więcej o cyklicznych sieciach neuronowych (RN) i generowaniu sieci neuronowych (GNN)
  • Dowiedz się więcej o mechanizmach uwagi
  • Dowiedz się, jak tworzyć modele klasyfikacji tekstu

Wymagania wstępne

  • Znajomość języka Python
  • Podstawowa wiedza na temat uczenia maszynowego