Udostępnij za pośrednictwem


Konfigurowanie pętli uczenia usługi Personalizacja

Ważne

Od 20 września 2023 r. nie będzie można tworzyć nowych zasobów usługi Personalizacja. Usługa Personalizacja jest wycofywana 1 października 2026 r.

Konfiguracja usługi obejmuje sposób traktowania nagród przez usługę, częstotliwości eksplorowania usługi, częstotliwości ponownego trenowania modelu i ilości przechowywanych danych.

Skonfiguruj pętlę szkoleniową na stronie Konfiguracja w witrynie Azure Portal dla tego zasobu usługi Personalizacja.

Planowanie zmian konfiguracji

Ponieważ niektóre zmiany konfiguracji resetuje model, należy zaplanować zmiany konfiguracji.

Jeśli planujesz używać trybu praktykanta, przed przełączeniem do trybu ucznia sprawdź konfigurację usługi Personalizacja.

Ustawienia, które obejmują resetowanie modelu

Poniższe akcje wyzwalają ponowne trenowanie modelu przy użyciu danych dostępnych do ostatnich 2 dni.

  • Nagroda
  • Eksploracja

Aby wyczyścić wszystkie dane, użyj strony Ustawienia modelu i uczenia.

Konfigurowanie nagród dla pętli opinii

Skonfiguruj usługę na potrzeby korzystania z nagród w pętli szkoleniowej. Zmiany następujących wartości spowodują zresetowanie bieżącego modelu personalizacji i ponowne trenowanie go z ostatnich 2 dni.

Konfigurowanie wartości nagród dla pętli opinii

Wartość Purpose
Czas oczekiwania na nagrody Określa czas, w którym usługa Personalizacja będzie zbierać wartości nagród dla wywołania rangi, począwszy od momentu wystąpienia wywołania rangi. Ta wartość jest ustawiana przez pytanie: "Jak długo usługa Personalizacja powinna czekać na połączenia z nagrodami?" Każda nagroda przychodząca po tym oknie zostanie zarejestrowana, ale nie będzie używana do nauki.
Nagroda domyślna Jeśli w oknie Czas oczekiwania na nagrodę nie otrzymasz żadnego połączenia z nagrodą, usługa Personalizacja przypisze nagrodę domyślną. Domyślnie i w większości scenariuszy nagroda domyślna wynosi zero (0).
Agregacja nagród Jeśli dla tego samego wywołania interfejsu API rangi otrzymano wiele nagród, ta metoda agregacji jest używana: suma lub najwcześniejsza. Najwcześniej wybiera najwcześniejszy otrzymany wynik i odrzuca resztę. Jest to przydatne, jeśli chcesz uzyskać unikatową nagrodę wśród prawdopodobnie zduplikowanych wywołań.

Po zmianie tych wartości upewnij się, że wybierz pozycję Zapisz.

Konfigurowanie eksploracji w celu umożliwienia dostosowania pętli uczenia

Personalizacja jest w stanie odnaleźć nowe wzorce i dostosować się do zmian zachowania użytkownika w czasie, eksplorując alternatywy zamiast korzystać z przewidywania wytrenowanego modelu. Wartość Eksploracja określa procent wywołań rangi, na które odpowiada eksploracja.

Zmiany tej wartości spowodują zresetowanie bieżącego modelu personalizacji i ponowne trenowanie go przy użyciu danych z ostatnich 2 dni.

Wartość eksploracji określa, jaki procent wywołań rangi są odbierane z eksploracji

Po zmianie tej wartości wybierz pozycję Zapisz.

Konfigurowanie częstotliwości aktualizacji modelu na potrzeby trenowania modelu

Częstotliwość aktualizacji modelu określa częstotliwość trenowania modelu.

Ustawienie częstotliwości Purpose
1 minuta Częstotliwości aktualizacji na minutę są przydatne podczas debugowania kodu aplikacji przy użyciu usługi Personalizacja, przeprowadzania pokazów lub interakcyjnego testowania aspektów uczenia maszynowego.
15 min Wysokie częstotliwości aktualizacji modelu są przydatne w sytuacjach, w których chcesz ściśle śledzić zmiany w zachowaniach użytkowników. Przykłady obejmują witryny uruchamiane na żywo wiadomości, wirusowe treści lub oferty produktów na żywo. W tych scenariuszach można użyć częstotliwości 15-minutowej.
1 godzina W większości przypadków użycia obowiązuje niższa częstotliwość aktualizacji.

Częstotliwość aktualizacji modelu określa częstotliwość ponownego trenowania nowego modelu personalizacji.

Po zmianie tej wartości wybierz pozycję Zapisz.

Przechowywanie danych

Okres przechowywania danych określa, ile dni usługa Personalizacja przechowuje dzienniki danych. Wcześniejsze dzienniki danych są wymagane do przeprowadzania ocen w trybie offline, które służą do mierzenia skuteczności usługi Personalizacja i optymalizowania zasad uczenia.

Po zmianie tej wartości wybierz pozycję Zapisz.

Następne kroki

Dowiedz się, jak zarządzać modelem