Konfigurowanie pętli uczenia usługi Personalizacja
Ważne
Od 20 września 2023 r. nie będzie można tworzyć nowych zasobów usługi Personalizacja. Usługa Personalizacja jest wycofywana 1 października 2026 r.
Konfiguracja usługi obejmuje sposób traktowania nagród przez usługę, częstotliwości eksplorowania usługi, częstotliwości ponownego trenowania modelu i ilości przechowywanych danych.
Skonfiguruj pętlę szkoleniową na stronie Konfiguracja w witrynie Azure Portal dla tego zasobu usługi Personalizacja.
Planowanie zmian konfiguracji
Ponieważ niektóre zmiany konfiguracji resetuje model, należy zaplanować zmiany konfiguracji.
Jeśli planujesz używać trybu praktykanta, przed przełączeniem do trybu ucznia sprawdź konfigurację usługi Personalizacja.
Ustawienia, które obejmują resetowanie modelu
Poniższe akcje wyzwalają ponowne trenowanie modelu przy użyciu danych dostępnych do ostatnich 2 dni.
- Nagroda
- Eksploracja
Aby wyczyścić wszystkie dane, użyj strony Ustawienia modelu i uczenia.
Konfigurowanie nagród dla pętli opinii
Skonfiguruj usługę na potrzeby korzystania z nagród w pętli szkoleniowej. Zmiany następujących wartości spowodują zresetowanie bieżącego modelu personalizacji i ponowne trenowanie go z ostatnich 2 dni.
Wartość | Purpose |
---|---|
Czas oczekiwania na nagrody | Określa czas, w którym usługa Personalizacja będzie zbierać wartości nagród dla wywołania rangi, począwszy od momentu wystąpienia wywołania rangi. Ta wartość jest ustawiana przez pytanie: "Jak długo usługa Personalizacja powinna czekać na połączenia z nagrodami?" Każda nagroda przychodząca po tym oknie zostanie zarejestrowana, ale nie będzie używana do nauki. |
Nagroda domyślna | Jeśli w oknie Czas oczekiwania na nagrodę nie otrzymasz żadnego połączenia z nagrodą, usługa Personalizacja przypisze nagrodę domyślną. Domyślnie i w większości scenariuszy nagroda domyślna wynosi zero (0). |
Agregacja nagród | Jeśli dla tego samego wywołania interfejsu API rangi otrzymano wiele nagród, ta metoda agregacji jest używana: suma lub najwcześniejsza. Najwcześniej wybiera najwcześniejszy otrzymany wynik i odrzuca resztę. Jest to przydatne, jeśli chcesz uzyskać unikatową nagrodę wśród prawdopodobnie zduplikowanych wywołań. |
Po zmianie tych wartości upewnij się, że wybierz pozycję Zapisz.
Konfigurowanie eksploracji w celu umożliwienia dostosowania pętli uczenia
Personalizacja jest w stanie odnaleźć nowe wzorce i dostosować się do zmian zachowania użytkownika w czasie, eksplorując alternatywy zamiast korzystać z przewidywania wytrenowanego modelu. Wartość Eksploracja określa procent wywołań rangi, na które odpowiada eksploracja.
Zmiany tej wartości spowodują zresetowanie bieżącego modelu personalizacji i ponowne trenowanie go przy użyciu danych z ostatnich 2 dni.
Po zmianie tej wartości wybierz pozycję Zapisz.
Konfigurowanie częstotliwości aktualizacji modelu na potrzeby trenowania modelu
Częstotliwość aktualizacji modelu określa częstotliwość trenowania modelu.
Ustawienie częstotliwości | Purpose |
---|---|
1 minuta | Częstotliwości aktualizacji na minutę są przydatne podczas debugowania kodu aplikacji przy użyciu usługi Personalizacja, przeprowadzania pokazów lub interakcyjnego testowania aspektów uczenia maszynowego. |
15 min | Wysokie częstotliwości aktualizacji modelu są przydatne w sytuacjach, w których chcesz ściśle śledzić zmiany w zachowaniach użytkowników. Przykłady obejmują witryny uruchamiane na żywo wiadomości, wirusowe treści lub oferty produktów na żywo. W tych scenariuszach można użyć częstotliwości 15-minutowej. |
1 godzina | W większości przypadków użycia obowiązuje niższa częstotliwość aktualizacji. |
Po zmianie tej wartości wybierz pozycję Zapisz.
Przechowywanie danych
Okres przechowywania danych określa, ile dni usługa Personalizacja przechowuje dzienniki danych. Wcześniejsze dzienniki danych są wymagane do przeprowadzania ocen w trybie offline, które służą do mierzenia skuteczności usługi Personalizacja i optymalizowania zasad uczenia.
Po zmianie tej wartości wybierz pozycję Zapisz.