Udostępnij za pośrednictwem


Score Matchbox Recommender

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Ocenianie przewidywań dla zestawu danych za pomocą polecenia Matchbox

Kategoria: Machine Learning / Wynik

Uwaga

Dotyczy: Machine Learning Studio (wersja klasyczna)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano, jak za pomocą modułu polecania pola dopasowania wyników w programie Machine Learning Studio (klasycznego) tworzyć przewidywania na podstawie wytrenowany model rekomendacji na podstawie algorytmu pola dopasowania firmy Microsoft Research.

Program rekomendacji matchbox może generować cztery różne rodzaje przewidywań:

Tworząc trzy ostatnie rodzaje przewidywań, można pracować w trybie produkcyjnym lub ewaluacyjnym.

  • Tryb produkcyjny uwzględnia wszystkich użytkowników lub elementy i jest zwykle używany w usłudze internetowej.

    Wyniki można tworzyć dla nowych użytkowników, a nie tylko dla użytkowników widocznych podczas trenowania. Aby uzyskać więcej informacji, zobacz tę sekcję.

  • Tryb oceny działa na ograniczonych zestawach użytkowników lub elementów, które można ocenić i jest zwykle używany podczas eksperymentowania.

Porada

W tym samouczku zespół programistów .NET może dowiedzieć się wszystkiego, co musisz wiedzieć na temat budowania systemu rekomendacji. Zawiera przykładowy kod i omówienie sposobu Machine Learning z aplikacji.

Tworzenie aparatu rekomendacji dla aplikacji .NET przy użyciu Machine Learning

Więcej informacji o programie rekomendacji matchbox

Celem utworzenia systemu rekomendacji jest zalecenie co najmniej jednego "elementów" "użytkownikom" systemu. Przykładem elementu może być film, restauracji, książka lub utwór. Użytkownik może być osobą, grupą osób lub inną jednostką z preferencjami elementu.

Istnieją dwa podstawowe podejścia do systemów polecania. Pierwszym z nich jest podejście oparte na zawartości, które korzysta z funkcji zarówno dla użytkowników, jak i elementów. Użytkownicy mogą być opisywani przez właściwości, takie jak wiek i płeć, a elementy mogą być opisane przez właściwości, takie jak autor i producent. Typowe przykłady systemów rekomendacji opartych na zawartości można znaleźć w witrynach społecznościowych. Drugie podejście to filtrowanie oparte na współpracy, które używa tylko identyfikatorów użytkowników i elementów oraz uzyskuje niejawne informacje o tych jednostkach z (rozrzednej) macierzy klasyfikacji nadanych elementom przez użytkowników. Możemy dowiedzieć się więcej o użytkowniku na temat elementów, które zostały przez nich ocenione, oraz od innych użytkowników, którzy ocenili te same elementy.

Program rekomendacji Matchbox łączy filtrowanie zespołowe z podejściem opartym na zawartości. W związku z tym jest ona uważana za hybrydowy model rekomendacji. Gdy użytkownik jest stosunkowo nowym użytkownikiem systemu, przewidywania są ulepszane przez wykorzystanie informacji o funkcji użytkownika, co pozwala rozwiązać dobrze znany problem typu "zimny start". Jeśli jednak istnieje wystarczająca liczba ocen od określonego użytkownika, można dla niego samodzielnie przewidywać dane na podstawie ich klasyfikacji. W związku z tym istnieje bezproblemowe przejście z rekomendacji opartych na zawartości do zaleceń opartych na filtrowaniu opartym na współpracy. Nawet jeśli funkcje użytkownika lub elementu nie są dostępne, funkcja Matchbox nadal działa w trybie filtrowania współpracy.

Więcej szczegółów na temat narzędzia rekomendacji matchbox i jego podstawowego algorytmu probabilistycznego można znaleźć w odpowiednim dokumencie badawczym:

Przykłady

Przykłady tworzenia wyników z aparatu rekomendacji można znaleźć w Azure AI Gallery.

  • Polecany: Rekomendacja filmu: w tym przykładzie pokazano rekomendację elementu, gdzie elementy są filmami, a także przewidywania klasyfikacji.

  • Polecacz: Oceny restauracji: w tym przykładzie pokazano rekomendacje dotyczące elementów, korzystając zarówno z funkcji elementów, jak i funkcji użytkownika.

  • Rekomendacje Everywhere: ten wpis w blogu zawiera wprowadzenie wysokiego poziomu do systemów polecania z dużą ilością pomocy wizualnych.

How to configure Score Matchbox Recommender

Ten moduł obsługuje różne typy rekomendacji, z których każde ma różne wymagania. Kliknij link, aby uzyskać informacje o typie posiadanych danych i typie zalecenia, które chcesz utworzyć.

Przewidywanie klasyfikacji

Podczas przewidywania klasyfikacji model oblicza, jak dany użytkownik zareaguje na określony element na podstawie danych treningowych. W związku z tym dane wejściowe do oceniania muszą zapewniać ocenianie zarówno użytkownikowi, jak i elementowi.

  1. Dodaj wytrenowany model rekomendacji do eksperymentu i połącz go z polecaczem Trained Matchbox. Musisz utworzyć model przy użyciu polecenia Train Matchbox Recommender (Trenowanie polecania pola dopasowania).

  2. Rodzaj przewidywania polecania: wybierz pozycję Przewidywanie klasyfikacji. Nie są wymagane żadne dalsze parametry.

  3. Dodaj dane, dla których chcesz przewidywać, i połącz je z zestawem danych w celu oceny.

    Aby można było przewidzieć klasyfikacje, wejściowy zestaw danych musi zawierać pary użytkownik-element.

    Zestaw danych może zawierać opcjonalną trzecią kolumnę klasyfikacji dla pary elementów użytkownika w pierwszej i drugiej kolumnie, ale trzecia kolumna zostanie zignorowana podczas przewidywania.

  4. (Opcjonalnie). Jeśli masz zestaw danych funkcji użytkownika, połącz go z funkcjami użytkownika.

    Zestaw danych funkcji użytkownika powinien zawierać identyfikator użytkownika w pierwszej kolumnie. Pozostałe kolumny powinny zawierać wartości, które charakteryzują użytkowników, takie jak płeć, preferencje, lokalizacja itp.

    Funkcje użytkowników, którzy ocenili elementy, są ignorowane przez polecanie pola dopasowania wyników, ponieważ zostały one już poznane podczas trenowania. W związku z tym przefiltruj zestaw danych z wyprzedzeniem, aby uwzględnić tylko użytkowników w stanie zimnym lub użytkowników, którzy nie ocenili żadnych elementów.

    Ostrzeżenie

    Jeśli model został wytrenowany bez używania funkcji użytkownika, nie można wprowadzać funkcji użytkownika podczas oceniania.

  5. Jeśli masz zestaw danych funkcji elementów, możesz połączyć go z funkcjami elementu.

    Zestaw danych funkcji elementu musi zawierać identyfikator elementu w pierwszej kolumnie. Pozostałe kolumny powinny zawierać wartości, które znakują elementy.

    Funkcje elementów ocenianych są ignorowane przez polecanie pola dopasowania wyników, ponieważ zostały one już poznane podczas trenowania. W związku z tym należy ograniczyć zestaw danych oceniania do elementów zimnych start lub elementów, które nie zostały ocenione przez żadnych użytkowników.

    Ostrzeżenie

    Jeśli model został wytrenowany bez używania funkcji elementów, nie można wprowadzać funkcji elementów podczas oceniania.

  6. Użyj opcjonalnego piątego portu wejściowego o nazwie Training Dataset (Zestaw danych szkoleniowych), aby usunąć elementy, które zostały już ocenione z wyników przewidywania.

    Aby zastosować ten filtr, połącz oryginalny zestaw danych szkoleniowych z portem wejściowym.

  7. Uruchom eksperyment.

Wyniki dla przewidywań klasyfikacji

Wyjściowy zestaw danych zawiera trzy kolumny zawierające użytkownika, element i przewidywaną klasyfikację dla każdego wejściowego użytkownika i elementu.

Ponadto podczas oceniania są stosowane następujące zmiany:

  • Brakujące wartości w kolumnach funkcji użytkownika lub elementu są automatycznie zastępowane trybem brakujących wartości zestawu treningowego.

  • Wszystkie funkcje użytkownika i elementu są ponownie skalowane o odpowiednie maksymalne wartości bezwzględne widoczne podczas trenowania.

  • Żadne tłumaczenie nie jest stosowane do wartości cech w celu zachowania ich rozrzedności.

  • Cechy o wartości ciągu są konwertowane na zestaw funkcji wskaźników o wartości binarnej.

Recommend

Aby zalecić elementy dla użytkowników, należy podać listę użytkowników i elementów jako dane wejściowe. Na podstawie tych danych model wykorzystuje swoją wiedzę o istniejących elementach i użytkownikach, aby wygenerować listę elementów z prawdopodobnym odwołaniem dla każdego użytkownika. Możesz dostosować liczbę zwróconych zaleceń i ustawić próg dla liczby poprzednich zaleceń, które są wymagane do wygenerowania zalecenia.

  1. Dodaj wytrenowany model rekomendacji do eksperymentu i połącz go z polecaczem Trained Matchbox. Model należy utworzyć przy użyciu polecenia Train Matchbox Recommender (Trenowanie polecania pola dopasowania).

  2. Aby zalecić elementy dla danej listy użytkowników, ustaw typ przewidywania polecania na wartość Rekomendacja elementu.

  3. Wybór zalecanego elementu: wskaż, czy używasz modułu oceniania w środowisku produkcyjnym, czy do oceny modelu, wybierając jedną z tych wartości:

    • Z listy Elementy oceniane (do oceny modelu): wybierz tę opcję, jeśli opracowujesz lub testujesz model. Ta opcja włącza tryb oceny, a moduł udostępnia rekomendacje tylko z elementów w wejściowym zestawie danych, które zostały ocenione.

    • Z listy Wszystkie elementy: wybierz tę opcję, jeśli chcesz skonfigurować eksperyment do użycia w usłudze internetowej lub środowisku produkcyjnym. Ta opcja włącza tryb produkcyjny, a moduł udostępnia rekomendacje dotyczące wszystkich elementów widocznych podczas trenowania.

  4. Dodaj zestaw danych, dla którego chcesz przewidywać, i połącz go z zestawem danych w celu oceny.

    • Jeśli wybierzesz opcję Ze wszystkich elementów, wejściowy zestaw danych powinien zawierać tylko jedną kolumnę zawierającą identyfikatory użytkowników, dla których mają być publikowane rekomendacje.

      Jeśli zestaw danych zawiera więcej niż jedną kolumnę, zostanie podniesiony błąd. Użyj modułu Select Columns in Dataset (Wybieranie kolumn w zestawie danych), aby usunąć dodatkowe kolumny z wejściowego zestawu danych.

    • Jeśli wybierzesz opcję Z elementów ocenianych (do oceny modelu), wejściowy zestaw danych powinien składać się z par użytkownik-element. Pierwsza kolumna powinna zawierać identyfikator użytkownika. Druga kolumna powinna zawierać odpowiednie identyfikatory elementów.

      Zestaw danych może zawierać trzecią kolumnę klasyfikacji elementów użytkownika, ale ta kolumna jest ignorowana.

  5. (Opcjonalnie). Jeśli masz zestaw danych funkcji użytkownika, połącz go z funkcjami użytkownika.

    Pierwsza kolumna w zestawie danych funkcji użytkownika powinna zawierać identyfikator użytkownika. Pozostałe kolumny powinny zawierać wartości, które znakują użytkownika, takie jak płeć, preferencje, lokalizacja itp.

    Funkcje użytkowników, którzy ocenili elementy, są ignorowane przez polecanie pola dopasowania wyników, ponieważ te funkcje zostały już poznane podczas trenowania. W związku z tym możesz z wyprzedzeniem filtrować zestaw danych, aby uwzględnić tylko użytkowników zimnych startów lub użytkowników, którzy nie ocenili żadnych elementów.

    Ostrzeżenie

    Jeśli model został wytrenowany bez używania funkcji użytkownika, nie można użyć funkcji stosowania podczas oceniania.

  6. (Opcjonalnie) Jeśli masz zestaw danych funkcji elementów, możesz połączyć go z funkcjami elementu.

    Pierwsza kolumna w zestawie danych funkcji elementu musi zawierać identyfikator elementu. Pozostałe kolumny powinny zawierać wartości, które znakują elementy.

    Funkcje elementów ocenianych są ignorowane przez polecanie pola dopasowania wyników, ponieważ te funkcje zostały już poznane podczas trenowania. W związku z tym można ograniczyć zestaw danych oceniania do elementów zimnych start lub elementów, które nie zostały ocenione przez żadnych użytkowników.

    Ostrzeżenie

    Jeśli model został wytrenowany bez używania funkcji elementów, nie używaj funkcji elementów podczas oceniania.

  7. Maksymalna liczba elementów, które mają być zalecane dla użytkownika: wpisz liczbę elementów do zwrócenia dla każdego użytkownika. Domyślnie zalecane jest 5 elementów.

  8. Minimalny rozmiar puli rekomendacji na użytkownika: wpisz wartość, która wskazuje, ile poprzednich zaleceń jest wymaganych. Domyślnie ten parametr jest ustawiony na wartość 2, co oznacza, że element musi być zalecany przez co najmniej dwóch innych użytkowników.

    Tej opcji należy używać tylko w przypadku oceniania w trybie oceny. Ta opcja nie jest dostępna w przypadku wybrania pozycji Ze wszystkich elementów.

  9. Uruchom eksperyment.

Wyniki rekomendacji dotyczącej elementu

Zestaw danych z ocenami zwrócony przez polecanie pola dopasowania wyników zawiera listę zalecanych elementów dla każdego użytkownika.

  • Pierwsza kolumna zawiera identyfikatory użytkowników.
  • Liczba dodatkowych kolumn jest generowana w zależności od wartości ustawionej dla ustawienia Maksymalna liczba elementów, które mają być zalecane dla użytkownika. Każda kolumna zawiera zalecany element (według identyfikatora). Zalecenia są uporządkowane według koligacji elementu użytkownika, a element o najwyższej koligacji jest umieszczany w kolumnie Element 1.

Ostrzeżenie

Tego ocenionego zestawu danych nie można ocenić przy użyciu modułu Evaluate Recommender (Ocena modułu rekomendacji ).

Znajdowanie powiązanych użytkowników

Opcja znalezienia powiązanych użytkowników jest przydatna, jeśli zalecasz "osoby takie jak Ty" lub jeśli tworzysz pulę podobnych użytkowników, na której będą bazować inne typy przewidywań.

  1. Dodaj wytrenowany model rekomendacji do eksperymentu i połącz go z polecaczem Trained Matchbox. Model należy utworzyć przy użyciu polecenia Train Matchbox Recommender (Trenowanie polecania pola dopasowania).

  2. Rodzaj przewidywania polecania: wybierz pozycję Powiązani użytkownicy.

  3. Powiązany wybór użytkownika: wskaż, w jaki sposób będziesz używać modelu do oceniania, i określ pulę użytkowników, na których będą bazować wyniki w następujący sposób:

    • W witrynie Wszyscy użytkownicy: wybierz tę opcję, jeśli chcesz skonfigurować eksperyment do użycia w usłudze internetowej lub w środowisku produkcyjnym lub jeśli chcesz prognozowanie dla nowych użytkowników. Ta opcja włącza tryb produkcyjny, a moduł opiera rekomendację tylko na użytkownikach widocznych podczas trenowania.

    • Z listy Użytkownicy, którzy ocenili elementy (do oceny modelu): wybierz tę opcję, jeśli opracowujesz lub testujesz model. Ta opcja włącza tryb oceny, a model opiera swoje zalecenia na użytkownikach w zestawie testowym, którzy ocenili niektóre typowe elementy.

  4. Połączenie zestaw danych zawierający użytkowników, dla których mają być generowane przewidywania. Format tego zestawu danych zależy od tego, czy używasz modułu oceniania w trybie produkcyjnym, czy w trybie oceny.

    • Tryb produkcyjny przy użyciu funkcji Ze wszystkich elementów

      Zestaw danych do oceny musi składać się z użytkowników , dla których chcesz znaleźć powiązanych użytkowników. Pierwsza i jedyna kolumna powinny zawierać identyfikatory użytkowników. Jeśli zostaną uwzględnione inne kolumny, zostanie podniesiony błąd. Użyj modułu Select Columns in Dataset (Wybieranie kolumn w zestawie danych), aby usunąć niepotrzebne kolumny.

    • Tryb oceny przy użyciu elementów ocenianych (do oceny modelu)

      Zestaw danych do oceny powinien składać się z 2–3 kolumn zawierających pary elementów użytkownika. Pierwsza kolumna powinna zawierać identyfikatory użytkowników. Druga kolumna powinna zawierać identyfikatory elementów. Zestaw danych może zawierać trzecią kolumnę klasyfikacji (użytkownika w kolumnie 1 dla elementu w kolumnie 2), ale kolumna klasyfikacji zostanie zignorowana.

  5. Maksymalna liczba powiązanych użytkowników do znalezienia dla użytkownika: wpisz liczbę, która wskazuje maksymalną liczbę przewidywań dla każdego użytkownika. Wartość domyślna to 5, co oznacza, że można zwrócić co najwyżej pięciu powiązanych użytkowników, ale w niektórych przypadkach może być ich mniej niż 5.

  6. W trybie oceny (Od użytkowników, którzy ocenili elementy) skonfiguruj następujące dodatkowe parametry:

    • Minimalna liczba elementów, które użytkownik zapytania i powiązany użytkownik muszą mieć wspólną ocenę: ta wartość określa próg rekomendacji. Wpisana liczba reprezentuje minimalną liczbę elementów, które musi zostać oceniona przez użytkownika docelowego i potencjalnego powiązanego użytkownika. Wartość domyślna to 2, co oznacza, że co najmniej dwa elementy muszą zostać ocenione przez obu użytkowników.

    • Minimalny rozmiar powiązanej puli użytkowników dla jednego użytkownika: ta wartość określa minimalną liczbę podobnych użytkowników potrzebnych do utworzenia zalecenia. Domyślnie wartość to 2, co oznacza, że jeśli masz zaledwie dwóch użytkowników, którzy są powiązani na podstawie oceny tych samych elementów, możesz uznać je za powiązane i wygenerować zalecenie.

  7. (Opcjonalnie). Jeśli masz zestaw danych funkcji użytkownika, połącz go z funkcjami użytkownika.

    Pierwsza kolumna w zestawie danych funkcji użytkownika powinna zawierać identyfikator użytkownika. Pozostałe kolumny powinny zawierać wartości, które znakują użytkownika, takie jak płeć, preferencje, lokalizacja itp.

    Funkcje użytkowników, którzy ocenili elementy, są ignorowane przez polecanie pola dopasowania wyników, ponieważ te funkcje zostały już poznane podczas trenowania. W związku z tym przefiltruj zestaw danych z wyprzedzeniem , aby uwzględnić tylko użytkowników w stanie zimnym lub użytkowników, którzy nie ocenili żadnych elementów.

    Ostrzeżenie

    Jeśli model został wytrenowany bez używania funkcji użytkownika, nie można zastosować funkcji użytkownika podczas oceniania.

  8. (Opcjonalnie) Jeśli masz zestaw danych funkcji elementów, połącz go z funkcjami elementu.

    Pierwsza kolumna w zestawie danych funkcji elementu musi zawierać identyfikator elementu. Pozostałe kolumny powinny zawierać wartości, które znakują elementy.

    Funkcje elementów ocenianych są ignorowane przez polecanie pola dopasowania wyników, ponieważ te funkcje zostały już poznane podczas trenowania. W związku z tym można ograniczyć zestaw danych oceniania do elementów zimnych start lub elementów, które nie zostały ocenione przez żadnych użytkowników.

    Ostrzeżenie

    Jeśli model został wytrenowany bez używania funkcji elementów, nie używaj funkcji elementów podczas oceniania.

  9. Uruchom eksperyment.

Zestaw danych z ocenami zwrócony przez polecanie pola dopasowania wyników zawiera listę użytkowników, którzy są powiązani z każdym użytkownikiem w wejściowym zestawie danych.

Dla każdego użytkownika określonego w wejściowym zestawie danych wynikowy zestaw danych zawiera zestaw powiązanych użytkowników.

  • Pierwsza kolumna zawiera identyfikator użytkownika docelowego (użytkownika podanego jako dane wejściowe).

  • Generowane są dodatkowe kolumny zawierające identyfikatory powiązanych użytkowników. Liczba dodatkowych kolumn zależy od wartości ustawionej w opcji Maksymalna liczba powiązanych użytkowników do znalezienia dla użytkownika.

    Powiązani użytkownicy są uporządkowani według siły relacji z użytkownikiem docelowym, a najbardziej powiązany użytkownik w kolumnie Powiązany użytkownik 1.

Znajdowanie powiązanych elementów

Przewidywając powiązane elementy, można wygenerować rekomendacje dla użytkowników na podstawie elementów, które zostały już ocenione.

  1. Dodaj wytrenowany model rekomendacji do eksperymentu i połącz go z polecaczem Trained Matchbox. Musisz utworzyć model przy użyciu polecenia Train Matchbox Recommender (Trenowanie polecania pola dopasowania).

  2. Rodzaj przewidywania polecania: wybierz pozycję Powiązane elementy.

  3. Połączenie zestaw danych, który zawiera użytkowników, dla których mają być generowane przewidywania. Format tego zestawu danych zależy od tego, czy moduł oceniania jest używany w trybie produkcyjnym, czy w trybie oceny.

    • Tryb produkcyjny przy użyciu pozycji Ze wszystkich elementów

      Zestaw danych do oceny musi składać się z elementów, dla których chcesz znaleźć powiązanych użytkowników.

      Pierwsza i jedyna kolumna powinny zawierać identyfikatory elementów. Jeśli zostaną uwzględnione inne kolumny, zostanie podniesiony błąd. Użyj modułu Select Columns in Dataset (Wybieranie kolumn w zestawie danych), aby usunąć niepotrzebne kolumny.

    • Tryb oceny z użyciem elementów ocenianych (do oceny modelu)

      Zestaw danych do oceny powinien składać się z 2–3 kolumn zawierających pary elementów użytkownika. Pierwsza kolumna powinna zawierać identyfikatory użytkowników. Druga kolumna powinna zawierać identyfikatory elementów.

      Zestaw danych może zawierać trzecią kolumnę klasyfikacji (według użytkownika w kolumnie 1 dla elementu w kolumnie 2), ale kolumna klasyfikacji jest ignorowana.

  4. Maksymalna liczba powiązanych elementów do znalezienia> dla elementu: wpisz liczbę, która wskazuje maksymalną liczbę przewidywań dla każdego elementu.

    Wartość domyślna to 5, co oznacza, że może zostać zwróconych co najwyżej pięć powiązanych elementów, ale liczba elementów może być mniejsza niż 5.

  5. Jeśli używasz trybu oceny (Od użytkowników, którzy ocenili elementy), skonfiguruj następujące dodatkowe parametry:

    • Minimalna liczba elementów, dla których element zapytania i powiązany element muszą być często oceniane: ta wartość określa próg zaleceń. Wpisana liczba reprezentuje minimalną liczbę elementów, które zostały ocenione przez użytkownika docelowego i niektórych powiązanych użytkowników. Wartość domyślna to 2, co oznacza, że co najmniej dwa elementy muszą zostać ocenione przez użytkownika docelowego i powiązanego użytkownika.

    • Minimalny rozmiar puli powiązanych elementów dla pojedynczego elementu: ta wartość kontroluje minimalną liczbę podobnych elementów potrzebnych do utworzenia zalecenia. Domyślnie wartość wynosi 2, co oznacza, że jeśli masz tylko dwa elementy powiązane na podstawie oceny przez tych samych użytkowników, możesz uznać je za powiązane i wygenerować rekomendację.

  6. (Opcjonalnie). Jeśli masz zestaw danych funkcji użytkownika, połącz go z funkcjami użytkownika.

    Pierwsza kolumna w zestawie danych funkcji użytkownika powinna zawierać identyfikator użytkownika. Pozostałe kolumny powinny zawierać wartości, które charakteryzują użytkownika, takie jak płeć, preferencje, lokalizacja itp.

    Funkcje użytkowników, którzy ocenili elementy, są ignorowane przez polecanie pola dopasowania wyników, ponieważ te funkcje zostały już poznane podczas trenowania. W związku z tym zestaw danych można filtrować z wyprzedzeniem , aby uwzględnić tylko użytkowników zimnych startów lub użytkowników, którzy nie ocenili żadnych elementów.

    Ostrzeżenie

    Jeśli model został wytrenowany bez używania funkcji użytkownika, nie można zastosować funkcji użytkownika podczas oceniania.

  7. (Opcjonalnie) Jeśli masz zestaw danych funkcji elementów, możesz połączyć go z funkcjami elementu.

    Pierwsza kolumna w zestawie danych funkcji elementu musi zawierać identyfikator elementu. Pozostałe kolumny powinny zawierać wartości, które charakteryzują element.

    Funkcje elementów ocenianych są ignorowane przez polecanie pola dopasowania wyników, ponieważ te funkcje zostały już poznane podczas trenowania. W związku z tym można ograniczyć zestaw danych oceniania do elementów zimnych start lub elementów, które nie zostały ocenione przez żadnych użytkowników.

    Ostrzeżenie

    Jeśli model został wytrenowany bez używania funkcji elementów, nie używaj funkcji elementów podczas oceniania.

  8. (Opcjonalnie) W eksperymencie predykcyjnym można użyć piątego portu wejściowego o nazwie Training Dataset (Zestaw danych szkoleniowych), aby usunąć istniejących użytkowników uwzględnionych w danych trenowania modelu z wyników przewidywania.

    Aby zastosować ten filtr, połącz oryginalny zestaw danych szkoleniowych z portem wejściowym.

  9. Uruchom eksperyment.

Scored dataset returned by Score Matchbox Recommender (Polecanie pola oceny) zawiera listę powiązanych elementów dla każdego elementu w wejściowym zestawie danych.

  • Pierwsza kolumna zawiera identyfikator elementu docelowego (elementu dostarczonego jako dane wejściowe).

  • Generowane są dodatkowe kolumny zawierające identyfikatory powiązanych elementów. Liczba dodatkowych kolumn zależy od wartości ustawionej w opcji Maksymalna liczba powiązanych elementów do znalezienia dla elementu.

    Powiązane elementy są uporządkowane według siły relacji z elementem docelowym, z najbardziej silnie powiązanym elementem w kolumnie Powiązany element 1.

Uwagi techniczne

Ta sekcja zawiera odpowiedzi na niektóre często zadawane pytania dotyczące tworzenia przewidywań przy użyciu polecania.

Użytkownicy i zalecenia dotyczące zimnego startu

Zazwyczaj w celu utworzenia rekomendacji moduł Modułu polecania pola dopasowania wyników wymaga tych samych danych wejściowych, które są używane podczas trenowania modelu, w tym identyfikatora użytkownika. Wynika to z tego, że algorytm musi wiedzieć, czy w trakcie trenowania czegoś na temat tego użytkownika.

Jednak w przypadku nowych użytkowników możesz nie mieć identyfikatora użytkownika, tylko niektórych funkcji użytkownika, takich jak wiek, płeć itd.

Nadal można tworzyć rekomendacje dla użytkowników, którzy są nowymi użytkownikami systemu, przez obsługę ich jako użytkowników w stanie zimnym. W przypadku takich użytkowników algorytm rekomendacji nie używa historii ani poprzednich klasyfikacji, tylko funkcji użytkownika.

Na potrzeby przewidywania użytkownik typu zimny start jest definiowany jako użytkownik o identyfikatorze, który nie został użyty do trenowania. Aby upewnić się, że identyfikatory nie są zgodne z identyfikatorami używanymi podczas trenowania, możesz utworzyć nowe identyfikatory. Można na przykład wygenerować losowe identyfikatory w określonym zakresie lub przydzielić serię identyfikatorów z wyprzedzeniem dla użytkowników w okresie zimnym.

Jeśli jednak nie masz żadnych danych filtrowania współpracy, takich jak wektor funkcji użytkownika, lepiej jest użyć klasyfikatora lub osoby uczącej się regresji.

Użycie w środowisku produkcyjnym programu rekomendacji Matchbox

Jeśli eksperymentowano z programem rekomendacji Matchbox, a następnie przenieść model do produkcji, należy pamiętać o tych kluczowych różnicach w przypadku korzystania z polecania w trybie oceny i w trybie produkcyjnym:

  • Ocena z definicji wymaga przewidywań, które można zweryfikować na tle podstaw w zestawie testowym. W związku z tym podczas oceny polecania musi on przewidywać tylko te elementy, które zostały ocenione w zestawie testowym. To musi ograniczać możliwe wartości, które są przewidywane.

    Jednak w przypadku zoperacyjności modelu zazwyczaj zmienia się tryb przewidywania w celu tworzenia rekomendacji na podstawie wszystkich możliwych elementów w celu uzyskania najlepszych przewidywań. W przypadku wielu z tych przewidywań nie ma odpowiadającej im prawdy, dlatego nie można zweryfikować dokładności zalecenia w taki sam sposób jak podczas eksperymentowania.

  • Jeśli nie poniesiesz identyfikatora użytkownika w środowisku produkcyjnym i udostępnisz tylko wektor funkcji, w odpowiedzi może zostać wyświetlona lista wszystkich zaleceń dla wszystkich możliwych użytkowników. Pamiętaj, aby podać identyfikator użytkownika.

    Aby ograniczyć liczbę zwracanych zaleceń, można również określić maksymalną liczbę zwracanych elementów na użytkownika.

  • Nie można generować przewidywań tylko dla elementów, które nie zostały wcześniej ocenione. Jest to celowe.

    Przyczyną jest to, że aby zalecić tylko te elementy, które nie zostały ocenione, polecaca musiałby przechować cały zestaw danych treningowych z modelem, co zwiększyłoby użycie magazynu.

    Jeśli chcesz zalecić tylko te elementy, które nie były widoczne dla Twojego użytkownika, możesz zażądać większej liczby elementów do rekomendacji, a następnie ręcznie odfiltrować te ocenione.

Ciągła aktualizacja polecania

Aktualizowanie (lub ciągłe trenowanie) modelu rekomendacji w trybie online nie jest obecnie obsługiwane Machine Learning. Jeśli chcesz przechwytywać odpowiedzi użytkowników na zalecenia i używać ich do ulepszania modelu, zalecamy okresowe ponowne trenowanie kompletnego modelu. Trenowanie przyrostowe nie jest możliwe, ale można zastosować przesuwane okno do danych treningowych, aby zminimalizować ilość danych podczas korzystania z najnowszych danych.

Oczekiwane dane wejściowe

Nazwa Typ Opis
Wytrenowany pomocnik matchbox ILearner Wytrenowany pomocnik matchbox
Zestaw danych do oceny Tabela danych Zestaw danych do oceny
Funkcje użytkownika Tabela danych Zestaw danych zawierający funkcje opisujące użytkowników

Te dane są opcjonalne
Funkcje elementów Tabela danych Zestaw danych zawierający funkcje opisujące elementy

Te dane są opcjonalne

Parametry modułu

Nazwa Zakres Typ Domyślny Opis
Rodzaj przewidywania polecania Lista Rodzaj przewidywania Zalecenie dotyczące elementu Określanie typu przewidywania, które powinny być wyprowadzane przez polecany typ
Wybór zalecanego elementu Lista Wybór elementu Z elementów ocenianych (do oceny modelu) Wybierz zestaw elementów, z których mają być rekomendacje
Wybór powiązanego użytkownika Lista Wybrany użytkownik Od użytkowników, którzy ocenili elementy (do oceny modelu) Wybieranie zestawu użytkowników do użycia podczas znajdowania powiązanych elementów
Wybór powiązanego elementu Lista [Wybór elementu Z elementów ocenianych (do oceny modelu) Wybieranie zestawu elementów do użycia podczas znajdowania powiązanych elementów

Dane wyjściowe

Nazwa Typ Opis
Scored dataset (Zestaw danych z wynikami Tabela danych Scored dataset (Zestaw danych z wynikami

Wyjątki

Wyjątek Opis
Błąd 0022 Wyjątek występuje, jeśli liczba wybranych kolumn w wejściowym zestawie danych nie jest równa oczekiwanej liczbie.
Błąd 0036 Wyjątek występuje, jeśli dla danego użytkownika lub elementu podano wiele wektorów funkcji.
Błąd 0013 Wyjątek występuje, jeśli przekazany do modułu uczenia ma nieprawidłowy typ.
Błąd 0035 Wyjątek występuje, jeśli nie podano żadnych funkcji dla danego użytkownika lub elementu.
Błąd 0053 Wyjątek występuje w przypadku, gdy nie ma żadnych funkcji użytkownika ani elementów rekomendacji pola dopasowania.
Błąd 0003 Wyjątek występuje, jeśli co najmniej jeden z wejść ma wartość null lub jest pusty.

Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kodów błędów.

Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).

Zobacz też

Trenuj polecanie matchbox
Ocena modułu poleceń
Ocena