Sdílet prostřednictvím


Machine Learning – Skóre

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Tato část obsahuje seznam modulů, které jsou k dispozici v Machine Learning Studiu (klasickém) pro bodování.

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Bodování se také nazývá predikce a je proces generování hodnot na základě natrénovaných modelů strojového učení s daty, která jsou na základě některých nových vstupních dat. Vytvořené hodnoty nebo skóre mohou představovat předpovědi budoucích hodnot, ale mohou také představovat pravděpodobnou kategorii nebo výsledek. Význam skóre závisí na typu dat, která poskytnete, a na typu modelu, který jste vytvořili.

Vytváření a používání modelů v Machine Learning Studiu (Classic)

Typický pracovní postup pro strojové učení zahrnuje tyto fáze:

  • Volba vhodného algoritmu a nastavení počátečních možností
  • Trénování modelu na kompatibilních datech
  • Vytváření předpovědí pomocí nových dat na základě vzorů v modelu
  • Vyhodnocením modelu určíte, jestli jsou předpovědi přesné, kolik chyb existuje a jestli dochází k nějakému přeučení.

Machine Learning Studio (classic) podporuje flexibilní a přizpůsobitelnou rozhraní pro strojové učení. Každý úkol v tomto procesu se provádí konkrétním typem modulu, který lze upravit, přidat nebo odebrat, aniž by to narušily zbytek experimentu.

Moduly v této části obsahují nástroje pro bodování. V této fázi strojového učení použijete natrénovaný model na nová data k vygenerování předpovědí. Tyto předpovědi můžete buď odeslat do aplikace, která využívá výsledky strojového učení, nebo výsledky bodování použít k vyhodnocení přesnosti a užitečnosti modelu.

Další informace o bodování

Bodování se ve strojovém učení běžně používá k tomu, aby se znamenají procesy generování nových hodnot vzhledem k modelu a nějakému novému vstupu. Místo "predikce" se používá obecný pojem "skóre", protože proces bodování může generovat tolik různých typů hodnot:

  • Seznam doporučených položek a skóre podobnosti
  • Číselné hodnoty pro modely časových řad a regresní modely.
  • Hodnota pravděpodobnosti, která označuje pravděpodobnost, že nový vstup patří do některé existující kategorie.
  • Název kategorie nebo clusteru, ke kterému je nová položka nejvíce podobná.
  • Predikovaná třída nebo výsledek pro klasifikační modely.

Poznámka

Možná jste také slyšeli slovo skóre , které se používá k váhy nebo hodnotě přiřazené v důsledku analýzy dat. V sadě Machine Learning Studio (klasické) ale bodování obvykle označuje proces generování predikovaných hodnot z nových dat.

Když do experimentu přidáte jeden z těchto modulů, musíte připojit už natrénovaný model strojového učení a některá nová data. Při spuštění experimentu nebo vybraného modulu bodovací modul ingestuje nová data, vypočítá skóre na základě modelu a vrátí skóre v tabulce.

Data použitá pro bodování

Nová data, která poskytnete jako vstup, obecně musí mít stejné sloupce, které se použily k trénování modelu, bez popisku nebo sloupce výsledku.

Sloupce, které se používají výhradně jako identifikátory, jsou obvykle vyloučeny při trénování modelu, a proto by měly být vyloučeny i při bodování. Identifikátory, jako jsou primární klíče, ale můžete později snadno znovu zkombinovat s hodnoticí datovou sadou pomocí modulu Přidat sloupce. Tento modul funguje, aniž byste museli zadat klíč spojení, pokud se velikost datové sady nezměnila.

Před bodováním datové sady vždy zkontrolujte chybějící hodnoty a hodnoty null. Pokud data použitá jako vstup pro bodování mají chybějící hodnoty, jako vstupy se používají chybějící hodnoty. Vzhledem k tomu, že se hodnoty null šíří, je výsledkem obvykle chybějící hodnota.

Seznam hodnotičových modulů

Machine Learning Studio (classic) poskytuje mnoho různých modulů vyhodnocování. Model vyberete v závislosti na typu modelu, který používáte, nebo na typu úkolu bodování, který provádíte:

  • Použít transformaci: Použije dobře zadanou transformaci dat na datovou sadu.

    Tento modul slouží k použití uloženého procesu na sadu dat.

  • Přiřazení dat ke clusterům: Přiřaďte data ke clusterům pomocí existujícího natrénového modelu clusteringu.

    Tento modul použijte, pokud chcete seskupovat nová data na základě existujícího modelu clusteringu K-Means.

    Tento modul nahrazuje modul Přiřadit ke clusterům (zastaralé), který je zastaralý, ale stále je k dispozici pro použití v existujících experimentech.

  • Score Matchbox Recommender (Doporučovat skóre matchboxu): Skóre předpovědí pro datovou sadu pomocí doporučovateče Matchboxu.

    Tento modul použijte, pokud chcete generovat doporučení, najít související položky nebo uživatele nebo predikovat hodnocení.

  • Score Model (Model skóre): Skóre předpovědí pro natrénovaný klasifikační nebo regresní model.

    Tento modul použijte pro všechny ostatní regresní a klasifikační modely a také některé modely detekce anomálií.

  • Pro Vowpal Wabbit jsou k dispozici speciální moduly bodování. Viz Analýza textu.
  • Skóre pro speciální třídy obrázků v předem vytrénovaných modelech můžete získat pomocí knihovny OpenCV.
  • Modul Detekce anomálií časových řad generuje skóre, která představují potenciální odchylky od trendu.

Příklady

Tyto příklady v Azure AI Gallery ukazují proces bodování, od základních po pokročilé scénáře:

  • Binární klasifikace pro přímý marketing: Demonstruje základní pracovní postup pro bodování ve scénáři, kde předpovídanou hodnotou je reakce zákazníka na marketingovou kampaň.

  • Predikce recenzí knih: Bodování textových dat Používá logistický regresní model.

  • Učení s počty: Ukazuje, jak použít featurizaci na základě počtu pro vytváření předpovědí.

  • Dávkové vyhodnocování bez kódu pomocí Logic Apps a Machine Learning: Znázorňuje proces trénování a vyhodnocování od konce automatizovaný pomocí Logic Apps funkce Azure App Service.

Následující články obsahují reálné příklady použití modelu strojového učení k bodování:

Viz také