Condividi tramite


Trasformazione Conteggio unione

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Crea un set di funzioni basate su una tabella di conteggi

Categoria: Learning con conteggi

Nota

Si applica a: Machine Learning Studio (versione classica)

Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.

Panoramica del modulo

Questo articolo descrive come usare il modulo Merge Count Transform in Machine Learning Studio (versione classica) per combinare due set di funzionalità basate sul conteggio. Unendo due set di conteggi e funzionalità correlati, è possibile migliorare potenzialmente la copertura e la distribuzione delle funzionalità.

Learning dai conteggi è particolarmente utile nei set di dati di grandi dimensioni con funzionalità di cardinalità elevata. La possibilità di combinare più set di dati in set di funzionalità basati sul conteggio senza dover rielaborare i set di dati rende più semplice raccogliere statistiche su set di dati molto grandi e applicarli a nuovi set di dati. Ad esempio, le tabelle count possono essere usate per raccogliere informazioni su terabyte di dati. È possibile usare nuovamente queste statistiche per migliorare l'accuratezza dei modelli predittivi in set di dati di piccole dimensioni.

Per unire due set di funzionalità basate sul conteggio, le funzionalità devono essere state create usando tabelle con lo stesso schema, vale a dire che entrambi i set devono usare le stesse colonne e avere gli stessi nomi e tipi di dati.

Come configurare la trasformazione Conteggio unione

  1. Per usare merge count transform, è necessario aver creato almeno una trasformazione basata sul conteggio e tale trasformazione deve essere presente nell'area di lavoro. Se è stata salvata una trasformazione basata sul conteggio da un esperimento diverso, cercare nel gruppo Trasformazioni. Se la trasformazione è stata creata nell'esperimento corrente, connettere gli output dei moduli seguenti:

    • Trasformazione Conteggio compilazioni. Crea una nuova trasformazione basata sul conteggio dai dati di origine.

    • Modificare i parametri della tabella Count. Accetta una trasformazione conteggio esistente come input e restituisce una trasformazione aggiornata.

    • Importare la tabella count. Questo modulo supporta la compatibilità con le versioni precedenti che hanno usato l'apprendimento basato sul conteggio. Se è stata usata l'opzione Importa tabella conteggio per analizzare la distribuzione dei valori in un set di dati e quindi i valori sono stati convertiti in funzionalità usando il modulo deprecato Count Featurizer, usare Import Count Table per convertire i risultati in una trasformazione.

  2. Aggiungere il modulo Merge Count Transform all'esperimento e connettere una trasformazione a ogni input.

    Suggerimento

    La seconda trasformazione è un input facoltativo: è possibile connettere la stessa trasformazione due volte o non connettere alcun elemento sulla seconda porta di input.

  3. Se non si vuole che il secondo set di dati sia ponderato equamente con il primo, specificare un valore per Fattore di decadimento. Il valore digitato indica come deve essere ponderato il set di funzionalità della seconda trasformazione.

    Ad esempio, il valore predefinito 1 pondera equamente entrambi i set di funzionalità. Il valore 0,5 indica che le funzionalità nel secondo set hanno metà del peso di quelle nel primo set.

  4. Facoltativamente, aggiungere un'istanza del modulo Applica trasformazione e applicare la trasformazione a un set di dati.

Esempio

Per esempi di come viene usato questo modulo, vedere l'Azure AI Gallery:

  • Learning con Conteggi: classificazione binaria: illustra come usare l'apprendimento con i moduli counts per generare funzionalità da colonne di valori categorici per un modello di classificazione binaria.

  • Learning con Conteggi: classificazione multiclasse con i dati dei taxi di New York: illustra come usare l'apprendimento con i moduli counts per eseguire la classificazione multiclasse nel set di dati dei taxi di NyC disponibile pubblicamente. L'esempio usa uno strumento di apprendimento della regressione logistica multiclasse per modellare questo problema.

  • Learning con Conteggi: classificazione binaria con i dati dei taxi di New York: illustra come usare l'apprendimento con i moduli counts per eseguire la classificazione binaria nel set di dati dei taxi di NYC disponibile pubblicamente. L'esempio usa uno strumento di apprendimento della regressione logistica a due classi per modellare il problema.

Input previsti

Nome Tipo Descrizione
Trasformazione conteggio precedente Interfaccia ITransform Trasformazione di conteggio da modificare
Nuova trasformazione conteggio Interfaccia ITransform Trasformazione di conteggio da aggiungere (facoltativo)

Parametri del modulo

Nome Tipo Intervallo Facoltativo Descrizione Predefinito
Fattore di decadimento Float Necessario 1.0f Fattore di decadimento da moltiplicare per la trasformazione di conteggio sulla porta di input destra

Output

Nome Tipo Descrizione
Trasformazione conteggio unito Interfaccia ITransform Trasformazione unita

Eccezioni

Eccezione Descrizione
Errore 0003 L'eccezione si verifica se uno o più input sono null o vuoti.
Errore 0086 Si verifica un'eccezione quando la trasformazione di un conteggio non è valida.

Vedi anche

Learning with Counts