Condividi tramite


Colonne della struttura di mining

È possibile definire le colonne in una struttura di data mining quando si crea la struttura di data mining scegliendo colonne di dati esterni e quindi specificando come utilizzare i dati per la modellazione. Pertanto, le colonne della struttura di data mining non sono semplicemente copie di dati da un'origine dati: definiscono come i dati dell'origine debbano essere utilizzati dal modello di data mining. È possibile assegnare proprietà che determinano come vengono discretizzati i dati, proprietà che descrivono come vengono distribuiti i valori dei dati

Le colonne della struttura di data mining sono progettate per essere flessibili ed estendibili, perché ogni algoritmo utilizzato per compilare un modello di data mining può utilizzare colonne diverse dalla struttura per interpretare i dati. Anziché avere un set di dati per ogni modello, è possibile usare una singola struttura di data mining e usare le colonne in esso contenute per personalizzare i dati per ogni modello.

Definizione delle colonne della struttura di estrazione dei dati

I tipi di dati di base e i tipi di contenuto che definiscono le colonne della struttura derivano dall'origine dati usata per creare la struttura. È possibile modificare queste impostazioni all'interno della struttura di data mining ed è anche possibile impostare i flag di modellazione e impostare la distribuzione per le colonne continue.

La definizione di una colonna di una struttura di data mining deve contenere le informazioni seguenti:

  • ID: nome univoco della colonna, spesso uguale al nome. Non è possibile modificare questa impostazione dopo aver creato la struttura di data mining, mentre il nome può essere modificato.

  • Nome: nome o alias per la colonna.

  • Contenuto: enumerazione che descrive se i dati sono discreti o continui.

  • Tipo: enumerazione che indica il tipo di dati generale.

  • Distribuzione: enumerazione che descrive la distribuzione prevista di valori. Se la colonna è continua, viene inclusa una distribuzione.

  • Flag di modellazione: enumerazione che indica come gestire i valori mancanti e così via. I flag di modellazione possono essere definiti anche nel modello di data mining, ma i flag del modello sono diversi dai flag usati nelle colonne della struttura.

  • Associazioni: proprietà che specificano i dati di origine.

Gli algoritmi di terze parti possono includere anche proprietà personalizzate che possono essere definite nella colonna della struttura di data mining.

Per ulteriori informazioni sulla struttura di data mining e sul modello di data mining, vedere Strutture di Data Mining (Analysis Services - Data Mining).

Per ulteriori informazioni su come definire e utilizzare le colonne nelle strutture di data mining, consultare i seguenti argomenti.

Argomento Collegamenti
Descrive i tipi di dati che è possibile utilizzare per definire una colonna di una struttura di mining. Tipi di dati (data mining)
Descrive i tipi di contenuto che sono disponibili per ogni tipo di dati contenuti in una colonna della struttura di mining. I tipi di contenuto dipendono dal tipo di dati. Il tipo di contenuto viene assegnato a livello di modello e determina il modo in cui i dati della colonna vengono usati dal modello. Tipi di contenuto (data mining)
Introduce il concetto di tabelle annidate e spiega come le tabelle annidate possano essere aggiunte all'origine dati come colonne della struttura di mining. Colonne classificate (Data Mining)
Elenca e spiega le proprietà di distribuzione che è possibile impostare su una colonna della struttura di data mining per specificare la distribuzione prevista dei valori nella colonna. Distribuzioni di colonne (Data Mining)
Illustra il concetto di discretizzazione (talvolta definito binning) e descrive i metodi forniti da Analysis Services per discretizzare i dati numerici continui. Metodi di discretizzazione (data mining)
Descrive i flag di modellazione che è possibile impostare su una colonna della struttura di data mining. Modellazione di Flag (Miniera di Dati)
Descrive le colonne classificate, che sono un tipo speciale di colonna che è possibile utilizzare per correlare una colonna della struttura di data mining a un'altra. Colonne di classificazione (Data mining)
Imparare ad aggiungere e modificare le colonne della struttura di mining. Attività e procedure della struttura di mining

Vedere anche

Strutture di estrazione dati (Analysis Services - Estrazione dati)
Colonne del modello di mining