Tipi di contenuto (data mining)

Si applica a: SQL Server 2019 e versioni precedenti di Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

Il data mining è stato deprecato in SQL Server 2017 Analysis Services e ora è stato sospeso in SQL Server 2022 Analysis Services. La documentazione non viene aggiornata per le funzionalità deprecate e non più disponibili. Per altre informazioni, vedere Compatibilità con le versioni precedenti di Analysis Services.

In Microsoft SQL Server SQL Server Analysis Services è possibile definire il tipo di dati fisici per una colonna in una struttura di data mining e un tipo di contenuto logico per la colonna quando viene usato in un modello,

Il tipo di dati determina il modo in cui gli algoritmi elaborano i dati in tali colonne quando si creano modelli di data mining. La definizione del tipo di dati di una colonna fornisce all'algoritmo informazioni sul tipo di dati nelle colonne e su come elaborare i dati. Ogni tipo di dati in SQL Server Analysis Services supporta uno o più tipi di contenuto per il data mining.

Il tipo di contenuto descrive il comportamento del contenuto contenuto nella colonna. Ad esempio, se il contenuto di una colonna si ripete in un intervallo specifico, ad esempio giorni della settimana, è possibile specificare il tipo di contenuto di tale colonna come ciclico.

Alcuni algoritmi richiedono tipi di dati specifici e tipi di contenuto specifici per poter funzionare correttamente. Ad esempio, l'algoritmo Microsoft Naive Bayes non può usare colonne continue come input e non può prevedere valori continui. Alcuni tipi di contenuto, ad esempio Sequenza chiave, vengono usati solo da un algoritmo specifico. Per un elenco degli algoritmi e dei tipi di contenuto supportati da ognuno, vedere Algoritmi di data mining (Analysis Services - Data mining) .

Nell'elenco seguente vengono descritti i tipi di contenuto utilizzati nel data mining e vengono identificati i tipi di dati che supportano ogni tipo.

Discreto

Discrete significa che la colonna contiene un numero finito di valori senza continuum tra i valori. Ad esempio, una colonna gender è una tipica colonna di attributi discreti, in cui i dati rappresentano un numero specifico di categorie.

I valori in una colonna di attributi discreti non possono implicare l'ordinamento, anche se i valori sono numerici. Inoltre, anche se i valori utilizzati per la colonna discreta sono numerici, non è possibile calcolare i valori frazionari. I codici di area telefonica sono un buon esempio di dati discreti numerici.

Il tipo di contenuto Discreto è supportato da tutti i tipi di dati di data mining.

Continuo

Continuous significa che la colonna contiene valori che rappresentano dati numerici su una scala che consente valori provvisori. A differenza di una colonna discreta, che rappresenta dati finiti e conteggiabili, una colonna continua rappresenta misurazioni scalabili ed è possibile che i dati contengano un numero infinito di valori frazionari. Una colonna di temperature è un esempio di colonna di attributi continui.

Quando una colonna contiene dati numerici continui e si sa come devono essere distribuiti i dati, è possibile migliorare potenzialmente l'accuratezza dell'analisi specificando la distribuzione prevista dei valori. Specifica la distribuzione delle colonne a livello della struttura di data mining. Pertanto, l'impostazione si applica a tutti i modelli basati sulla struttura. Per altre informazioni, vedere Distribuzioni di colonne (data mining).

Il tipo di contenuto Continuous è supportato dai tipi di dati seguenti: Date, Double e Long.

Discretizzati

La discretizzazione è il processo di inserimento di valori di un set continuo di dati in bucket in modo che esista un numero limitato di valori possibili. È possibile discretizzare solo i dati numerici.

Di conseguenza, il tipo di contenuto discretizzato indica che la colonna contiene valori che rappresentano gruppi, o bucket, di valori derivati da una colonna continua. I bucket vengono considerati come valori ordinati e discreti.

È possibile discretizzare i dati manualmente, per assicurarsi di ottenere i bucket desiderati oppure usare i metodi di discretizzazione forniti in SQL Server Analysis Services. Alcuni algoritmi eseguono automaticamente la discretizzazione. Per altre informazioni, vedere Modificare la discretizzazione di una colonna in un modello di data mining.

Il tipo di contenuto Discretized è supportato dai tipi di dati seguenti: Date, Double, Long e Text.

Key

Il tipo di contenuto della chiave indica che la colonna identifica in modo univoco una riga. In una tabella dei casi, in genere la colonna chiave è un identificatore numerico o di testo. Il tipo di contenuto viene impostato sulla chiave per indicare che la colonna non deve essere usata per l'analisi, solo per i record di rilevamento.

Le tabelle nidificate hanno anche delle chiavi, ma l'utilizzo della chiave di una tabella nidificata si differenzia leggermente. Impostate il tipo di contenuto su chiave in una tabella nidificata se la colonna è l'attributo che desiderate analizzare. I valori nella chiave della tabella nidificata devono essere univoci per ogni caso, ma potrebbero esserci duplicati nell'intero insieme di casi.

Ad esempio, se si analizzano i prodotti acquistati dai clienti, impostare il tipo di contenuto sulla chiave per la colonna CustomerID nella tabella dei casi e impostare nuovamente il tipo di contenuto sulla chiave per la colonna PurchasedProducts nella tabella nidificata.

Annotazioni

Le tabelle nidificate sono disponibili solo se si usano dati di un'origine dati esterna definita come vista origine dati di Analysis Services.

Questo tipo di contenuto è supportato dai tipi di dati seguenti: Date, Double, Long e Text.

Sequenza di tasti

Il tipo di contenuto della sequenza di chiavi può essere usato solo nei modelli sequence clustering. Quando si imposta il tipo di contenuto sulla sequenza di chiavi, indica che la colonna contiene valori che rappresentano una sequenza di eventi. I valori sono ordinati, ma non devono essere separati da una distanza uguale.

Questo tipo di contenuto è supportato dai tipi di dati seguenti: Double, Long, Text e Date.

Tempo chiave

Il tipo di contenuto ora chiave può essere usato solo nei modelli time series. Quando si imposta il tipo di contenuto sul tempo chiave, indica che i valori vengono ordinati e rappresentano una scala temporale.

Questo tipo di contenuto è supportato dai tipi di dati seguenti: Double, Long e Date.

Tabella

Il tipo di contenuto tabella indica che la colonna contiene un'altra tabella dati, con una o più colonne e una o più righe. Per qualsiasi riga specifica nella tabella del caso, questa colonna può contenere più valori, tutti correlati al record del caso padre. Ad esempio, se la tabella principale contiene un elenco di clienti, può avere diverse colonne con tabelle nidificate, come una colonna ProductsPurchased, dove vengono elencati i prodotti acquistati dal cliente in passato, e una colonna Hobbies che elenca gli interessi del cliente.

Il tipo di dati di questa colonna è sempre Table.

Ciclico

Il tipo di contenuto ciclico indica che la colonna contiene valori che rappresentano un set ordinato ciclico. Ad esempio, i giorni numerati della settimana sono un insieme ordinato ciclico, perché il giorno numero uno segue il giorno numero sette.

Le colonne cicliche sono considerate sia ordinate che discrete in termini di tipo di contenuto.

Questo tipo di contenuto è supportato da tutti i tipi di dati di data mining in SQL Server Analysis Services. Tuttavia, la maggior parte degli algoritmi considera i valori ciclici come valori discreti e non esegue un'elaborazione speciale.

Ordinato

Il tipo di contenuto Ordinato indica anche che la colonna contiene valori che definiscono una sequenza o un ordine. Tuttavia, in questo tipo di contenuto i valori utilizzati per l'ordinamento non implicano alcuna relazione di distanza o grandezza tra i valori nel set. Ad esempio, se una colonna di attributi ordinati contiene informazioni sui livelli di competenza in ordine di rango da uno a cinque, non sono presenti informazioni implicite nella distanza tra i livelli di competenza; un livello di competenza di cinque non è necessariamente cinque volte migliore di un livello di competenza di uno.

Le colonne degli attributi ordinati sono considerate discrete in termini di tipo di contenuto.

Questo tipo di contenuto è supportato da tutti i tipi di dati di data mining in SQL Server Analysis Services. Tuttavia, la maggior parte degli algoritmi considera valori ordinati come valori discreti e non esegue un'elaborazione speciale.

Classificato

Oltre ai tipi di contenuto precedenti in uso comune con tutti i modelli, per alcuni tipi di dati è possibile usare colonne classificate per definire i tipi di contenuto. Per altre informazioni sulle colonne classificate, vedere Colonne classificate (data mining).

Vedere anche

Tipi di contenuto (DMX)
Tipi di dati (data mining)
Tipi di dati (DMX)
Modificare le proprietà di una struttura di mining
Colonne della struttura di data mining

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-02-03