Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
L'algoritmo Microsoft Linear Regression è una variante dell'algoritmo Microsoft Decision Trees che consente di calcolare una relazione lineare tra una variabile dipendente e indipendente e quindi di usare tale relazione per la stima.
La relazione assume la forma di un'equazione per una linea che rappresenta meglio una serie di dati. Ad esempio, la riga nel diagramma seguente è la migliore rappresentazione lineare possibile dei dati.
Ogni punto dati nel diagramma presenta un errore associato alla distanza dalla linea di regressione. I coefficienti a e b nell'equazione di regressione regolano l'angolo e la posizione della retta di regressione. È possibile ottenere l'equazione di regressione regolando un e b fino a quando la somma degli errori associati a tutti i punti raggiunge il valore minimo.
Esistono altri tipi di regressione che usano più variabili e anche metodi non lineari di regressione. Tuttavia, la regressione lineare è un metodo utile e noto per la modellazione di una risposta a una modifica in un fattore sottostante.
Esempio
È possibile usare la regressione lineare per determinare una relazione tra due colonne continue. Ad esempio, è possibile usare la regressione lineare per calcolare una linea di tendenza dai dati di produzione o vendite. È anche possibile usare la regressione lineare come precursore dello sviluppo di modelli di data mining più complessi per valutare le relazioni tra le colonne di dati.
Anche se esistono molti modi per calcolare la regressione lineare che non richiedono strumenti di data mining, il vantaggio dell'uso dell'algoritmo Microsoft Linear Regression per questa attività è che tutte le possibili relazioni tra le variabili vengono calcolate e testate automaticamente. Non è necessario selezionare un metodo di calcolo, ad esempio risolvere i quadrati minimi. Tuttavia, la regressione lineare potrebbe sovrasmplificare le relazioni negli scenari in cui più fattori influiscono sul risultato.
Funzionamento dell'algoritmo
L'algoritmo Microsoft Linear Regression è una variante dell'algoritmo Microsoft Decision Trees. Quando si seleziona l'algoritmo Microsoft Linear Regression, viene richiamato un caso speciale dell'algoritmo Microsoft Decision Trees, con parametri che vincolano il comportamento dell'algoritmo e richiedono determinati tipi di dati di input. Inoltre, in un modello di regressione lineare, l'intero set di dati viene usato per il calcolo delle relazioni nel passaggio iniziale, mentre un modello di alberi delle decisioni standard suddivide i dati ripetutamente in subset o alberi più piccoli.
Dati necessari per i modelli di regressione lineare
Quando si preparano i dati per l'uso in un modello di regressione lineare, è necessario comprendere i requisiti per l'algoritmo specifico. Ciò include la quantità di dati necessari e il modo in cui vengono usati i dati. I requisiti per questo tipo di modello sono i seguenti:
Una singola colonna chiave Ogni modello deve contenere una colonna numerica o di testo che identifica in modo univoco ogni record. Le chiavi composte non sono ammissibili.
Colonna stimabile Richiede almeno una colonna stimabile. È possibile includere più attributi stimabili in un modello, ma gli attributi stimabili devono essere tipi di dati numerici continui. Non è possibile usare un tipo di dati datetime come attributo stimabile anche se l'archiviazione nativa per i dati è numerica.
Colonne di input Le colonne di input devono contenere dati numerici continui e devono essere assegnate al tipo di dati appropriato.
Per altre informazioni, vedere la sezione Requisiti di Microsoft Linear Regression Algorithm Technical Reference (Informazioni tecniche sull'algoritmo di regressione lineare Microsoft).
Visualizzazione di un modello di regressione lineare
Per esplorare il modello, usare Microsoft Tree Viewer. La struttura ad albero per un modello di regressione lineare è molto semplice, con tutte le informazioni sull'equazione di regressione contenuta in un singolo nodo. Per altre informazioni, vedere Browse a Model Using the Microsoft Tree Viewer.
Per altre informazioni dettagliate sull'equazione, è anche possibile visualizzare i coefficienti e altri dettagli usando Microsoft Generic Content Tree Viewer.
Per un modello di regressione lineare, il contenuto del modello include metadati, formula di regressione e statistiche sulla distribuzione dei valori di input. Per ulteriori informazioni, consultare Contenuto del modello di data mining per i modelli di regressione lineare (Analysis Services - Data Mining).
Creazione di stime
Dopo l'elaborazione del modello, i risultati vengono archiviati come set di statistiche insieme alla formula di regressione lineare, che è possibile usare per calcolare le tendenze future. Per esempi di query da usare con un modello di regressione lineare, vedere Esempi di query del modello di regressione lineare.
Per informazioni generali su come creare query sui modelli di data mining, vedere Query di data mining.
Oltre a creare un modello di regressione lineare selezionando l'algoritmo Microsoft Linear Regression, se l'attributo stimabile è un tipo di dati numerico continuo, è possibile creare un modello di albero delle decisioni che contiene regressioni. In questo caso, l'algoritmo suddividerà i dati quando trova i punti di separazione appropriati, ma per alcune aree di dati creerà invece una formula di regressione. Per ulteriori informazioni sugli alberi di regressione all'interno di un modello di albero delle decisioni, consultare Contenuto del modello di Mining per i modelli di albero delle decisioni (Analysis Services - Data Mining).
Osservazioni:
Non supporta l'uso di Predictive Model Markup Language (PMML) per creare modelli di data mining.
Non supporta la creazione di dimensioni per l'analisi dei dati.
Supporta il drill-through.
Supporta l'uso di modelli di data mining OLAP.
Vedere anche
Algoritmi di data mining (Analysis Services - Data Mining)Riferimento Tecnico dell'Algoritmo di Regressione Lineare di MicrosoftEsempi di query sui modelli di regressione lineareContenuto del Modello di Data Mining per Modelli di Regressione Lineare (Analysis Services - Data Mining)