Condividi tramite


Esercitazione Python: Stimare il noleggio di sci con la regressione lineare con Machine Learning in SQL

Si applica a: SQL Server 2017 (14.x) e versioni successive Istanza gestita di SQL di Azure

In questa serie di esercitazioni in quattro parti si useranno Python e la regressione lineare in Machine Learning Services per SQL Server oppure in cluster Big Data di SQL Server 2019 per stimare il numero di noleggi di sci. Questa esercitazione usa un notebook Python in Azure Data Studio.

In questa serie di esercitazioni in quattro parti si useranno Python e la regressione lineare in Machine Learning Services per SQL Server per stimare il numero di noleggi di sci. Questa esercitazione usa un notebook Python in Azure Data Studio.

In questa serie di esercitazioni in quattro parti si useranno Python e la regressione lineare in Machine Learning Services per Istanza gestita di SQL di Azure per stimare il numero di noleggi di sci. Questa esercitazione usa un notebook Python in Azure Data Studio.

Si supponga di essere i proprietari di un'agenzia di noleggio di sci e di voler stimare il numero di noleggi richiesti in una data futura. Queste informazioni consentiranno di preparare correttamente le scorte, il personale e le strutture.

Nella prima parte di questa serie verranno configurati i prerequisiti. Nelle seconda e nella terza parte si svilupperanno alcuni script Python in un notebook per preparare i dati ed eseguire il training di un modello di Machine Learning. Nella terza parte verranno quindi eseguiti gli script Python nel database mediante stored procedure T-SQL.

In questo articolo si apprenderà come:

  • Importare un database di esempio

Nella seconda parte si apprenderà come caricare i dati da un database in un frame di dati Python e come preparare i dati in Python.

Nella terza parte si apprenderà come eseguire il training di un modello di regressione lineare in Python.

Nelle quarta parte si apprenderà come archiviare il modello in un database e quindi creare le stored procedure dagli script Python sviluppati nella seconda e nella terza parte. Le stored procedure verranno quindi eseguite sul server per eseguire stime basate sui nuovi dati.

Prerequisiti

  • IDE Python: questa esercitazione usa un notebook Python in Azure Data Studio. Per altre informazioni, vedere Come usare i notebook in Azure Data Studio.

  • Strumento di query SQL: questa esercitazione presuppone che si usi Azure Data Studio.

  • Pacchetti Python aggiuntivi: gli esempi in questa serie di esercitazioni usano i seguenti pacchetti Python, che potrebbero essere installati o meno per impostazione predefinita:

    • pandas
    • pyodbc
    • scikit-learn

    Per installare questi pacchetti:

    1. Nel notebook di Azure Data Studio selezionare Gestisci pacchetti.
    2. Nel riquadro Gestisci pacchetti selezionare la scheda Aggiungi nuovo.
    3. Per ognuno dei seguenti pacchetti immettere il nome del pacchetto, selezionare Cerca, quindi selezionare Installa.

    In alternativa è possibile aprire un prompt dei comandi, passare al percorso di installazione della versione di Python usata in Azure Data Studio (ad esempio cd %LocalAppData%\Programs\Python\Python37-32), quindi eseguire pip install per ogni pacchetto.

Ripristinare il database di esempio

Il database di esempio usato in questa esercitazione è stato salvato in un file di backup del database .bak che è possibile scaricare e usare.

Nota

Se si usa Machine Learning Services in cluster Big Data di SQL Server 2019, vedere l'articolo su come ripristinare un database nell'istanza master di un cluster Big Data.

  1. Scaricare il file TutorialDB.bak.

  2. Seguire le istruzioni in Ripristinare un database da un file di backup in Azure Data Studio usando i dettagli seguenti:

    • Importare i dati dal file TutorialDB.bak scaricato.
    • Assegnare al database di destinazione il nome TutorialDB.
  3. È possibile verificare che il database ripristinato esista eseguendo una query sulla tabella dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Scaricare il file TutorialDB.bak.

  2. Seguire le istruzioni in Ripristinare un database in un'istanza gestita in SQL Server Management Studio, usando i dati seguenti:

    • Importare i dati dal file TutorialDB.bak scaricato.
    • Assegnare al database di destinazione il nome TutorialDB.
  3. È possibile verificare che il database ripristinato esista eseguendo una query sulla tabella dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Pulire le risorse

Se non si intende continuare con questa esercitazione, eliminare il database TutorialDB.

Passaggio successivo

Nella prima parte di questa serie di esercitazioni sono stati completati i passaggi seguenti:

  • Sono stati installati i prerequisiti
  • Importare un database di esempio

Per preparare i dati dal database TutorialDB, seguire la seconda parte di questa serie di esercitazioni: