Share via


Zelfstudie: Wizard voor scoren van het Machine learning-model voor toegewezen SQL-pools

Meer informatie over hoe u uw gegevens in toegewezen SQL-pools eenvoudig kunt verrijken met voorspellende Machine Learning-modellen. De modellen die uw gegevensanalisten maken, zijn nu eenvoudig toegankelijk voor gegevensprofessionals voor predictive analytics. Een gegevensprofessional in Azure Synapse Analytics kan eenvoudig een model selecteren in het Azure Machine Learning-modelregister voor implementatie in Azure Synapse SQL-pools en voorspellingen starten om de gegevens te verrijken.

In deze zelfstudie leert u het volgende:

  • Een voorspellend machine learning-model trainen en het model registreren in het Azure Machine Learning-modelregister.
  • Gebruik de sql-scorewizard om voorspellingen te starten in een toegewezen SQL-pool.

Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.

Vereisten

Aanmelden bij Azure Portal

Meld u aan bij de Azure-portal.

Een model trainen in Azure Machine Learning

Controleer voordat u begint of uw versie van sklearn 0.20.3 is.

Voordat u alle cellen in het notebook uitvoert, controleert u of het rekenproces wordt uitgevoerd.

Schermopname van verificatie van Azure Machine Learning Compute.

  1. Ga naar uw Azure Machine Learning-werkruimte.

  2. Download Voorspellen NYC Taxi Tips.ipynb.

  3. Open de Azure Machine Learning-werkruimte in Azure Machine Learning Studio.

  4. Ga naar NotitieblokkenBestanden uploaden>. Selecteer vervolgens het bestand Predict NYC Taxi Tips.ipynb dat u hebt gedownload en upload het. Schermopname van de knop voor het uploaden van een bestand.

  5. Nadat het notitieblok is geüpload en geopend, selecteert u Alle cellen uitvoeren.

    Een van de cellen kan mislukken en u wordt gevraagd om te verifiëren bij Azure. Let hierop in de celuitvoer en verifieer in uw browser door de koppeling te volgen en de code in te voeren. Voer het notebook vervolgens opnieuw uit.

  6. Het notebook traint een ONNX-model en registreert het bij MLflow. Ga naar Modellen om te controleren of het nieuwe model correct is geregistreerd. Schermopname van het model in het register.

  7. Als u het notebook uitvoert, worden de testgegevens geëxporteerd naar een CSV-bestand. Download het CSV-bestand naar uw lokale systeem. Later importeert u het CSV-bestand in een toegewezen SQL-pool en gebruikt u de gegevens om het model te testen.

    Het CSV-bestand wordt gemaakt in dezelfde map als het notebook-bestand. Selecteer Vernieuwen in Bestandenverkenner als u dit niet meteen ziet.

    Schermopname van het C S V-bestand.

Voorspellingen starten met de SQL-scorewizard

  1. Open de Azure Synapse-werkruimte met Synapse Studio.

  2. Ga naarGekoppelde>opslagaccounts voor gegevens>. Upload test_data.csv naar de standaard opslagaccount.

    Schermopname van selecties voor het uploaden van gegevens.

  3. Ga naar Ontwikkel>SQL-scripts. Maak een nieuw SQL-script om test_data.csv in uw toegewezen SQL-pool te laden.

    Notitie

    Werk de bestands-URL in dit script bij voordat u deze uitvoert.

    IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U')
    CREATE TABLE dbo.nyc_taxi
    (
        tipped int,
        fareAmount float,
        paymentType int,
        passengerCount int,
        tripDistance float,
        tripTimeSecs bigint,
        pickupTimeBin nvarchar(30)
    )
    WITH
    (
        DISTRIBUTION = ROUND_ROBIN,
        CLUSTERED COLUMNSTORE INDEX
    )
    GO
    
    COPY INTO dbo.nyc_taxi
    (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7)
    FROM '<URL to linked storage account>/test_data.csv'
    WITH
    (
        FILE_TYPE = 'CSV',
        ROWTERMINATOR='0x0A',
        FIELDQUOTE = '"',
        FIELDTERMINATOR = ',',
        FIRSTROW = 2
    )
    GO
    
    SELECT TOP 100 * FROM nyc_taxi
    GO
    

    Gegevens opladen naar een toegewezen SQL-pool

  4. Ga naar Gegevens>Werkruimte. Open de SQL wizard voor scoren door met de rechtermuisknop te klikken op de tabel van de toegewezen SQL-pool. Selecteer Machine Learning>Voorspellen met een model.

    Notitie

    De optie machine learning wordt alleen weergegeven als u een gekoppelde service hebt gemaakt voor Azure Machine Learning. (Zie Vereisten aan het begin van deze zelfstudie.)

    Schermopname van de optie machine learning.

  5. Selecteer een gekoppelde Azure Machine Learning-werkruimte in de vervolgkeuzelijst. Met deze stap wordt een lijst met machine learning-modellen geladen uit het modelregister van de gekozen Azure Machine Learning-werkruimte. Momenteel worden alleen ONNX-modellen ondersteund, dus in deze stap worden alleen ONNX-modellen weergegeven.

  6. Selecteer het model dat u zojuist hebt getraind en selecteer vervolgens Doorgaan.

    Schermopname van het selecteren van het Azure Machine Learning-model.

  7. Wijs de tabelkolommen toe aan de modelinvoer en geef de modeluitvoer op. Als het model is opgeslagen in de MLflow-indeling en de modelhandtekening is ingevuld, wordt de toewijzing automatisch voor u uitgevoerd met behulp van een logica op basis van de overeenkomsten van namen. De interface ondersteunt ook handmatige toewijzing.

    Selecteer Doorgaan.

    Schermopname van tabel-naar-modeltoewijzing.

  8. De gegenereerde T-SQL-code wordt verpakt in een opgeslagen procedure. Daarom moet u een opgeslagen procedurenaam opgeven. Het binaire model, inclusief metagegevens (versie, beschrijving en andere informatie), wordt fysiek gekopieerd van Azure Machine Learning naar een toegewezen SQL-pooltabel. U moet dus opgeven in welke tabel u het model wilt opslaan.

    U kunt Bestaande tabel of Nieuwe maken kiezen. Wanneer u klaar bent, selecteert u Model implementeren + script openen om het model te implementeren en een T-SQL-voorspellingsscript te genereren.

    Schermopname van selecties voor het maken van een opgeslagen procedure.

  9. Nadat het script is gegenereerd, selecteert u Uitvoeren om de score uit te voeren en voorspellingen op te halen.

    Schermopname van scoren en voorspellingen.

Volgende stappen