Freigeben über


Lernprogramm: Assistent zum Bewerten von Maschinellen Lernmodellen für dedizierte SQL-Pools

Erfahren Sie, wie Sie Ihre Daten ganz einfach in dedizierten SQL-Pools mit prädiktiven Machine Learning-Modellen anreichern können. Die Modelle, die Ihre Data Scientists erstellen, sind jetzt für Datenexperten leicht zugänglich, um Predictive Analytics durchzuführen. Ein Datenprofi in Azure Synapse Analytics kann einfach ein Modell aus der Azure Machine Learning-Modellregistrierung für die Bereitstellung in Azure Synapse SQL-Pools auswählen und Vorhersagen starten, um die Daten zu bereichern.

In diesem Tutorial lernen Sie, wie Sie:

  • Trainieren eines Predictive Machine Learning-Modells und Registrieren des Modells in der Azure Machine Learning-Modellregistrierung
  • Verwenden des Assistenten für die SQL-Bewertung zum Starten von Vorhersagen in einem dedizierten SQL-Pool

Wenn Sie nicht über ein Azure-Abonnement verfügen, erstellen Sie ein kostenloses Konto, bevor Sie beginnen.

Voraussetzungen

Melden Sie sich auf dem Azure-Portal an.

Melden Sie sich beim Azure-Portal an.

Trainieren eines Modells in Azure Machine Learning

Bevor Sie beginnen, vergewissern Sie sich, dass Ihre Version von Sklearn 0.20.3 ist.

Bevor Sie alle Zellen im Notizbuch ausführen, überprüfen Sie, ob die Compute-Instanz ausgeführt wird.

Screenshot der Überprüfung der Azure Machine Learning-Berechnung.

  1. Wechseln Sie zu Ihrem Azure Machine Learning-Arbeitsbereich.

  2. Download Predict NYC Taxi Tips.ipynb.

  3. Öffnen Sie den Azure Machine Learning-Arbeitsbereich in Azure Machine Learning Studio.

  4. Wechseln Sie zu Notizbücher>Dateien hochladen. Wählen Sie dann die Datei "Predict NYC Taxi Tips.ipynb " aus, die Sie heruntergeladen und hochgeladen haben. Screenshot der Schaltfläche zum Hochladen einer Datei.

  5. Nachdem das Notizbuch hochgeladen und geöffnet wurde, wählen Sie "Alle Zellen ausführen" aus.

    Eine der Zellen schlägt möglicherweise fehl und fordert Sie auf, sich bei Azure zu authentifizieren. Halten Sie in den Zellenausgaben danach Ausschau, und authentifizieren Sie sich in Ihrem Browser, indem Sie dem Link folgen und den Code eingeben. Führen Sie dann das Notizbuch erneut aus.

  6. Das Notizbuch trainiert ein ONNX-Modell und registriert es bei MLflow. Wechseln Sie zu "Modelle ", um zu überprüfen, ob das neue Modell ordnungsgemäß registriert ist. Screenshot des Modells im Register.

  7. Wenn Sie das Notizbuch ausführen, werden die Testdaten auch in eine CSV-Datei exportiert. Laden Sie die CSV-Datei in Ihr lokales System herunter. Später importieren Sie die CSV-Datei in einen dedizierten SQL-Pool und verwenden die Daten zum Testen des Modells.

    Die CSV-Datei wird im selben Ordner wie Ihre Notizbuchdatei erstellt. Wählen Sie " Aktualisieren" im Datei-Explorer aus, wenn sie nicht sofort angezeigt wird.

    Screenshot der C S V-Datei.

Starten von Prognosen mit dem SQL-Bewertungs-Assistenten

  1. Öffnen Sie den Azure Synapse-Arbeitsbereich mit Synapse Studio.

  2. Wechseln Sie zu Daten>Verknüpfte>Speicherkonten. Laden Sie test_data.csv in das Standardspeicherkonto hoch.

    Screenshot, der die Auswahl für das Hochladen von Daten zeigt.

  3. Wechseln Sie zum Entwickeln von>SQL-Skripts. Erstellen Sie ein neues SQL-Skript zum Laden von test_data.csv in Ihren dedizierten SQL-Pool.

    Hinweis

    Aktualisieren Sie die Datei-URL in diesem Skript, bevor Sie sie ausführen.

    IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U')
    CREATE TABLE dbo.nyc_taxi
    (
        tipped int,
        fareAmount float,
        paymentType int,
        passengerCount int,
        tripDistance float,
        tripTimeSecs bigint,
        pickupTimeBin nvarchar(30)
    )
    WITH
    (
        DISTRIBUTION = ROUND_ROBIN,
        CLUSTERED COLUMNSTORE INDEX
    )
    GO
    
    COPY INTO dbo.nyc_taxi
    (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7)
    FROM '<URL to linked storage account>/test_data.csv'
    WITH
    (
        FILE_TYPE = 'CSV',
        ROWTERMINATOR='0x0A',
        FIELDQUOTE = '"',
        FIELDTERMINATOR = ',',
        FIRSTROW = 2
    )
    GO
    
    SELECT TOP 100 * FROM nyc_taxi
    GO
    

    Laden von Daten in dedizierten SQL-Pool

  4. Wechseln Sie zumDatenarbeitsbereich>. Öffnen Sie den SQL-Bewertungs-Assistenten, indem Sie mit der rechten Maustaste auf die dedizierte SQL-Pool-Tabelle klicken. Wählen Sie Machine Learning>-Vorhersagen mit einem Modell aus.

    Hinweis

    Die Option für maschinelles Lernen wird nicht angezeigt, es sei denn, Sie haben einen verknüpften Dienst, der für Azure Machine Learning erstellt wurde. (Siehe Voraussetzungen am Anfang dieses Lernprogramms.)

    Screenshot der Machine Learning-Option.

  5. Wählen Sie im Dropdownfeld einen verknüpften Azure Machine Learning-Arbeitsbereich aus. In diesem Schritt wird eine Liste der Machine Learning-Modelle aus der Modellregistrierung des ausgewählten Azure Machine Learning-Arbeitsbereichs geladen. Derzeit werden nur ONNX-Modelle unterstützt, sodass in diesem Schritt nur ONNX-Modelle angezeigt werden.

  6. Wählen Sie das Modell aus, das Sie gerade trainiert haben, und wählen Sie dann "Weiter" aus.

    Screenshot, der die Auswahl des Azure Machine Learning-Modells zeigt.

  7. Ordnen Sie die Tabellenspalten den Modelleingaben zu, und geben Sie die Modellausgabe an. Wenn das Modell im MLflow-Format gespeichert wird und die Modellsignatur aufgefüllt wird, erfolgt die Zuordnung automatisch für Sie mithilfe einer Logik basierend auf der Ähnlichkeit von Namen. Die Schnittstelle unterstützt auch die manuelle Zuordnung.

    Wählen Sie "Weiter" aus.

    Screenshot der Tabellen-zu-Modell-Zuordnung.

  8. Der generierte T-SQL-Code wird in eine gespeicherte Prozedur eingeschlossen. Aus diesem Grund müssen Sie einen Namen der gespeicherten Prozedur angeben. Die Modell-Binärdatei, einschließlich Metadaten (Version, Beschreibung und andere Informationen), wird physisch aus Azure Machine Learning in eine dedizierte SQL-Pooltabelle kopiert. Sie müssen also angeben, in welcher Tabelle das Modell gespeichert werden soll.

    Sie können entweder "Vorhandene Tabelle" oder " Neu erstellen" auswählen. Wenn Sie fertig sind, wählen Sie "Modell bereitstellen+ Öffnen" aus, um das Modell bereitzustellen und ein T-SQL-Vorhersageskript zu generieren.

    Ein Screenshot mit den Auswahlen zum Erstellen eines gespeicherten Verfahrens.

  9. Nachdem das Skript generiert wurde, wählen Sie "Ausführen" aus, um die Bewertung auszuführen und Vorhersagen zu erhalten.

    Screenshot, der Bewertungen und Vorhersagen zeigt.

Nächste Schritte