Teilen über


Leitfaden zu Machine Learning in SQL Server Big Data-Clustern

Gilt für: SQL Server 2019 (15.x)

In diesem Artikel wird erklärt, wie man Big Data-Cluster für SQL Server in Machine Learning-Szenarios verwendet.

Wichtig

Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.

Einführung in Machine Learning in SQL Server Big Data-Clustern

Big Data-Cluster für SQL Server ermöglicht Machine Learning-Szenarios und -Lösungen mithilfe verschiedener Technologiestapel: SQL Server Machine Learning Services und Apache Spark ML.

Big Data-Cluster für SQL Server bieten Machine Learning-Funktionen innerhalb der SQL Server-Engine mithilfe des etablierten Technologiestapels SQL Server Machine Learning Services an. Dadurch ermöglichen sie leistungsstarke, datenbankinterne Rückschluss- und Bewertungsszenarios für Machine Learning.

Für Big Data-basierte Machine Learning-Szenarios ist die Verwendung von HDFS für Big Data-Hosting und Apache Spark ML-Funktionen kostengünstiger, skalierbarer und leistungsfähiger.

Machine Learning-Szenarios

Die Machine Learning-Funktion ermöglichen verschiedene Anwendungen und Lösungen wie die Erkennung von Betrugsversuchen, Prognosen und allgemeine Klassifizierungs- und Regressionsaufgaben. Es ist jedoch wichtig, die beste Technologie für ein Szenario zu verwenden.

Aspekt SQL Server Machine Learning Services Apache Spark ML
Platzierung von Daten Nutzt die Lokalität von Tabellendaten auf SQL Server. Premium-Datenschicht Skalierbare Big Data-Datenschicht mit HDFS; entweder unstrukturierte, halbstrukturierte und strukturierte Daten
Am besten geeignet für: Rückschluss- und Bewertungsszenarios mit geringer Latenz 1. Batchtraining und Bewertung von Machine Learning-Modellen auf der Grundlage von Big Data
2. ETL-Senken und weitreichende Datenaufbereitung und Featurisierung für ML
Feeds ML-gesteuerte BI-Dashboards, Berichte und Anwendungen. Geringe Latenz erforderlich Im Batch bewertete Daten können auf SQL Server höhergestuft werden, um ML-gesteuerte Szenarios voranzutreiben.
Latency Geringe Latenz erforderlich Höhere Latenz akzeptabel
Weitere Informationen Ausführen von Python- und R-Skripts mit Machine Learning Services auf SQL Server-Big Data-Clustern Einführung in Spark Machine Learning auf SQL Server Big Data-Clustern

Nächste Schritte

Weitere Informationen finden Sie hier: Einführung in Big Data-Cluster für SQL Server.