Leitfaden zu Machine Learning in SQL Server Big Data-Clustern
Gilt für: SQL Server 2019 (15.x)
In diesem Artikel wird erklärt, wie man Big Data-Cluster für SQL Server in Machine Learning-Szenarios verwendet.
Wichtig
Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.
Einführung in Machine Learning in SQL Server Big Data-Clustern
Big Data-Cluster für SQL Server ermöglicht Machine Learning-Szenarios und -Lösungen mithilfe verschiedener Technologiestapel: SQL Server Machine Learning Services und Apache Spark ML.
Big Data-Cluster für SQL Server bieten Machine Learning-Funktionen innerhalb der SQL Server-Engine mithilfe des etablierten Technologiestapels SQL Server Machine Learning Services an. Dadurch ermöglichen sie leistungsstarke, datenbankinterne Rückschluss- und Bewertungsszenarios für Machine Learning.
Für Big Data-basierte Machine Learning-Szenarios ist die Verwendung von HDFS für Big Data-Hosting und Apache Spark ML-Funktionen kostengünstiger, skalierbarer und leistungsfähiger.
Machine Learning-Szenarios
Die Machine Learning-Funktion ermöglichen verschiedene Anwendungen und Lösungen wie die Erkennung von Betrugsversuchen, Prognosen und allgemeine Klassifizierungs- und Regressionsaufgaben. Es ist jedoch wichtig, die beste Technologie für ein Szenario zu verwenden.
Aspekt | SQL Server Machine Learning Services | Apache Spark ML |
---|---|---|
Platzierung von Daten | Nutzt die Lokalität von Tabellendaten auf SQL Server. Premium-Datenschicht | Skalierbare Big Data-Datenschicht mit HDFS; entweder unstrukturierte, halbstrukturierte und strukturierte Daten |
Am besten geeignet für: | Rückschluss- und Bewertungsszenarios mit geringer Latenz | 1. Batchtraining und Bewertung von Machine Learning-Modellen auf der Grundlage von Big Data 2. ETL-Senken und weitreichende Datenaufbereitung und Featurisierung für ML |
Feeds | ML-gesteuerte BI-Dashboards, Berichte und Anwendungen. Geringe Latenz erforderlich | Im Batch bewertete Daten können auf SQL Server höhergestuft werden, um ML-gesteuerte Szenarios voranzutreiben. |
Latency | Geringe Latenz erforderlich | Höhere Latenz akzeptabel |
Weitere Informationen | Ausführen von Python- und R-Skripts mit Machine Learning Services auf SQL Server-Big Data-Clustern | Einführung in Spark Machine Learning auf SQL Server Big Data-Clustern |
Nächste Schritte
Weitere Informationen finden Sie hier: Einführung in Big Data-Cluster für SQL Server.