Verwenden von umfassenden KI-Beispielen in Microsoft Fabric

Die Software-as-a-Service (SaaS)-Erfahrung von Synapse Data Science in Microsoft Fabric kann Fachleuten für maschinelles Lernen helfen, ihre Machine-Learning-Modelle in einer einzigen Analyseplattform zu erstellen, bereitzustellen und zu operationalisieren, während sie mit anderen wichtigen Rollen zusammenarbeiten. Dieser Artikel beschreibt sowohl die Möglichkeiten von Synapse Data Science als auch, wie Machine Learning-Modelle gängige Geschäftsprobleme lösen können.

Installieren von Python-Bibliotheken

Einige der End-to-End-KI-Beispiele erfordern andere Bibliotheken für die Entwicklung von Machine-Learning-Modellen oder die Ad-hoc-Datenanalyse. Sie können eine dieser Optionen wählen, um diese Bibliotheken schnell für Ihre Apache Spark-Sitzung zu installieren.

Installieren mit Inlineinstallationsfunktionen

Verwenden Sie die Inline-Installationsfunktionen von Python – z. B. %pip oder %conda – in Ihrem Notebook, um neue Bibliotheken zu installieren. Mit dieser Option werden die Bibliotheken nur im aktuellen Notebook und nicht im Arbeitsbereich installiert. Verwenden Sie diesen Code, um eine Bibliothek zu installieren. Ersetzen Sie <library name> durch den Namen Ihrer Bibliothek: imblearn oder wordcloud.

# Use pip to install libraries
%pip install <library name>

# Use conda to install libraries
%conda install <library name>

Durch Administrator*innen festgelegte Standardbibliotheken für den Arbeitsbereich

Um Ihre Bibliotheken für die Verwendung in allen Notebooks im Arbeitsbereich zur Verfügung zu stellen, können Sie hierfür eine Fabric-Umgebung verwenden. Sie können eine Umgebung erstellen, die Bibliothek darin installieren, und dann kann Ihr Arbeitsbereichsadministrator die Umgebung als Standardumgebung an den Arbeitsbereich anfügen. Weitere Informationen zum Festlegen einer Umgebung als Arbeitsbereichstandard finden Sie unter Durch Administrator*innen festgelegte Standardbibliotheken für den Arbeitsbereich.

Wichtig

Die Bibliotheksverwaltung in der Arbeitsbereichseinstellung wird nicht mehr unterstützt. Sie können wie unter Migrieren der Arbeitsbereichsbibliotheken und Spark-Eigenschaften zu einer Standardumgebung beschrieben vorgehen, um vorhandene Arbeitsbereichsbibliotheken in eine Umgebung zu migrieren und diese als Arbeitsbereichsstandard anzufügen.

Erstellen von Machine Learning-Modellen anhand von Tutorials

Diese Lernprogramme bieten End-to-End-Beispiele für allgemeine Szenarien.

Kundenabwanderung

Erstellen Sie ein Modell zur Vorhersage der Churn-Rate für Bankkunden. Die Churn-Rate, auch Fluktuationsrate genannt, ist die Rate, mit der Kunden ihre Geschäftsbeziehung zur Bank beenden.

Folgen Sie dem Tutorial zum Vorhersagen der Kundenabwanderung.

Empfehlungen

Eine Online-Buchhandlung möchte maßgeschneiderte Empfehlungen geben, um den Umsatz zu steigern. Mithilfe von Buchbewertungsdaten von Kunden können Sie ein Empfehlungsmodell entwickeln und bereitstellen, um Vorhersagen zu machen.

Folgen Sie dem Tutorial Trainieren eines Empfehlungsmodells für den Einzelhandel.

Betrugserkennung

Da nicht autorisierte Transaktionen zunehmen, unterstützt die Erkennung von Kreditkartenbetrug in Echtzeit Finanzinstitute dabei, ihren Kunden eine schnellere Bearbeitungszeit zur Lösung des Problems zu bieten. Ein Modell für die Betrugserkennung umfasst Vorverarbeitung, Training, Modellspeicherung und Ableitung. Im Trainingsteil werden mehrere Modelle und Methoden vorgestellt, die Herausforderungen wie unausgewogene Beispiele und Kompromisse zwischen falsch-positiven und falsch-negativen Ergebnissen angehen.

Befolgen Sie dazu die Schritte im Tutorial zur Betrugserkennung.

Vorhersagen

Erstellen Sie auf der Grundlage historischer Daten zu Immobilienverkäufen in New York City und Facebook Prophet ein Zeitreihenmodell mit Trend- und Saisoninformationen, um die Verkäufe in künftigen Zyklen zu prognostizieren.

Befolgen Sie dazu die Schritte im Tutorial zu Zeitreihenprognose.

Textklassifizierung

Wenden Sie die Textklassifizierung mit word2vec und einem linearen Regressionsmodell in Spark an, um vorherzusagen, ob ein Buch in der basierend auf Buchmetadaten zu Belletristik oder zu Sachbüchern gehört.

Befolgen Sie dazu die Schritte im Tutorial zur Textklassifizierung.

Uplift-Modell

Schätzung der kausalen Auswirkungen bestimmter medizinischer Behandlungen auf das Verhalten einer Person mit einem Uplift-Modell. In diesen Modulen werden vier Kernbereiche behandelt:

  • Datenverarbeitungsmodul: Dieses extrahiert Features, Behandlungen und Bezeichnungen.
  • Schulungsmodul: Prognostizieren Sie den Unterschied im Verhalten einer Person, wenn sie behandelt und nicht behandelt wird, mit einem klassischen Machine Learning-Modell, z. B. LightGBM.
  • Vorhersagemodul: Dieses ruft das Uplift-Modell für Vorhersagen auf Testdaten auf.
  • Evaluierungsmodul: Dieses wertet die Auswirkung des Uplift-Modells auf Testdaten aus.

Befolgen Sie dazu die Schritte im Tutorial zu kausalen Auswirkungen von medizinischen Behandlungen.

Predictive Maintenance

Trainieren Sie mehrere Modelle auf historischen Daten, um mechanische Fehler wie Temperatur und Drehgeschwindigkeit vorherzusagen. Ermitteln Sie dann, welches Modell am besten geeignet ist, um zukünftige Fehler vorherzusagen.

Folgen Sie dem Tutorial Predictive Maintenance.

Umsatzvorhersage

Prognostizieren Sie künftige Umsätze für Produktkategorien in Supermärkten. Trainieren Sie ein Modell für historische Daten, um dies zu tun.

Befolgen Sie dazu die Schritte im Tutorial zur Umsatzprognose.