Anmerkung
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen, dich anzumelden oder die Verzeichnisse zu wechseln.
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen , die Verzeichnisse zu wechseln.
Von Bedeutung
Dieses Feature befindet sich in der Public Preview.
Auf dieser Seite wird der Data Science Agent vorgestellt, ein KI-Daten-Agent, der durch Auswählen des Agentmodus im Databricks-Assistenten verfügbar ist. Speziell für Databricks-Notizbücher und den SQL-Editor entwickelt, werden Daten untersucht, Code generiert und ausgeführt und Fehler behoben – alles aus einer einzigen Eingabeaufforderung.
Was ist der Data Science Agent?
Der Data Science Agent ist eine leistungsstarke Funktion im Agentenmodus des Databricks-Assistenten, der den Assistenten in einen intelligenten Begleiter transformiert, der ganze mehrstufige Data Science-Workflows in Datenbricks-Notizbüchern und dem SQL-Editor automatisieren kann.
Im Vergleich zum Assistentenchatmodus verfügt der Agent-Modus über erweiterte Funktionen: Planen einer Lösung, Abrufen relevanter Ressourcen, Ausführen von Code, Verwenden von Zellausgaben, um Ergebnisse zu verbessern, Fehler automatisch zu beheben und vieles mehr.
Der Data Science Agent kann Code für die Ausführung in Notizbüchern oder Abfragen planen und generieren, die im SQL-Editor ausgeführt werden sollen. Der Agent arbeitet mit Ihnen zusammen, um seine Pläne zu genehmigen und die nächsten Schritte zu bestätigen, bevor Sie fortfahren. Mit Ihrer Genehmigung kann der Data Science Agent Tools verwenden, um Aufgaben wie das Durchsuchen von Tabellen, das Bearbeiten eines Notizbuchs, das Ausführen von Zellen und das Lesen von Zellenausgaben auszuführen.
Der Zugriff und die Aktionen des Data Science Agent unterliegen den Berechtigungen des Benutzers. Sie kann nur auf Daten zugreifen, für die Sie Zugriff haben und Vorgänge ausführen, für die Sie über Berechtigungen verfügen.
Anforderungen
Um den Data Science Agent zu verwenden, benötigt Ihr Arbeitsbereich Folgendes:
- Partnergestützte KI-Features, die sowohl für das Konto als auch für den Arbeitsbereich aktiviert sind. Siehe partnergestützte KI-Features.
- Databricks Assistant Agent Mode Preview aktiviert. Siehe Verwalten von Azure Databricks-Vorschauen.
Verwenden des Data Science-Agents
So verwenden Sie den Data Science Agent:
Öffnen Sie aus einem Databricks-Notizbuch oder dem SQL-Editor das Seitenfenster des Assistenten.
Wählen Sie in der unteren rechten Ecke "Agent" aus. Dadurch wird der Agent-Modus des Assistenten umgeschaltet, sodass Sie mit dem Data Science Agent interagieren können.
Geben Sie eine Eingabeaufforderung für den Agent ein. Beispiel: "Analysieren
@sales_transactionssie aus Samples.bakehouse, um das verkaufsstärkste Produkt zu identifizieren."Tipp
Verweisen Sie mithilfe von
@table_name. Der Agent verwendet diese Tabelle und alle zugehörigen Metadaten, um die Antwort zu zusammengestellt. Der Agent respektiert die Unity-Katalogberechtigungen des Benutzers, sodass er nur auf die Daten zugreifen kann, auf die Sie Zugriff haben.Wenn der Agent seine Antwort generiert, wird sie häufig angehalten, um Ihre Eingabe zu erhalten:
Für komplexere Aufgaben kann der Agent einen schrittweisen Plan erstellen und Klärungsfragen stellen. Beantworten Sie die klargestellten Fragen des Agenten, um ihm zu helfen, seinen Plan zu verfeinern.
Wenn der Agent Code ausführen muss, fordert er ihre Genehmigung an, bevor er fortfahren kann. Zulassen oder Ablehnen der Anforderung. Sie können auch "Zulassen" in diesem Thread (verweisen auf den Unterhaltungsthread "Assistent") oder "Immer zulassen" auswählen.
Von Bedeutung
Der Data Science Agent kann Code in Ihrem Notizbuch generieren und ausführen. Obwohl es Schutzschienen hat, um gefährliche Aktionen zu verhindern, besteht immer noch Gefahr. Sie sollten es nur mit Code und Daten verwenden, die Sie als vertrauenswürdig einstufen.
Wenn der Agent seine Arbeit fortsetzt, werden Sie möglicherweise aufgefordert, "Weiter" oder "Ablehnen " auszuwählen. Überprüfen Sie die vorhandene Arbeit des Agents, und wählen Sie dann "Weiter" aus, damit der Agent mit den nächsten Schritten fortfahren kann, oder "Ablehnen ", um ihn anzuweisen, etwas anderes zu versuchen.
Wenn Sie den Agent während der Arbeit beenden möchten, klicken Sie auf das rote
Der Agent kann neue Notizbuchzellen (oder Abfragen) erstellen, Text und Code generieren, die Notizbuchzellen ausführen und auf die Zellenausgabe zugreifen, um die Ergebnisse zu interpretieren.
Hinweis
Damit der Data Science Agent seine Arbeit fortsetzen und die nächsten Schritte ausführen kann, müssen Sie auf der aktuellen Registerkarte bleiben, in der der Agent arbeitet.
Anwendungsfälle
Im Agentmodus verfügt der Assistent über erweiterte Funktionen wie das Suchen von Daten, das Interpretieren von Ausgaben und das Ausführen von Zellaktionen.
Der Data Science Agent kann bei komplexen Data Science-Aufgaben helfen, einschließlich explorativer Datenanalyse, Prognose und maschinellem Lernen. Sie können sogar ein neues Datenanalysenotizbuch ganz neu mit dem Data Science Agent erstellen. Um bessere Ergebnisse zu erzielen, stellen Sie dem Agent Kontext bereit, indem Sie auf Tabellen und Pipelines verweisen.@<resource_name> Sie können auch auf Verweisen Sie auf Ressourcen , um den Kontext manuell auszuwählen, der bereitgestellt werden soll.
Probieren Sie die folgenden Eingabeaufforderungen aus, um zu beginnen:
-
Datenermittlung:
- "Welche Tabelle enthält Bakehouse-Transaktionsdaten?"
- "Ich möchte die Wetterdaten für das Datum 2025-01-01 in der Stadt Los Angeles, CA, sehen."
- "Suchen Sie eine Tabelle, die New York City-Taxidaten enthält, und zeigen Sie mir die ersten 10 Zeilen an."
-
Explorative Datenanalyse:
- "Helfen Sie mir, die JSON-Zeichenfolge in Spalte A zu analysieren."
- "Erstellen Sie eine Visualisierung der Daten aus dieser Tabelle."
- "Dieses Balkendiagramm interpretieren."
- "Beschreiben des Datasets
@sales_transactions. Führen Sie einige EDA aus, damit ich die Spaltenstatistiken verstehen und die Verteilung von Werten visualisieren kann. Denken Sie wie ein Datenwissenschaftler." - "Analysieren Sie
@workload_insights, um die top 5 Kunden für Databricks SQL-Workloads letzte Woche nach Umsatz zu finden. Zeichnen Sie dann ab, wie viele Benutzer diese Kunden für Databricks SQL pro Woche für die letzten 6 Wochen hatten."
-
Prognose:
- "Erstellen Sie mithilfe des
@incidentsDatasets eine Prognose der täglichen Anzahl von Vorfällen für die nächsten 2 Wochen. Wenn Sie fertig sind, geben Sie mir eine Datentabelle und ein interaktives Diagramm, um die Ergebnisse anzuzeigen." - "Mit dem
@website_trafficDataset prognostizieren Sie die Anzahl der täglichen Besucher für den kommenden Monat. Heben Sie saisonale Muster hervor." - "Generieren Sie eine Prognose der Produktnachfrage für die nächsten 6 Monate aus dem
@inventoryDataset, einschließlich Konfidenzintervallen.".
- "Erstellen Sie mithilfe des
-
Maschinelles Lernen:
- "Führen Sie einige Datenvorbereitungs- und Feature-Engineering durch, um dieses Dataset auf Modellschulungen vorzubereiten."
- "Trainieren Sie ein Klassifizierungsmodell für das
@customer_dataDataset, um Abwanderung vorherzusagen. Bewerten Sie das Modell mit Genauigkeit und AUC-Metriken." - "Durchführen der Hyperparameteroptimierung für ein Regressionsmodell mithilfe des Datasets zur Verbesserung des
@housing_pricesVorhersagefehlers." - "Erstellen Sie ein Clusteringmodell auf dem
@sales_leadsDataset, um Kundensegmente zu identifizieren und eine Zusammenfassung der Merkmale jedes Clusters bereitzustellen."
-
Notizbuchorganisation:
- "Erstellen Sie eine neue Zelle, die die Ergebnisse aus diesem Notizbuch zusammenfasst."
- "Geben Sie diesem Notizbuch einen relevanten Namen."
Explorative Datenanalyse
Verwenden Sie den Data Science Agent, um explorative Datenanalysen für ein Dataset durchzuführen. Versuchen Sie beispielsweise, den Agent zu verwenden, um ein neues Notizbuch zu erstellen, das das samples.bakehouse.sales_transactions Dataset analysiert.
Öffnen Sie auf einer leeren Notizbuchregisterkarte den Assistentenbereich, wählen Sie den Agent-Modus aus, und geben Sie die folgende Eingabeaufforderung ein: "Beschreiben Sie das Dataset @sales_transactions aus samples.bakehouse. Ich möchte einige EDA tun, damit ich die Spaltenstatistiken verstehen und die Verteilung von Werten visualisieren kann. Denken Sie wie ein Datenwissenschaftler."
Der Agent erstellt einen Plan, um Ihre Eingabeaufforderung zu beantworten und fragen möglicherweise zu klären. Mit Ihrer Genehmigung generiert sie neue Notizbuchzellen, die Code enthalten, um die Daten und Texte zu untersuchen, die ihren Prozess und ihre Ergebnisse erläutern.