Freigeben über


Datenschutz, Sicherheit und verantwortungsvolle Nutzung von Copilot für Data Science

In diesem Artikel erfährst du, wie Microsoft Copilot für Data Science funktioniert, wie es deine Geschäftsdaten sicher hält und Datenschutzanforderungen einhält, und wie du generative KI verantwortungsbewusst verwendest. Eine Übersicht über diese Themen für Copilot in Fabric findest du unter Datenschutz, Sicherheit und verantwortungsvolle Verwendung für Copilot (Vorschau).

Mit der Vorschau von Copilot für Data Science in Microsoft Fabric und anderen generativen KI-Features bietet Microsoft Fabric neue Möglichkeiten, Daten zu transformieren und zu analysieren, Einblicke zu generieren und Visualisierungen sowie Berichte zu erstellen.

Überlegungen und Einschränkungen findest du unter Einschränkungen.

Datennutzung von Copilot für Data Science

  • In Notebooks kann Copilot nur auf Daten zugreifen, die für das aktuelle Notebook des Benutzers zugänglich sind, entweder in einem angehängten Lakehouse oder direkt vom Benutzer in dieses Notebook geladen oder importiert. In Notebooks kann Copilot auf keine Daten zugreifen, die nicht auch für das Notebook zugänglich sind.

  • Standardmäßig hat Copilot Zugriff auf die folgenden Datentypen:

    • Frühere an Copilot gesendete Nachrichten und Antworten von für diesen Benutzer in dieser Sitzung.
    • Inhalt von Zellen, die der Benutzer ausgeführt hat.
    • Ausgaben von Zellen, die der Benutzer ausgeführt hat.
    • Schema von Datenquellen im Notebook.
    • Beispieldaten aus Datenquellen im Notebook.
    • Schema aus externen Datenquellen in einem angehängten Lakehouse.

Auswertung von Copilot für Data Science

  • Das Produktteam hat Copilot getestet, um zu sehen, wie gut das System im Kontext von Notebooks funktioniert und ob die KI-Antworten aufschlussreich und nützlich sind.
  • Das Team konzentrierte sich auch auf zusätzliche Maßnahmen zur Schadensbegrenzung, einschließlich technologischer Ansätze zur Fokussierung der Copilot-Ausgaben auf Themen im Zusammenhang mit Data Science.

Tipps zum Arbeiten mit Copilot für Data Science

  • Copilot ist am besten für datenwissenschaftliche Themen geeignet, also beschränken Sie Ihre Fragen auf diesen Bereich.
  • Geben Sie genau an, welche Daten Sie von Copilot untersuchen lassen möchten. Wenn Sie das Datenobjekt beschreiben, z. B. durch die Benennung von Dateien, Tabellen oder Spalten, ist es wahrscheinlicher, dass Copilot relevante Daten abruft und nützliche Ausgaben erzeugt.
  • Wenn Sie detailliertere Antworten benötigen, versuchen Sie, die Daten als DataFrames in das Notebook zu laden oder die Daten in Ihrem Lakehouse anzuheften. Dadurch erhält Copilot mehr Kontext, mit dem er Analysen durchführen kann. Wenn eine Ressource zu groß zum Laden ist, ist das Anheften eine hilfreiche Alternative.

KI-Skill: Verantwortungsvolle KI häufig gestellte Fragen

Was ist ein KI-Skill?

KI-Skill ist ein neues Tool in Fabric, das eine Möglichkeit bietet, Antworten von Ihren tabellarischen Daten in natürlicher Sprache zu erhalten.

Was kann KI Skill tun?

Ein Datenanalytiker oder Ingenieur kann KI-Skill für die Verwendung durch nicht-technische Geschäftsanwender vorbereiten. Sie müssen Fabric-Datenquelle konfigurieren und optional zusätzliche Kontext-Informationen bereitstellen, die nicht offensichtlich aus dem Schema sind.

Nicht technische Benutzer können dann Fragen eingeben und die Ergebnisse aus der Ausführung einer von KI generierten SQL-Abfrage erhalten.

Welcher ist der Verwendungszweck des KI-Skills?

  • Geschäftsanwender, die mit der Struktur der Daten nicht vertraut sind, können zusätzlich zu den tabellarischen Daten, die in Fabric Lakehouses und Fabric Warehouses gespeichert sind, beschreibende Fragen stellen, wie z. B. „Welches sind die 10 umsatzstärksten Produkte im letzten Monat?“.

  • KI-Skill ist nicht für die Verwendung in Fällen vorgesehen, in denen deterministische und 100% genaue Ergebnisse erforderlich sind, was die aktuellen LLM-Einschränkungen widerspiegelt.

  • KI-Skill ist nicht für Anwendungsfälle vorgesehen, die umfassende Analysen oder Kausalanalysen erfordern. Bespielweise die Frage “Warum sind unsere Verkaufszahlen im letzten Monat gefallen?” befinden sich außerhalb des gültigen Bereichs.

Wie wurde KI-Skill bewertet? Welche Metriken werden verwendet, um die Leistung zu messen?

Das Produktteam hat die KI-Fähigkeit für eine Vielzahl von öffentlichen und privaten Benchmarks für SQL-Aufgaben getestet, um die Qualität von SQL-Abfragen zu ermitteln.

Das Team konzentrierte sich auch auf zusätzliche Maßnahmen zur Schadensbegrenzung, einschließlich technologischer Ansätze zur Fokussierung der Ausgaben der KI-Fähigkeit im Zusammenhang mit der gewählten Datenquelle.

Welche Einschränkungen gelten für KI-Skill? Wie können Benutzer die Auswirkungen dieser Einschränkungen minimieren, wenn sie das System nutzen?

  • Stellen Sie sicher, dass Ihre Spaltennamen beschreibend sind. Statt Spaltennamen wie „C1“ oder „ActCu“ zu verwenden, verwenden Sie „ActiveCustomer“ oder „IsCustomerActive“. Dies ist die effektivste Möglichkeit, zuverlässigere Abfragen aus der KI herauszuholen.

  • Verwenden Sie die Notizen für das Modell im Konfigurationsbereich auf der Benutzeroberfläche. Wenn die von KI-Skill generierten SQL-Abfragen falsch sind, können Sie Anweisungen für das Modell in einfachem Englisch bereitstellen, um zukünftige Abfragen zu verbessern. Das System wird diese Anweisungen bei jeder Abfrage verwenden. Kurze und direkte Anweisungen sind am besten geeignet.

  • Stellen Sie Beispiele im Modell-Konfigurationsbereich auf der Benutzeroberfläche bereit. Das System nutzt die relevantesten Beispiele, wenn es seine Antworten liefert.

Welche betrieblichen Faktoren und Einstellungen lassen eine effektive und verantwortungsvolle Nutzung von KI-Skill zu?

  • Die KI-Fähigkeit hat nur Zugriff auf die von Ihnen bereitgestellten Daten. Es verwendet das Schema (Tabellenname und Spaltenname) sowie die Notizen für das Modell und die Beispiele, die Sie in der Benutzeroberfläche angeben.

  • KI-Skill hat immer nur Zugriff auf Daten, auf die Fragende Zugriff haben. Wenn Sie die KI-Fähigkeit verwenden, werden Ihre Anmeldedaten für den Zugriff auf die zugrundeliegende Datenbank verwendet. Wenn Sie keinen Zugriff auf die zugrundeliegenden Daten haben, hat KI-Skill auch keinen. Diese gilt, wenn Sie die KI-Fähigkeit für andere Ziele veröffentlichen, z. B. Copilot für Microsoft 365 oder Microsoft Copilot Studio, wo die KI-Fertigkeit von anderen Fragestellern genutzt werden kann.