Transformieren und Anreichern von Daten mit KI-Funktionen

Microsoft Fabric AI Functions ermöglichen es allen Geschäftsexperten (von Entwicklern bis zu Analysten), ihre Unternehmensdaten mithilfe von generativer KI zu transformieren und zu bereichern.

KI-Funktionen verwenden branchenführende großsprachliche Modelle (LLMs) zur Zusammenfassung, Klassifizierung, Textgenerierung und vieles mehr. Mit einer einzelnen Codezeile können Sie folgende Aktionen ausführen:

ai.analyze_sentiment: Erkennen des emotionalen Zustands von Eingabetext.
ai.classify: Kategorisieren Sie Eingabetext nach Ihren Bezeichnungen.
ai.embed: Generieren Von Vektoreinbettungen für Eingabetext.
ai.extract: Extrahieren Sie bestimmte Arten von Informationen aus Eingabetext (z. B. Speicherorte oder Namen).
ai.fix_grammar: Korrigieren Sie die Rechtschreibung, Grammatik und Interpunktion von Eingabetext.
ai.generate_response: Generieren Sie Antworten basierend auf Ihren eigenen Anweisungen.
ai.similarity: Vergleichen Sie die Bedeutung von Eingabetext mit einem einzelnen Textwert oder mit Text in einer anderen Spalte.
ai.summarize: Abrufen von Zusammenfassungen von Eingabetext.
ai.translate: Übersetzen von Eingabetext in eine andere Sprache.

Sie können diese Funktionen als Teil von Data Science- und Data Engineering-Workflows integrieren, ganz gleich, ob Sie mit Pandas oder Spark arbeiten. Es gibt keine detaillierte Konfiguration und keine komplexe Infrastrukturverwaltung. Sie benötigen keine spezifische technische Expertise.

KI-Funktionen unterstützen auch die multimodale Eingabe, sodass Sie Bilder, PDFs und Textdateien zusammen mit Textdaten verarbeiten können. Unterstützte Dateitypen sind JPG/JPEG, PNG, GIF, WebP (Bilder), PDF (Dokumente) und gängige Textformate wie MD, TXT, CSV, JSON und XML. Die meisten KI-Funktionen können Dateipfadeingaben verarbeiten, wenn column_type="path" angegeben ist. Ausführliche Informationen zur multimodalen Einrichtung und Nutzung finden Sie unter "Verwenden von multimodalen Eingaben mit KI-Funktionen".

Prerequisites

Um KI-Funktionen mit dem integrierten KI-Endpunkt in Fabric zu verwenden, muss Ihr Administrator den Mandantenwechsel für Copilot und andere Features aktivieren, die von Azure OpenAI unterstützt werden.
Je nach Standort müssen Sie möglicherweise eine Mandanteneinstellung für die geoübergreifende Verarbeitung aktivieren. Erfahren Sie mehr über die verfügbaren Regionen für Azure OpenAI Service.
Sie benötigen eine kostenpflichtige Fabric-Kapazität (F2 oder höher oder eine beliebige P-Edition).

Note

KI-Funktionen werden in Fabric Runtime 1.3 und höher unterstützt.
Sofern Sie kein anderes Modell konfigurieren, funktionieren KI-Funktionen standardmäßig auf gpt-4.1-mini. Erfahren Sie mehr über Abrechnungs- und Verbrauchsraten.
Obwohl das zugrunde liegende Modell mehrere Sprachen verarbeiten kann, sind die meisten KI-Funktionen für die Verwendung in englischsprachigen Texten optimiert."

Modelle und Anbieter

KI-Funktionen unterstützen jetzt umfassendere Modelle und Anbieter, die über die Standardmodelle von Azure OpenAI hinausgehen. Sie können KI-Funktionen für die Verwendung konfigurieren:

Azure OpenAI-Modelle
Microsoft Foundry-Ressourcen (einschließlich Modelle wie Claude und LLaMA)

Die Modell- und Anbieterauswahl kann über die Konfiguration der KI-Funktionen konfiguriert werden. Ausführliche Informationen zum Einrichten und Konfigurieren verschiedener Modelle und Anbieter finden Sie in der Konfigurationsdokumentation für Pandas und PySpark.

Erste Schritte mit KI-Funktionen

KI-Funktionen können mit Pandas (Python und PySpark Runtime) und mit PySpark (PySpark Runtime) verwendet werden. Die erforderlichen Installations- und Importschritte sind im folgenden Abschnitt beschrieben, gefolgt von den entsprechenden Befehlen.

Leistung und Parallelität

KI-Funktionen werden jetzt mit einer erhöhten Standard-Parallelität von 200 ausgeführt, was eine schnellere parallele Verarbeitung von KI-Operationen ermöglicht. Sie können Parallelitätseinstellungen pro Workload optimieren, um die Leistung basierend auf Ihren spezifischen Anforderungen zu optimieren. Weitere Informationen zum Konfigurieren von Parallelität und anderen leistungsbezogenen Einstellungen finden Sie in der Konfigurationsdokumentation für Pandas und PySpark.

Installieren von Abhängigkeiten

Pandas (Python-Laufzeitumgebung)
- Installation von synapseml_internal und synapseml_core WHL-Dateien erforderlich (Befehle werden in der folgenden Codezelle bereitgestellt)
- openai Erforderliche Paketinstallation (Befehl in der folgenden Codezelle)
Pandas (PySpark Runtime)
- openai Erforderliche Paketinstallation (Befehl in der folgenden Codezelle)
PySpark (PySpark Runtime)
- Keine Installation erforderlich

Pandas (PySpark Runtime)
Pandas (Python-Laufzeitumgebung)

# The pandas AI functions package requires OpenAI version 1.99.5 or later
%pip install -q openai 2>/dev/null

# Install latest versions of AI functions library whl
!wget -q https://aka.ms/fabric-aifunctions-whl -O synapseml_internal-latest-py3-none-any.whl
!wget -q https://aka.ms/fabric-synapseml-core-whl -O synapseml_core-latest-py3-none-any.whl

# The pandas AI functions package requires OpenAI version 1.99.5 or later
%pip install -q openai synapseml_internal-latest-py3-none-any.whl synapseml_core-latest-py3-none-any.whl

Importieren erforderlicher Bibliotheken

In der folgenden Codezelle werden die KI-Funktionsbibliothek und ihre Abhängigkeiten importiert.

pandas
PySpark

# Required imports
import synapse.ml.aifunc as aifunc
import pandas as pd

import synapse.ml.spark.aifunc as aifunc

# SparkSession with accessor `spark` in PySpark environments is pre-setup and available for use

Hilfsfunktionen für Dateiimport und Schema

KI-Funktionen umfassen Hilfsfunktionen, die multimodale Workflows optimieren, indem die Erfassung von Dateien und die Schemaverwaltung vereinfacht werden:

aifunc.load: Aufnehmen von Dateien aus einem Ordner in eine strukturierte Tabelle. Optional können Sie eine Aufforderung zum Leiten der Extraktion oder eines Schemas für eine konsistente Struktur bereitstellen.
aifunc.list_file_paths: Aufzählen von Datei-URLs und Pfaden aus einem Ordner zur Verwendung als Eingabe für jede KI-Funktion.
ai.infer_schema: Ein Extraktionsschema aus Dateiinhalten erschließen. Das abgeleitete Schema ist kompatibel mit ai.extract, sodass Sie es direkt für die strukturierte Datenextraktion übergeben können.

Ausführliche Syntax und Beispiele finden Sie unter Verwenden von multimodalen Eingaben mit KI-Funktionen.

Anwenden von KI-Funktionen

Mit jeder der folgenden Funktionen können Sie den integrierten KI-Endpunkt in Fabric aufrufen, um Daten mit einer einzigen Codezeile zu transformieren und zu anreichern. Sie können KI-Funktionen verwenden, um Pandas DataFrames oder Spark DataFrames zu analysieren. PySpark AI-Funktionsaufrufe (einschließlich ai.extract) werden über Fabric Spark-Cluster verteilt und ermöglichen die skalierbare Verarbeitung großer Datasets. Informationen zu Leistungsoptimierungsoptionen finden Sie in der PySpark-Konfigurationsdokumentation .

Note

Die meisten KI-Funktionen unterstützen jetzt Dateipfadeingaben über column_type="path" (Pandas) oder input_col_type/col_types="path" (PySpark). Dies ermöglicht die direkte Verarbeitung von Bildern und PDF-Dateien, ohne unformatierte Bytes zu laden. Weitere Informationen zu Verwendungsmustern finden Sie unter Verwenden von multimodalen Eingaben mit KI-Funktionen.

Tip

Erfahren Sie, wie Sie die Konfiguration von KI-Funktionen anpassen.

Erweiterte Konfiguration: Wenn Sie gpt-5-Familienmodelle verwenden, können Sie erweiterte Optionen wie reasoning_effort und verbosity konfigurieren. Details zum Festlegen dieser Optionen finden Sie auf den Konfigurationsseiten für Pandas und PySpark .

Erkennen der Stimmung mit ai.analyze_sentiment

Die ai.analyze_sentiment Funktion ruft KI auf, um festzustellen, ob der durch Eingabetext ausgedrückte emotionale Zustand positiv, negativ, gemischt oder neutral ist. Wenn KI diese Bestimmung nicht vornehmen kann, bleibt die Ausgabe leer. Ausführlichere Anweisungen zur Verwendung von ai.analyze_sentiment Pandas finden Sie in diesem Artikel. Informationen ai.analyze_sentiment zu PySpark finden Sie in diesem Artikel.

Optionale Parameter

Die ai.analyze_sentiment Funktion unterstützt jetzt zusätzliche optionale Parameter, mit denen Sie das Verhalten der Stimmungsanalyse anpassen können. Diese Parameter bieten mehr Kontrolle darüber, wie die Stimmung erkannt und gemeldet wird. Ausführliche Informationen zu verfügbaren Parametern, deren Beschreibungen und Standardwerten finden Sie in der funktionsspezifischen Dokumentation für Pandas und PySpark.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "The cleaning spray permanently stained my beautiful kitchen counter. Never again!",
        "I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",
        "I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",
        "The umbrella is OK, I guess."
    ], columns=["reviews"])

df["sentiment"] = df["reviews"].ai.analyze_sentiment()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Kategorisieren von Text mit ai.klassifizieren

Die ai.classify Funktion ruft KI auf, um Eingabetext nach benutzerdefinierten Bezeichnungen zu kategorisieren, die Sie auswählen. Weitere Informationen zur Nutzung von ai.classify mit Pandas finden Sie in diesem Artikel. Informationen ai.classify zu PySpark finden Sie in diesem Artikel.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])

df["category"] = df['descriptions'].ai.classify("kitchen", "bedroom", "garage", "other")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
    ], ["descriptions"])
    
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)

Generieren von Vektoreinbettungen mit ai.embed

Die ai.embed Funktion ruft KI auf, um Vektoreinbettungen für Eingabetext zu generieren. Vektoreinbettungen sind numerische Darstellungen von Text, die die semantische Bedeutung erfassen, wodurch sie für Ähnlichkeitssuche, Abrufworkflows und andere maschinelle Lernaufgaben nützlich sind. Die Dimensionalität der Einbettungsvektoren hängt vom ausgewählten Modell ab. Ausführlichere Anweisungen zur Verwendung von ai.embed Pandas finden Sie in diesem Artikel. Informationen ai.embed zu PySpark finden Sie in diesem Artikel.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",), 
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",), 
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",) 
    ], ["descriptions"])

embed = df.ai.embed(input_col="descriptions", output_col="embed")
display(embed)

Extrahieren von Entitäten mit ai.extract

Die ai.extract Funktion ruft KI auf, um Eingabetext zu scannen und bestimmte Arten von Informationen zu extrahieren, die durch von Ihnen ausgewählte Bezeichnungen festgelegt werden (z. B. Speicherorte oder Namen). Ausführlichere Anweisungen zur Verwendung von ai.extract Pandas finden Sie in diesem Artikel. Informationen ai.extract zu PySpark finden Sie in diesem Artikel.

Strukturierte Bezeichnungen

Die ai.extract Funktion unterstützt strukturierte Bezeichnungsdefinitionen über das ExtractLabel Schema. Sie können Bezeichnungen mit strukturierten Definitionen bereitstellen, die nicht nur den Bezeichnungsnamen, sondern auch Typinformationen und Attribute enthalten. Bezeichnungsdefinitionen können einfache Bezeichnungsnamen (Zeichenfolgen) mit schemagebundenen Objekten über ExtractLabelkombinieren. Dieser strukturierte Ansatz verbessert die Extraktionskonsistenz und ermöglicht es der Funktion, entsprechend strukturierte Ausgabespalten zurückzugeben. Beispielsweise können Sie Bezeichnungen mit zusätzlichen Metadaten angeben, um den Extraktionsprozess genauer zu leiten.

ExtractLabel akzeptiert vollständige JSON-Schemadefinitionen und erzwingt die Struktur für die extrahierte Ausgabe. Zu den unterstützten Schemakonstrukten gehören typierte Felder, Enums, Arrays (via items), Objekte mit properties nullablen Werten (z. B. type=["string", "null"]), required Eigenschaften und additionalProperties=false um zusätzliche Felder zu verhindern. Die zurückgegebenen Spalten (oder Strukturen) entsprechen dem angegebenen Schema. Wenn ein strenges Schema bereitgestellt wird (z. B. mit required Eigenschaften oder additionalProperties=false), werden Ausgaben, die nicht konform sind, als Ausnahmen im Ergebnis angezeigt und in ai.stats widergespiegelt.

Sie können auch Schemas als Pydantic-Modelle erstellen und sie in das JSON-Schema für die Verwendung mit ExtractLabel konvertieren. Ausführliche Beispiele und Verwendungsmuster finden Sie in der Dokumentation für Pandas und PySpark.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "MJ Lee lives in Tucson, AZ, and works as a software engineer for Microsoft.",
        "Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey."
    ], columns=["descriptions"])

df_entities = df["descriptions"].ai.extract("name", "profession", "city")
display(df_entities)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("MJ Lee lives in Tucson, AZ, and works as a software engineer for Microsoft.",),
        ("Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey.",)
    ], ["descriptions"])

df_entities = df.ai.extract(labels=["name", "profession", "city"], input_col="descriptions")
display(df_entities)

Korrigieren der Grammatik mit ai.fix_grammar

Die ai.fix_grammar Funktion ruft KI auf, um die Rechtschreibung, Grammatik und Interpunktion von Eingabetext zu korrigieren. Ausführlichere Anweisungen zur Verwendung von ai.fix_grammar Pandas finden Sie in diesem Artikel. Informationen ai.fix_grammar zu PySpark finden Sie in diesem Artikel.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "There are an error here.",
        "She and me go weigh back. We used to hang out every weeks.",
        "The big picture are right, but you're details is all wrong."
    ], columns=["text"])

df["corrections"] = df["text"].ai.fix_grammar()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

corrections = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(corrections)

Beantworten von benutzerdefinierten Benutzeraufforderungen mit ai.generate_response

Die ai.generate_response Funktion ruft KI auf, um benutzerdefinierten Text basierend auf Ihren eigenen Anweisungen zu generieren. Ausführlichere Anweisungen zur Verwendung von ai.generate_response Pandas finden Sie in diesem Artikel. Informationen ai.generate_response zu PySpark finden Sie in diesem Artikel.

Optionale Parameter

Die ai.generate_response Funktion unterstützt jetzt einen response_format Parameter, mit dem Sie eine strukturierte JSON-Ausgabe anfordern können. Sie können angeben response_format='json' , dass Antworten im JSON-Format empfangen werden sollen. Darüber hinaus können Sie ein JSON-Schema bereitstellen, um eine bestimmte Ausgabestruktur zu erzwingen, um sicherzustellen, dass die generierte Antwort dem erwarteten Daten-Shape entspricht. Dies ist besonders nützlich, wenn Sie vorhersehbare, maschinenlesbare Ausgaben aus der KI-Funktion benötigen. Ausführliche Beispiele und Verwendungsmuster finden Sie in der Dokumentation für Pandas und PySpark.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        ("Scarves"),
        ("Snow pants"),
        ("Ski goggles")
    ], columns=["product"])

df["response"] = df.ai.generate_response("Write a short, punchy email subject line for a winter sale.")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Scarves",),
        ("Snow pants",),
        ("Ski goggles",)
    ], ["product"])

responses = df.ai.generate_response(prompt="Write a short, punchy email subject line for a winter sale.", output_col="response")
display(responses)

Berechnen Sie die Ähnlichkeit mit ai.similarity

Die ai.similarity Funktion vergleicht jeden Eingabetextwert entweder mit einem gemeinsamen Bezugstext oder mit dem entsprechenden Wert in einer anderen Spalte (paarweiser Modus). Die Werte der Ausgabesimilaritätsbewertung sind relativ und können von -1 (Gegenteil) bis 1 (identisch) reichen. Eine Bewertung von 0 weist darauf hin, dass die Werte in der Bedeutung nicht miteinander verknüpft sind. Ausführlichere Anweisungen zur Verwendung von ai.similarity Pandas finden Sie in diesem Artikel. Informationen ai.similarity zu PySpark finden Sie in diesem Artikel.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([ 
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture") 
    ], columns=["names", "industries"])
    
df["similarity"] = df["names"].ai.similarity(df["industries"])
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture")
    ], ["names", "industries"])

similarity = df.ai.similarity(input_col="names", other_col="industries", output_col="similarity")
display(similarity)

Zusammenfassen von Text mit ai.summarize

Die ai.summarize Funktion ruft KI auf, um Zusammenfassungen von Eingabetext zu generieren (werte aus einer einzelnen Spalte eines DataFrames oder Zeilenwerte in allen Spalten). Ausführlichere Anweisungen zur Verwendung von ai.summarize Pandas finden Sie in diesem Artikel. Informationen ai.summarize zu PySpark finden Sie in diesem Artikel.

Zusammenfassungen anpassen mit Anweisungen

Die ai.summarize Funktion unterstützt jetzt einen instructions Parameter, mit dem Sie den Ton, die Länge und den Fokus der generierten Zusammenfassungen steuern können. Sie können benutzerdefinierte Anweisungen bereitstellen, um zu erläutern, wie die Zusammenfassung erstellt werden soll, z. B. angeben einer bestimmten Formatvorlage, Zielgruppe oder Detailebene. Wenn keine Anweisungen bereitgestellt werden, verwendet die Funktion standardmäßiges Zusammenfassungsverhalten. Beispiele für die Verwendung des instructions Parameters finden Sie in der detaillierten Dokumentation zu Pandas und PySpark.

pandas
PySpark

# This code uses AI. Always review output for mistakes.

df= pd.DataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """)
    ], columns=["product", "release_year", "description"])

df["summaries"] = df["description"].ai.summarize()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """,),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """,)
    ], ["product", "release_year", "description"])

summaries = df.ai.summarize(input_col="description", output_col="summary")
display(summaries)

Übersetzen von Text mit ai.translate

Die ai.translate Funktion ruft KI auf, um Eingabetext in eine neue Sprache Ihrer Wahl zu übersetzen. Ausführlichere Anweisungen zur Verwendung von ai.translate Pandas finden Sie in diesem Artikel. Informationen ai.translate zu PySpark finden Sie in diesem Artikel.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "Hello! How are you doing today?", 
        "Tell me what you'd like to know, and I'll do my best to help.", 
        "The only thing we have to fear is fear itself."
    ], columns=["text"])

df["translations"] = df["text"].ai.translate("spanish")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

Anzeigen von Nutzungsstatistiken mit ai.stats

Fabric AI-Funktionen bieten eine integrierte Möglichkeit zum Überprüfen von Nutzungs- und Ausführungsstatistiken für alle KI-generierten Datenreihen oder DataFrames. Sie können auf diese Metriken zugreifen, indem Sie das von einer KI-Funktion zurückgegebene Ergebnis aufrufen ai.stats .

ai.stats gibt einen DataFrame mit den folgenden Spalten zurück:

num_successful – Anzahl der zeilen, die von der KI-Funktion erfolgreich verarbeitet wurden.
num_exceptions – Anzahl der Zeilen, bei denen während der Ausführung eine Ausnahme aufgetreten ist. Diese Zeilen werden als Instanzen von aifunc.ExceptionResult dargestellt.
num_unevaluated – Anzahl der Zeilen, die nicht verarbeitet wurden, weil eine frühere Ausnahme dazu führte, dass die Auswertung nicht fortgesetzt werden konnte. Diese Zeilen sind Instanzen von "aifunc.NotEvaluatedResult".
num_harmful – Anzahl der zeilen, die vom Azure OpenAI-Inhaltsfilter blockiert wurden. Diese Zeilen sind Instanzen von aifunc.FilterResult.
prompt_tokens – Gesamtanzahl der eingabetoken, die für den AI-Funktionsaufruf verwendet werden.
completion_tokens – Gesamtanzahl der vom Modell generierten Ausgabetoken.

Tip

Sie können ai.stats für jede von einer KI-Funktion zurückgegebene Serie oder DataFrame aufrufen. Dies kann Ihnen helfen, die Verwendung nachzuverfolgen, Fehlermuster zu verstehen und den Tokenverbrauch zu überwachen.

Kostentransparenz

KI-Funktionen beinhalten einen konfigurierbaren Kostenrechner für Fortschrittsbalken, der während der Ausführung in Echtzeit Tokenschätzungen und Kapazitätseinheiten anzeigt. Sie können den Rechner auf einen von drei Modi festlegen:

basic: Zeigt eine Zusammenfassung der geschätzten Token und verbrauchten Kapazitätseinheiten an.
stats: Zeigt detaillierte Statistiken pro Anruf an, einschließlich der Anzahl der Eingabe- und Ausgabetokens.
disable: Schaltet die Anzeige der Fortschrittsbalken-Kosten aus.

Ausführliche Informationen zum Konfigurieren dieser Modi finden Sie in der Konfigurationsdokumentation für Pandas und PySpark.

Die Fabric-Kapazitätsmetriken-App enthält jetzt einen dedizierten KI-Funktionen-Vorgang , der die NUTZUNG von KI-Funktionen von Spark und Dataflows Gen2 trennt und Ihnen eine klarere Überwachung des KI-bezogenen Kapazitätsverbrauchs ermöglicht. Weitere Informationen finden Sie unter Was ist die Microsoft Fabric Capacity Metrics-App?.

Bewerten und Beschleunigen

Auswertungsnotizbücher sind verfügbar, um die Ausgabequalität der KI-Funktion zu bewerten. Diese Notizbücher verwenden LLM-as-a-Judge, um Metriken wie Genauigkeit, Präzision, Trefferquote, F1, Kohärenz, Konsistenz und Relevanz zu berechnen. Sie können diese Workflows verwenden, um Ergebnisse zu überprüfen, bevor Sie sie in der Produktion bereitstellen. Starter-Notizbücher sind auch verfügbar und stellen End-to-End-Beispiele bereit, die die Aufnahme von Dateien, die Schemaableitung und die Extraktion veranschaulichen, damit Sie schnell beginnen können.

Erkennen der Stimmung mit ai.analyze_sentiment in pandas oder ai.analyze_sentiment in pyspark.
Kategorisieren von Text mit ai.classify in pandas oder ai.classify in PySpark.
Generieren Sie Vektoreinbettungen mit ai.embed in pandas oder ai.embed in PySpark.
Extrahieren von Entitäten mit ai.extract in pandas oder ai.extract in PySpark.
Korrigieren der Grammatik mit ai.fix_grammar in pandas oder ai.fix_grammar in PySpark.
Beantworten von benutzerdefinierten Benutzeraufforderungen mit ai.generate_response in pandas oder ai.generate_response in PySpark.
Berechnen der Ähnlichkeit mit ai.similarity in pandas oder ai.similarity in PySpark.
Zusammenfassen von Text mit ai.summarize in pandas oder ai.summarize in PySpark.
Übersetzen von Text mit ai.translate in pandas oder ai.translate in PySpark.
Passen Sie die Konfiguration von KI-Funktionen in Pandas oder die Konfiguration von KI-Funktionen in PySpark an.
Verwenden Sie multimodale Eingaben mit KI-Funktionen , um Bilder, PDFs und Textdateien zu verarbeiten.
Haben wir ein Feature verpasst, das Sie benötigen? Schlagen Sie es im Forum für Fabric-Ideen vor.

Feedback

War diese Seite hilfreich?

Last updated on 2026-03-31

Transformieren und Anreichern von Daten mit KI-Funktionen

Prerequisites

Modelle und Anbieter

Erste Schritte mit KI-Funktionen

Leistung und Parallelität

Installieren von Abhängigkeiten

Importieren erforderlicher Bibliotheken

Hilfsfunktionen für Dateiimport und Schema

Anwenden von KI-Funktionen

Erkennen der Stimmung mit ai.analyze_sentiment

Optionale Parameter

Kategorisieren von Text mit ai.klassifizieren

Generieren von Vektoreinbettungen mit ai.embed

Extrahieren von Entitäten mit ai.extract

Strukturierte Bezeichnungen

Korrigieren der Grammatik mit ai.fix_grammar

Beantworten von benutzerdefinierten Benutzeraufforderungen mit ai.generate_response

Optionale Parameter

Berechnen Sie die Ähnlichkeit mit ai.similarity

Zusammenfassen von Text mit ai.summarize

Zusammenfassungen anpassen mit Anweisungen

Übersetzen von Text mit ai.translate

Anzeigen von Nutzungsstatistiken mit ai.stats

Kostentransparenz

Bewerten und Beschleunigen

Verwandte Inhalte

Feedback

Zusätzliche Ressourcen