Freigeben über


Verwenden von ai.generate_response mit PySpark

Die ai.generate_response Funktion verwendet generative KI, um benutzerdefinierte Textantworten zu generieren, die auf Ihren eigenen Anweisungen basieren, mit einer einzigen Codezeile.

Hinweis

Überblick

Die ai.generate_response Funktion ist für Spark DataFrames verfügbar. Sie müssen den Namen einer vorhandenen Eingabespalte als Parameter angeben. Sie müssen auch eine Zeichenfolgenbasierte Eingabeaufforderung und einen Booleschen Wert angeben, der angibt, ob diese Eingabeaufforderung als Formatzeichenfolge behandelt werden soll.

Die Funktion gibt einen neuen DataFrame mit benutzerdefinierten Antworten für jede Eingabetextzeile zurück, die in einer Ausgabespalte gespeichert ist.

Tipp

Erfahren Sie, wie Sie effektivere Aufforderungen erstellen, um antworten mit höherer Qualität zu erhalten, indem Sie die Tipps zur Aufforderung von OpenAI für gpt-4.1 befolgen.

Syntax

df.ai.generate_response(prompt="Instructions for a custom response based on all column values", output_col="response")

Die Parameter

Name Description
prompt
Erforderlich
Eine Zeichenfolge , die Anweisungen zur Eingabeaufforderung enthält. Diese Anweisungen werden auf Eingabetextwerte für benutzerdefinierte Antworten angewendet.
is_prompt_template
Wahlfrei
Ein Boolescher Wert, der angibt, ob es sich bei der Eingabeaufforderung um eine Formatzeichenfolge oder eine Literalzeichenfolge handelt. Wenn dieser Parameter auf True festgelegt ist, berücksichtigt die Funktion nur die spezifischen Zeilenwerte aus jeder Spalte, die in der Formatzeichenfolge angezeigt wird. In diesem Fall müssen diese Spaltennamen zwischen geschweiften Klammern angezeigt werden, und andere Spalten werden ignoriert. Wenn dieser Parameter auf den Standardwert festgelegt Falseist, berücksichtigt die Funktion alle Spaltenwerte als Kontext für jede Eingabezeile.
output_col
Wahlfrei
Eine Zeichenfolge , die den Namen einer neuen Spalte enthält, um benutzerdefinierte Antworten für jede Zeile mit Eingabetext zu speichern. Wenn Sie diesen Parameter nicht festlegen, wird für die Ausgabespalte ein Standardname generiert.
error_col
Wahlfrei
Eine Zeichenfolge , die den Namen einer neuen Spalte enthält, um alle OpenAI-Fehler zu speichern, die aus der Verarbeitung jeder Zeile von Eingabetext resultieren. Wenn Sie diesen Parameter nicht festlegen, wird für die Fehlerspalte ein Standardname generiert. Wenn keine Fehler für eine Zeile mit Eingabe vorhanden sind, ist der Wert in dieser Spalte null.

Rückkehr

Die Funktion gibt einen Spark DataFrame zurück, der eine neue Spalte enthält, die benutzerdefinierte Textantworten für die Eingabeaufforderung für jede Eingabetextzeile enthält.

Example

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("Scarves",),
        ("Snow pants",),
        ("Ski goggles",)
    ], ["product"])

responses = df.ai.generate_response(prompt="Write a short, punchy email subject line for a winter sale.", output_col="response")
display(responses)

Diese Beispielcodezelle stellt die folgende Ausgabe bereit:

Screenshot eines Datenrahmens mit den Spalten