Aracılığıyla paylaş


PySpark ile ai.analyze_sentiment kullanma

İşlev, ai.analyze_sentiment tek bir kod satırıyla giriş metninin duygusal durumunu algılamak için üretken yapay zeka kullanır. Girişin duygusal durumunun pozitif, negatif, karışık veya nötr olup olmadığını algılayabilir. Ayrıca, belirtilen etiketlerinize göre duygusal durumu algılayabilir. Fonksiyon duygu durumunu belirleyemezse, çıktıyı boş bırakır.

Uyarı

Genel Bakış

ai.analyze_sentiment İşlev, Spark DataFrames için kullanılabilir. Var olan bir giriş sütununun adını parametre olarak belirtmeniz gerekir.

İşlev, her giriş metin satırı için yaklaşım etiketlerinin bir çıkış sütununda depolandığı yeni bir DataFrame döndürür.

Sözdizimi

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

Parametreler

İsim Description
input_col
Gerekli
Yaklaşım analizi için giriş metin değerlerine sahip mevcut bir sütunun adını içeren dize .
output_col
Opsiyonel
Her bir giriş metni satırının duygu etiketini depolamak üzere yeni bir sütunun adını içeren bir dizesi. Bu parametreyi ayarlamazsanız, çıkış sütunu için varsayılan bir ad oluşturur.
labels
Opsiyonel
Giriş metin değerleriyle eşleşecek yaklaşım etiketleri kümesini temsil eden bir veya daha fazla dize .
error_col
Opsiyonel
Giriş metninin her satırının işlenmesinden kaynaklanan OpenAI hatalarını depolamak için yeni sütunun adını içeren bir dizesi. Bu parametreyi ayarlamazsanız hata sütunu için varsayılan bir ad oluşturur. Giriş satırında hata yoksa, bu sütundaki değer nullolur.

İade

İşlev, giriş sütunundaki her metin satırıyla eşleşen yaklaşım etiketleri içeren yeni bir sütun içeren bir Spark DataFrame döndürür. Varsayılan yaklaşım etiketleri , positive, negativeveya neutraletiketlerini içerirmixed. Özel etiketler belirtilirse, bunun yerine bu etiketler kullanılır. Duygu belirlenemezse, dönüş değeri nullolarak döndürülür.

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Bu örnek kod hücresi aşağıdaki çıkışı sağlar:

'İncelemeler' ve 'yaklaşım' sütunlarını içeren bir veri çerçevesinin ekran görüntüsü. 'Yaklaşım' sütunu 'negatif', 'pozitif', 'karma' ve 'nötr' sütunlarını içerir.