แชร์ผ่าน


ใช้ ai.analyze_sentiment กับ PySpark

ฟังก์ชันนี้ ai.analyze_sentiment ใช้ Generative AI เพื่อตรวจจับสภาวะทางอารมณ์ของข้อความที่ป้อนด้วยโค้ดบรรทัดเดียว สามารถตรวจจับได้ว่าสภาวะทางอารมณ์ของอินพุตเป็นบวก ลบ ผสม หรือเป็นกลาง นอกจากนี้ยังสามารถตรวจจับสภาวะทางอารมณ์ตามป้ายกํากับที่คุณระบุ ถ้าฟังก์ชันไม่สามารถกําหนดความคิดเห็น ได้ จะทําให้ผลลัพธ์ว่างเปล่า

Note

Overview

ฟังก์ชันนี้ai.analyze_sentimentพร้อมใช้งานสําหรับ Spark DataFrames คุณต้องระบุชื่อของคอลัมน์อินพุตที่มีอยู่เป็นพารามิเตอร์

ฟังก์ชันส่งกลับ DataFrame ใหม่ พร้อมป้ายชื่อความคิดเห็นสําหรับแต่ละแถวข้อความที่ป้อนเข้าที่จัดเก็บไว้ในคอลัมน์ผลลัพธ์

วากยสัมพันธ์

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

พารามิเตอร์

ชื่อ คำอธิบาย
input_col
จำเป็น
สตริงที่มีชื่อของคอลัมน์ที่มีอยู่พร้อมค่าข้อความที่ป้อนเพื่อวิเคราะห์ความคิดเห็น
output_col
เลือกได้
สตริงที่มีชื่อของคอลัมน์ใหม่เพื่อจัดเก็บป้ายชื่อความคิดเห็นสําหรับแต่ละแถวของข้อความที่ป้อนเข้า ถ้าคุณไม่ได้ตั้งค่าพารามิเตอร์นี้ ชื่อเริ่มต้นจะถูกสร้างขึ้นสําหรับคอลัมน์ผลลัพธ์
labels
เลือกได้
สตริงอย่างน้อยหนึ่งรายการที่แสดงถึงชุดของป้ายชื่อความคิดเห็นเพื่อให้ตรงกับค่าข้อความที่ป้อน
error_col
เลือกได้
สตริงที่มีชื่อของคอลัมน์ใหม่เพื่อจัดเก็บข้อผิดพลาด OpenAI ที่เป็นผลมาจากการประมวลผลข้อความอินพุตแต่ละแถว ถ้าคุณไม่ได้ตั้งค่าพารามิเตอร์นี้ ชื่อเริ่มต้นจะถูกสร้างขึ้นสําหรับคอลัมน์ข้อผิดพลาด ถ้าแถวอินพุตไม่มีข้อผิดพลาด ค่าในคอลัมน์นี้จะ null

การส่งคืน

ฟังก์ชันส่งคืน Spark DataFrame ที่มีคอลัมน์ใหม่ที่มีป้ายกํากับความคิดเห็นที่ตรงกับแต่ละแถวของข้อความในคอลัมน์อินพุต ป้ายชื่อความคิดเห็นเริ่มต้นประกอบด้วย positive, negative, , neutralหรือmixed ถ้ามีการระบุป้ายชื่อแบบกําหนดเอง จะมีการใช้ป้ายชื่อเหล่านั้นแทน ถ้าไม่สามารถกําหนดความคิดเห็นได้ ค่าที่ส่งกลับจะถูก null

ตัวอย่าง

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

เซลล์โค้ดตัวอย่างนี้ให้ผลลัพธ์ต่อไปนี้:

สกรีนช็อตของกรอบข้อมูลที่มีคอลัมน์