แชร์ผ่าน


ใช้ ai.fix_grammar กับ PySpark

ฟังก์ชันนี้ ai.fix_grammar ใช้ Generative AI เพื่อแก้ไขการสะกดคํา ไวยากรณ์ และเครื่องหมายวรรคตอนของข้อความที่ป้อนด้วยโค้ดบรรทัดเดียว

Note

Overview

ฟังก์ชันนี้ai.fix_grammarพร้อมใช้งานสําหรับ Spark DataFrames คุณต้องระบุชื่อของคอลัมน์อินพุตที่มีอยู่เป็นพารามิเตอร์

ฟังก์ชันจะส่งคืน DataFrame ใหม่ที่มีข้อความที่แก้ไขแล้วสําหรับแต่ละแถวข้อความอินพุต ซึ่งจัดเก็บไว้ในคอลัมน์เอาต์พุต

วากยสัมพันธ์

df.ai.fix_grammar(input_col="input", output_col="corrections")

พารามิเตอร์

ชื่อ คำอธิบาย
input_col
จำเป็น
สตริงที่มีชื่อของคอลัมน์ที่มีอยู่พร้อมค่าข้อความที่ป้อนเพื่อแก้ไขการสะกด ไวยากรณ์ และเครื่องหมายวรรคตอน
output_col
เลือกได้
สตริงที่มีชื่อของคอลัมน์ใหม่เพื่อจัดเก็บข้อความที่แก้ไขแล้วสําหรับแต่ละแถวของข้อความที่ป้อนเข้า ถ้าคุณไม่ได้ตั้งค่าพารามิเตอร์นี้ ชื่อเริ่มต้นจะถูกสร้างขึ้นสําหรับคอลัมน์ผลลัพธ์
error_col
เลือกได้
สตริงที่มีชื่อของคอลัมน์ใหม่เพื่อจัดเก็บข้อผิดพลาด OpenAI ที่เป็นผลมาจากการประมวลผลข้อความอินพุตแต่ละแถว ถ้าคุณไม่ได้ตั้งค่าพารามิเตอร์นี้ ชื่อเริ่มต้นจะถูกสร้างขึ้นสําหรับคอลัมน์ข้อผิดพลาด ถ้าไม่มีข้อผิดพลาดสําหรับแถวของการป้อนข้อมูล ค่าในคอลัมน์นี้จะ null

การส่งคืน

ฟังก์ชันนี้ส่งคืน Spark DataFrame ที่มีคอลัมน์ใหม่ที่มีข้อความที่แก้ไขแล้วสําหรับแต่ละแถวของข้อความในคอลัมน์อินพุต ถ้าข้อความที่ป้อนเข้าถูก nullผลลัพธ์จะเป็น null

ตัวอย่าง

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

results = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(results)

เซลล์โค้ดตัวอย่างนี้ให้ผลลัพธ์ต่อไปนี้:

ภาพหน้าจอแสดงกรอบข้อมูลที่มีคอลัมน์ 'ข้อความ' และคอลัมน์ 'การแก้ไข' ซึ่งมีข้อความจากคอลัมน์ข้อความที่มีไวยากรณ์ที่แก้ไขแล้ว