ใช้ ai.similarity กับแพนด้า

ฟังก์ชันนี้ ai.similarity ใช้ Generative AI เพื่อเปรียบเทียบนิพจน์สตริงสองนิพจน์ จากนั้นคํานวณคะแนนความคล้ายคลึงกันทางความหมาย ใช้โค้ดเพียงบรรทัดเดียว คุณสามารถเปรียบเทียบค่าข้อความจากคอลัมน์หนึ่งของ DataFrame ที่มีค่าข้อความทั่วไปเพียงค่าเดียว หรือเปรียบเทียบค่าข้อความเป็นคู่ในอีกคอลัมน์ได้

Note

บทความนี้ครอบคลุมการใช้ ai.similarity กับแพนด้า หากต้องการใช้ ai.similarity กับ PySpark โปรดดูบทความนี้
ดูฟังก์ชัน AI อื่นๆ ในบทความภาพรวมนี้
เรียนรู้วิธีปรับแต่งการกําหนดค่าของฟังก์ชัน AI

Overview

ฟังก์ชันนี้ai.similarityขยายคลาส pandas Series

ในการคํานวณความคล้ายคลึงกันทางความหมายของแต่ละแถวอินพุตสําหรับค่าข้อความทั่วไปเพียงค่าเดียว ให้เรียกฟังก์ชันบนคอลัมน์ข้อความ Pandass DataFrame ฟังก์ชันนี้ยังสามารถคํานวณความคล้ายคลึงกันทางความหมายของแต่ละแถวสําหรับค่าคู่ที่สอดคล้องกันในคอลัมน์อื่นที่มีมิติเดียวกับคอลัมน์อินพุต

ฟังก์ชันจะส่งคืนชุดข้อมูลแพนด้าที่มีคะแนนความคล้ายคลึงกัน ซึ่งสามารถจัดเก็บไว้ในคอลัมน์ DataFrame ใหม่ได้

df["similarity"] = df["col1"].ai.similarity("value")

df["similarity"] = df["col1"].ai.similarity(df["col2"])

พารามิเตอร์

ชื่อ คำอธิบาย

other
จำเป็น สตริงที่ประกอบด้วย:
- ค่าข้อความทั่วไปค่าเดียว ซึ่งใช้ในการคํานวณคะแนนความคล้ายคลึงกันสําหรับแต่ละแถวอินพุต
- ซีรี่ส์แพนด้า อีกตัวที่มีขนาดเท่ากับอินพุต ประกอบด้วยค่าข้อความที่จะใช้ในการคํานวณคะแนนความคล้ายคลึงกันแบบคู่สําหรับแต่ละแถวอินพุต

ชื่อ	คำอธิบาย
`other` จำเป็น	สตริงที่ประกอบด้วย: - ค่าข้อความทั่วไปค่าเดียว ซึ่งใช้ในการคํานวณคะแนนความคล้ายคลึงกันสําหรับแต่ละแถวอินพุต - ซีรี่ส์แพนด้า อีกตัวที่มีขนาดเท่ากับอินพุต ประกอบด้วยค่าข้อความที่จะใช้ในการคํานวณคะแนนความคล้ายคลึงกันแบบคู่สําหรับแต่ละแถวอินพุต

การส่งคืน

ฟังก์ชันจะส่งกลับชุด แพนด้า ที่มีคะแนนความคล้ายคลึงกันสําหรับแต่ละแถวข้อความที่ป้อนเข้า คะแนนความคล้ายคลึงกันของผลลัพธ์นั้นสัมพันธ์กันและใช้ได้ดีที่สุดสําหรับการจัดอันดับ ค่าคะแนนสามารถอยู่ในช่วงตั้งแต่ -1 (ตรงกันข้าม) ถึง 1* (เหมือนกัน) ค่าคะแนนของ บ่งชี้ 0 ว่าค่าไม่เกี่ยวข้องกันในความหมาย

ตัวอย่าง

เปรียบเทียบกับค่าเดียว
เปรียบเทียบกับค่าแบบคู่

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates"), 
        ("Satya Nadella"), 
        ("Joan of Arc")
    ], columns=["name"])
    
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)

เซลล์โค้ดตัวอย่างนี้ให้ผลลัพธ์ต่อไปนี้:

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture") 
    ], columns=["names", "industries"])
    
df["similarity"] = df["names"].ai.similarity(df["industries"])
display(df)

เซลล์โค้ดตัวอย่างนี้ให้ผลลัพธ์ต่อไปนี้:

ใช้ ai.similarity กับ PySpark
ตรวจจับความรู้สึกด้วย ai.analyze_sentiment
จัดหมวดหมู่ข้อความด้วย ai.classify
สร้างการฝังเวกเตอร์ด้วย ai.embed
แยกเอนทิตีด้วย ai_extract
แก้ไขไวยากรณ์ด้วย ai.fix_grammar
ตอบข้อความแจ้งของผู้ใช้ที่กําหนดเองด้วย ai.generate_response
สรุปข้อความด้วย ai.summarize
แปลข้อความด้วย ai.translate
เรียนรู้เพิ่มเติมเกี่ยวกับฟังก์ชัน AI ครบชุด
ปรับแต่งการกําหนดค่าของฟังก์ชัน AI
เราพลาดคุณลักษณะที่คุณต้องการหรือไม่ แนะนําได้ที่ ฟอรั่ม Fabric Ideas

คำติชม

หน้านี้มีประโยชน์หรือไม่

Last updated on 2025-11-13