แชร์ผ่าน


ใช้ ai.similarity กับแพนด้า

ฟังก์ชันนี้ ai.similarity ใช้ Generative AI เพื่อเปรียบเทียบนิพจน์สตริงสองนิพจน์ จากนั้นคํานวณคะแนนความคล้ายคลึงกันทางความหมาย ใช้โค้ดเพียงบรรทัดเดียว คุณสามารถเปรียบเทียบค่าข้อความจากคอลัมน์หนึ่งของ DataFrame ที่มีค่าข้อความทั่วไปเพียงค่าเดียว หรือเปรียบเทียบค่าข้อความเป็นคู่ในอีกคอลัมน์ได้

Note

Overview

ฟังก์ชันนี้ai.similarityขยายคลาส pandas Series

ในการคํานวณความคล้ายคลึงกันทางความหมายของแต่ละแถวอินพุตสําหรับค่าข้อความทั่วไปเพียงค่าเดียว ให้เรียกฟังก์ชันบนคอลัมน์ข้อความ Pandass DataFrame ฟังก์ชันนี้ยังสามารถคํานวณความคล้ายคลึงกันทางความหมายของแต่ละแถวสําหรับค่าคู่ที่สอดคล้องกันในคอลัมน์อื่นที่มีมิติเดียวกับคอลัมน์อินพุต

ฟังก์ชันจะส่งคืนชุดข้อมูลแพนด้าที่มีคะแนนความคล้ายคลึงกัน ซึ่งสามารถจัดเก็บไว้ในคอลัมน์ DataFrame ใหม่ได้

วากยสัมพันธ์

df["similarity"] = df["col1"].ai.similarity("value")

พารามิเตอร์

ชื่อ คำอธิบาย
other
จำเป็น
สตริงที่ประกอบด้วย:
- ค่าข้อความทั่วไปค่าเดียว ซึ่งใช้ในการคํานวณคะแนนความคล้ายคลึงกันสําหรับแต่ละแถวอินพุต
- ซีรี่ส์แพนด้า อีกตัวที่มีขนาดเท่ากับอินพุต ประกอบด้วยค่าข้อความที่จะใช้ในการคํานวณคะแนนความคล้ายคลึงกันแบบคู่สําหรับแต่ละแถวอินพุต

การส่งคืน

ฟังก์ชันจะส่งกลับชุด แพนด้า ที่มีคะแนนความคล้ายคลึงกันสําหรับแต่ละแถวข้อความที่ป้อนเข้า คะแนนความคล้ายคลึงกันของผลลัพธ์นั้นสัมพันธ์กันและใช้ได้ดีที่สุดสําหรับการจัดอันดับ ค่าคะแนนสามารถอยู่ในช่วงตั้งแต่ -1 (ตรงกันข้าม) ถึง 1* (เหมือนกัน) ค่าคะแนนของ บ่งชี้ 0 ว่าค่าไม่เกี่ยวข้องกันในความหมาย

ตัวอย่าง

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates"), 
        ("Satya Nadella"), 
        ("Joan of Arc")
    ], columns=["name"])
    
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)

เซลล์โค้ดตัวอย่างนี้ให้ผลลัพธ์ต่อไปนี้:

สกรีนช็อตของกรอบข้อมูลที่มีคอลัมน์ 'ชื่อ' และ 'ความคล้ายคลึงกัน' คอลัมน์ 'ความคล้ายคลึงกัน' ประกอบด้วยคะแนนความคล้ายคลึงกันสําหรับชื่อและคําที่ป้อน