Aracılığıyla paylaş


PySpark ile ai.fix_grammar kullanma

İşlev, ai.fix_grammar giriş metninin yazım, dil bilgisi ve noktalama işaretlerini tek bir kod satırıyla düzeltmek için üretken yapay zeka kullanır.

Uyarı

Genel Bakış

ai.fix_grammar İşlev, Spark DataFrames için kullanılabilir. Var olan bir giriş sütununun adını parametre olarak belirtmeniz gerekir.

İşlev, çıkış sütununda depolanan her giriş metin satırı için düzeltilmiş metin içeren yeni bir DataFrame döndürür.

Sözdizimi

df.ai.fix_grammar(input_col="input", output_col="corrections")

Parametreler

İsim Description
input_col
Gerekli
Yazım, dil bilgisi ve noktalama işaretlerini düzeltmek için giriş metin değerlerine sahip mevcut bir sütunun adını içeren dize .
output_col
Opsiyonel
Giriş metninin her satırı için düzeltilmiş metni depolamak için yeni bir sütunun adını içeren dize. Bu parametreyi ayarlamazsanız, çıkış sütunu için varsayılan bir ad oluşturur.
error_col
Opsiyonel
Giriş metninin her satırının işlenmesinden kaynaklanan OpenAI hatalarını depolamak için yeni sütunun adını içeren bir dizesi. Bu parametreyi ayarlamazsanız hata sütunu için varsayılan bir ad oluşturur. Bir giriş satırı için hata yoksa, bu sütundaki değer nullolur.

İade

İşlev, giriş sütunundaki her metin satırı için düzeltilmiş metin içeren yeni bir sütun içeren bir Spark DataFrame döndürür. Giriş metni nullise, sonuç nullolur.

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

results = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(results)

Bu örnek kod hücresi aşağıdaki çıkışı sağlar:

'Metin' sütununda bulunan metnin dilbilgisi açısından düzeltilmiş hâlini içeren bir 'düzeltmeler' sütunu bulunan veri çerçevesini gösteren ekran görüntüsü.