Delen via


Grammatica herstellen met de functie ai.fix_grammar

De functie ai.fix_grammar maakt gebruik van Generatieve AI om de spelling, grammatica en interpunctie van invoertekst te corrigeren, allemaal met één regel code.

AI-functies versterken data-engineering door de kracht van de grote ingebouwde taalmodellen van Fabric direct beschikbaar voor u te maken. Voor meer informatie, bezoek dit overzichtsartikel.

Belangrijk

Deze functie bevindt zich in preview-, voor gebruik in de runtime van Fabric 1.3 en hoger.

  • Bekijk de vereisten in dit overzichtsartikel, inclusief de bibliotheekinstallaties die tijdelijk nodig zijn voor het gebruik van AI-functies.
  • AI-functies worden momenteel aangedreven door het gpt-3.5-turbo (0125) model. Ga naar dit artikelvoor meer informatie over facturerings- en verbruikstarieven.
  • Hoewel het onderliggende model verschillende talen kan verwerken, zijn de meeste AI-functies geoptimaliseerd voor gebruik op Engelse teksten.
  • Tijdens de eerste implementatie van AI-functies zijn gebruikers tijdelijk beperkt tot 1000 aanvragen per minuut met het ingebouwde AI-eindpunt van Fabric.

ai.fix_grammar gebruiken met pandas

De functie ai.fix_grammar breidt de pandas Series klasse uit. Roep de functie aan op een pandas DataFrame tekstkolom om de spelling, grammatica en interpunctie van elke rij met invoer te corrigeren.

De functie retourneert een pandas-reeks die gecorrigeerde tekstwaarden bevat, die kunnen worden opgeslagen in een nieuwe DataFrame-kolom.

Syntaxis

df["corrections"] = df["text"].ai.fix_grammar()

Parameters

Geen

Retourneren

De functie retourneert een pandas Series die gecorrigeerde tekst bevat voor elke invoertekstregel. Als de invoertekst nullis, wordt het resultaat null.

Voorbeeld

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = pd.DataFrame([
        "There are an error here.",
        "She and me go weigh back. We used to hang out every weeks.",
        "The big picture are right, but you're details is all wrong."
    ], columns=["text"])

df["corrections"] = df["text"].ai.fix_grammar()
display(df)

ai.fix_grammar gebruiken met PySpark

De functie ai.fix_grammar is ook beschikbaar voor Spark DataFrames. De naam van een bestaande invoerkolom moet worden opgegeven als parameter.

De functie retourneert een nieuw DataFrame, met gecorrigeerde tekst voor elke invoertekstrij die is opgeslagen in een uitvoerkolom.

Syntaxis

df.ai.fix_grammar(input_col="text", output_col="corrections")

Parameters

naam Beschrijving
input_col
Vereist
Een tekenreeks met de naam van een bestaande kolom met invoertekstwaarden die moeten worden gecorrigeerd voor spelling, grammatica en leestekens.
output_col
Facultatief
Een tekenreeks met de naam van een nieuwe kolom voor het opslaan van gecorrigeerde tekst voor elke rij invoertekst. Als deze parameter niet is ingesteld, wordt er een standaardnaam gegenereerd voor de uitvoerkolom.
error_col
Facultatief
Een tekenreeks met de naam van een nieuwe kolom om openAI-fouten op te slaan die het gevolg zijn van het verwerken van elke rij invoertekst. Als deze parameter niet is ingesteld, wordt er een standaardnaam gegenereerd voor de foutkolom. Als er geen fouten zijn voor een rij met invoer, wordt de waarde in deze kolom null.

Retouren

Een Spark DataFrame met een nieuwe kolom met gecorrigeerde tekst voor elke rij met tekst in de invoerkolom. Als de invoertekst nullis, wordt het resultaat null.

Voorbeeld

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

results = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(results)