Zdieľať cez


Preklad textu pomocou funkcie ai.translate

Funkcia ai.translate používa Generatívnu umelú inteligenciu na preloženie vstupného textu do nového jazyka podľa vášho výberu – to všetko s jedným riadkom kódu.

Strojárstvo údajov preplňovania funkcií AI tým, že do rúk dáva výkon vstavaných modelov veľkých jazykov služby Fabric. Ďalšie informácie nájdete článku s prehľadom.

Dôležitý

Táto funkcia je v ukážkena použitie v runtime služby Fabric 1.3 a novších verziách.

  • Prečítajte si požiadavky uvedené v článku s prehľadomvrátane inštalácií knižnice , ktoré sú dočasne potrebné na používanie funkcií AI.
  • V predvolenom nastavení sú funkcie AI aktuálne napájané modelom gpt-3.5-turbo (0125). Ďalšie informácie o vyúčtovaní a spotrebných sadzbách nájdete v tomto článku.
  • Napriek tomu, že základný model dokáže pracovať v niekoľkých jazykoch, väčšina funkcií AI je optimalizovaná na používanie v textoch v anglickom jazyku.
  • Počas počiatočného zavádzania funkcií AI sú používatelia dočasne obmedzení na 1 000 žiadostí za minútu so vstavaným koncovým bodom AI služby Fabric.

Tip

Funkcia ai.translate bola testovaná v 10 jazykoch: české, angličtinafínčinafrancúzskenemčinagréčtinataliančina, poľskej, španielčinaa švédska. Výsledky v iných jazykoch sa môžu líšiť.

Použitie ai.translate s pandas

Funkcia ai.translate rozširuje triedu pandas series. Zavolajte funkciu na pandas DataFrame textovom stĺpci, aby sa každý vstupný riadok preložil do cieľového jazyka, ktorý ste si vybrali.

Funkcia vráti pandas series, ktorá obsahuje preklady, ktoré môžete uložiť v novom stĺpci Údajového rámca.

Syntax

df["translations"] = df["text"].ai.translate("target_language")

Parametre

Názov popisu
to_lang
Požadovaný
Reťazec predstavujúci cieľový jazyk na textové preklady.

Vráti

pandas series, ktorá obsahuje preklady pre každý riadok vstupného textu. Ak je vstupný text null, výsledok je null.

Príklad

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = pd.DataFrame([
        "Hello! How are you doing today?", 
        "Tell me what you'd like to know, and I'll do my best to help.", 
        "The only thing we have to fear is fear itself."
    ], columns=["text"])

df["translations"] = df["text"].ai.translate("spanish")
display(df)

Použitie ai.translate v PySparku

Funkcia ai.translate je k dispozícii aj pre Údajové rámce služby Spark. Musíte zadať existujúci názov vstupného stĺpca ako parameter spolu s cieľovým jazykom.

Funkcia vráti nový údajový rámec s prekladmi pre každý vstupný textový riadok uložený vo výstupnom stĺpci.

Syntax

df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")

Parametre

Názov popisu
to_lang
Požadovaný
reťazca, ktorý predstavuje cieľový jazyk pre textové preklady.
input_col
Požadovaný
Reťazec , ktorý obsahuje názov existujúceho stĺpca so vstupnými textovými hodnotami, ktoré sa majú preložiť.
output_col
Voliteľný
reťazca, ktorý obsahuje názov nového stĺpca, ktorý ukladá preklady pre každý vstupný textový riadok. Ak tento parameter nie je nastavený, pre výstupný stĺpec sa vygeneruje predvolený názov.
error_col
Voliteľný
Reťazec , ktorý obsahuje názov nového stĺpca, v ktorom sú uložené všetky chyby typu OpenAI, ktoré sú výsledkom spracovania každého riadka vstupného textu. Ak tento parameter nie je nastavený, pre stĺpec chyby sa vygeneruje predvolený názov. Ak vstupný riadok neobsahuje žiadne chyby, hodnota v tomto stĺpci je null.

Vráti

Údajový rámec Spark s novým stĺpcom, ktorý obsahuje preklady textu v riadku vstupného stĺpca. Ak je vstupný text null, výsledok je null.

Príklad

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)