Transformación y enriquecimiento de datos con funciones de IA

Microsoft Fabric AI Functions permite a todos los profesionales empresariales (de desarrolladores a analistas) transformar y enriquecer sus datos empresariales mediante inteligencia artificial generativa.

Las funciones de IA usan modelos de lenguaje grandes (LLM) líderes del sector para resumir, clasificar, generar texto, etc. Con una sola línea de código, puede:

ai.analyze_sentiment: detecta el estado emocional del texto de entrada.
ai.classify: clasifica el texto de entrada según las etiquetas.
ai.embed: genere incrustaciones de vectores para el texto de entrada.
ai.extract: extraiga tipos específicos de información del texto de entrada (por ejemplo, ubicaciones o nombres).
ai.fix_grammar: corrija la ortografía, la gramática y la puntuación del texto de entrada.
ai.generate_response: genera respuestas basadas en tus propias instrucciones.
ai.similarity: compare el significado del texto de entrada con un solo valor de texto o con texto en otra columna.
ai.summarize: obtiene resúmenes de texto de entrada.
ai.translate: traduzca texto de entrada en otro idioma.

Puede incorporar estas funciones como parte de los flujos de trabajo de ciencia de datos e ingeniería de datos, tanto si está trabajando con Pandas como con Spark. No hay ninguna configuración detallada y ninguna administración compleja de la infraestructura. No necesita ninguna experiencia técnica específica.

Las funciones de inteligencia artificial también admiten entrada multimodal, lo que permite procesar imágenes, archivos PDF y archivos de texto además de los datos de texto. Los tipos de archivo admitidos incluyen JPG/JPEG, PNG, GIF, WebP (imágenes), PDF (documentos) y formatos de texto comunes, como MD, TXT, CSV, JSON y XML. La mayoría de las funciones de IA pueden procesar entradas de ruta de acceso de archivo cuando se especifica column_type="path". Para obtener más información sobre la configuración y el uso de las interfaces de usuario, consulte Uso de la entrada multimodal con funciones de IA.

Prerequisites

Para usar las funciones de IA con el punto de conexión de IA integrado en Fabric, el administrador debe habilitar el conmutador de cliente para Copilot y otras características impulsadas por Azure OpenAI.
En función de la ubicación, es posible que tenga que habilitar una configuración de inquilino para el procesamiento entre regiones geográficas. Obtenga más información sobre las regiones disponibles para el servicio Azure OpenAI.
Necesita una capacidad de pago de Fabric (F2 o superior, o cualquier edición P).

Note

Las funciones de IA se admiten en Fabric Runtime 1.3 y versiones posteriores.
A menos que configure un modelo diferente, las funciones de IA de forma predeterminada son gpt-4.1-mini. Obtenga más información sobre las tarifas de facturación y consumo.
Aunque el modelo subyacente puede controlar varios lenguajes, la mayoría de las funciones de IA están optimizadas para su uso en textos en inglés".

Modelos y proveedores

Las funciones de IA ahora admiten modelos y proveedores más amplios más allá de los modelos predeterminados de Azure OpenAI. Puede configurar las funciones de inteligencia artificial para que usen:

Modelos de Azure OpenAI
Recursos de Microsoft Foundry (incluidos modelos como Claude y LLaMA)

La selección de modelos y proveedores se puede configurar a través de la configuración de las funciones de IA. Para más información sobre cómo configurar y configurar diferentes modelos y proveedores, consulte la documentación de configuración de pandas y PySpark.

Introducción a las funciones de IA

Las funciones de IA se pueden usar con pandas (entornos de ejecución de Python y PySpark) y con PySpark (entorno de ejecución de PySpark). Los pasos de instalación e importación necesarios para cada uno se describen en la sección siguiente, seguido de los comandos correspondientes.

Rendimiento y simultaneidad

Las funciones de inteligencia artificial ahora se ejecutan con una mayor simultaneidad predeterminada de 200, lo que permite un procesamiento paralelo más rápido de las operaciones de IA. Puede ajustar la configuración de simultaneidad por carga de trabajo para optimizar el rendimiento en función de sus requisitos específicos. Para obtener más información sobre cómo configurar la simultaneidad y otras opciones relacionadas con el rendimiento, consulte la documentación de configuración de Pandas y PySpark.

Instalación de dependencias

Pandas (tiempo de ejecución de Python)
- synapseml_internal y synapseml_core instalación de archivos whl necesaria (comandos proporcionados en la siguiente celda de código)
- openai se requiere la instalación del paquete (comando proporcionado en la siguiente celda de código)
Pandas (entorno de ejecución de PySpark)
- openai se requiere la instalación del paquete (comando proporcionado en la siguiente celda de código)
PySpark (entorno de ejecución de PySpark)
- No se necesita instalación

pandas (tiempo de ejecución de PySpark)
pandas (tiempo de ejecución de Python)

# The pandas AI functions package requires OpenAI version 1.99.5 or later
%pip install -q openai 2>/dev/null

# Install latest versions of AI functions library whl
!wget -q https://aka.ms/fabric-aifunctions-whl -O synapseml_internal-latest-py3-none-any.whl
!wget -q https://aka.ms/fabric-synapseml-core-whl -O synapseml_core-latest-py3-none-any.whl

# The pandas AI functions package requires OpenAI version 1.99.5 or later
%pip install -q openai synapseml_internal-latest-py3-none-any.whl synapseml_core-latest-py3-none-any.whl

Importación de bibliotecas necesarias

La celda de código siguiente importa la biblioteca de funciones de IA y sus dependencias.

pandas
PySpark

# Required imports
import synapse.ml.aifunc as aifunc
import pandas as pd

import synapse.ml.spark.aifunc as aifunc

# SparkSession with accessor `spark` in PySpark environments is pre-setup and available for use

Funciones auxiliares para la ingestión de archivos y el esquema de datos

Las funciones de IA incluyen funciones auxiliares que simplifican los flujos de trabajo multimodales al simplificar la ingesta de archivos y la administración de esquemas:

aifunc.load: ingerir archivos de una carpeta en una tabla estructurada. Opcionalmente, puede proporcionar una solicitud para guiar la extracción o un esquema para una estructura coherente.
aifunc.list_file_paths: enumera las direcciones URL de archivo y las rutas de acceso de una carpeta para usarlas como entrada para cualquier función de IA.
ai.infer_schema: inferir un esquema de extracción del contenido del archivo. El esquema inferido es compatible con ai.extract, por lo que puede pasarlo directamente para la extracción de datos estructurados.

Para obtener información detallada sobre la sintaxis y los ejemplos, consulte Uso de la entrada multiplataforma con funciones de IA.

Aplicación de funciones de IA

Cada una de las siguientes funciones permite invocar el punto de conexión de IA integrado en Fabric para transformar y enriquecer los datos con una sola línea de código. Puede usar funciones de inteligencia artificial para analizar DataFrames de Pandas o DataFrames de Spark. Las llamadas a funciones de IA de PySpark (incluidas ai.extract) se ejecutan distribuidas entre clústeres de Fabric Spark, lo que permite el procesamiento escalable de grandes conjuntos de datos. Para ver las opciones de optimización del rendimiento, consulte la documentación de configuración de PySpark .

Note

La mayoría de las funciones de IA ahora admiten entradas de rutas de acceso de archivo a través de column_type="path" (pandas) o input_col_type/col_types="path" (PySpark). Esto permite el procesamiento directo de imágenes y PDFs sin cargar bytes sin procesar. Para conocer los patrones de uso, consulte Uso de entradas multimodales con funciones de IA.

Tip

Aprenda a personalizar la configuración de las funciones de IA.

Configuración avanzada: al usar modelos de familia gpt-5, puede configurar opciones avanzadas como reasoning_effort y verbosity. Consulte las páginas de configuración de Pandas y PySpark para obtener más información sobre cómo establecer estas opciones.

Detectar sentimiento con ai.analyze_sentiment

La ai.analyze_sentiment función invoca a la inteligencia artificial para identificar si el estado emocional expresado por texto de entrada es positivo, negativo, mixto o neutro. Si la inteligencia artificial no puede realizar esta determinación, la salida se deja en blanco. Para obtener instrucciones más detalladas sobre el uso de ai.analyze_sentiment con pandas, consulte este artículo. Para usar ai.analyze_sentiment con PySpark, consulte este artículo.

Parámetros opcionales

La ai.analyze_sentiment función ahora admite parámetros opcionales adicionales que permiten personalizar el comportamiento del análisis de sentimiento. Estos parámetros proporcionan más control sobre cómo se detecta y notifica la opinión. Para más información sobre los parámetros disponibles, sus descripciones y valores predeterminados, consulte la documentación específica de la función para pandas y PySpark.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "The cleaning spray permanently stained my beautiful kitchen counter. Never again!",
        "I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",
        "I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",
        "The umbrella is OK, I guess."
    ], columns=["reviews"])

df["sentiment"] = df["reviews"].ai.analyze_sentiment()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Clasificar texto con ai.classify

La ai.classify función invoca la inteligencia artificial para clasificar el texto de entrada según las etiquetas personalizadas que elija. Para obtener más información sobre el uso de ai.classify con pandas, vaya a este artículo. Para usar ai.classify con PySpark, consulte este artículo.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])

df["category"] = df['descriptions'].ai.classify("kitchen", "bedroom", "garage", "other")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
    ], ["descriptions"])
    
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)

Generación de incrustaciones de vectores con ai.embed

La función ai.embed invoca la IA para generar embeddings vectoriales del texto de entrada. Las inserciones vectoriales son representaciones numéricas de texto que capturan significado semántico, lo que hace que sean útiles para la búsqueda de similitud, los flujos de trabajo de recuperación y otras tareas de aprendizaje automático. La dimensionalidad de los vectores de inserción depende del modelo seleccionado. Para obtener instrucciones más detalladas sobre el uso de ai.embed con pandas, consulte este artículo. Para usar ai.embed con PySpark, consulte este artículo.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",), 
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",), 
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",) 
    ], ["descriptions"])

embed = df.ai.embed(input_col="descriptions", output_col="embed")
display(embed)

Extracción de entidades con ai.extract

La ai.extract función invoca la inteligencia artificial para examinar el texto de entrada y extraer tipos específicos de información designados por etiquetas que elija (por ejemplo, ubicaciones o nombres). Para obtener instrucciones más detalladas sobre el uso de ai.extract con pandas, consulte este artículo. Para usar ai.extract con PySpark, consulte este artículo.

Etiquetas estructuradas

La ai.extract función admite definiciones de etiquetas estructuradas a través del ExtractLabel esquema. Puede proporcionar etiquetas con definiciones estructuradas que incluyan no solo el nombre de la etiqueta, sino también la información de tipos y los atributos. Las definiciones de etiqueta pueden combinar nombres de etiqueta simples (cadenas) con objetos enlazados a esquema a través de ExtractLabel. Este enfoque estructurado mejora la coherencia de extracción y permite que la función devuelva columnas de salida estructuradas correspondientes. Por ejemplo, puede especificar etiquetas con metadatos adicionales para guiar el proceso de extracción de forma más precisa.

ExtractLabel acepta definiciones de esquema JSON completas y aplica la estructura en la salida extraída. Las construcciones de esquema admitidas incluyen campos con tipo, enumeraciones, matrices (a través de items), objetos con properties, valores que pueden ser NULL (por ejemplo, type=["string", "null"]), propiedades de required y additionalProperties=false para prohibir campos adicionales. Las columnas devueltas (o estructuras) se adhieren al esquema proporcionado. Cuando se proporciona un esquema estricto (por ejemplo, con required propiedades o additionalProperties=false), las salidas que no cumplen se muestran como excepciones en el resultado y se reflejan en ai.stats.

También puede crear esquemas como modelos de Pydantic y convertirlos en esquema JSON para usarlos con ExtractLabel. Para obtener ejemplos detallados y patrones de uso, consulte la documentación de Pandas y PySpark.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "MJ Lee lives in Tucson, AZ, and works as a software engineer for Microsoft.",
        "Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey."
    ], columns=["descriptions"])

df_entities = df["descriptions"].ai.extract("name", "profession", "city")
display(df_entities)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("MJ Lee lives in Tucson, AZ, and works as a software engineer for Microsoft.",),
        ("Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey.",)
    ], ["descriptions"])

df_entities = df.ai.extract(labels=["name", "profession", "city"], input_col="descriptions")
display(df_entities)

Corrección de la gramática con ai.fix_grammar

La función ai.fix_grammar invoca a la IA para corregir errores de ortografía, gramática y puntuación del texto de entrada. Para obtener instrucciones más detalladas sobre el uso de ai.fix_grammar con pandas, consulte este artículo. Para usar ai.fix_grammar con PySpark, consulte este artículo.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "There are an error here.",
        "She and me go weigh back. We used to hang out every weeks.",
        "The big picture are right, but you're details is all wrong."
    ], columns=["text"])

df["corrections"] = df["text"].ai.fix_grammar()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

corrections = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(corrections)

Responder a las solicitudes de usuario personalizadas con ai.generate_response

La ai.generate_response función invoca la inteligencia artificial para generar texto personalizado en función de sus propias instrucciones. Para obtener instrucciones más detalladas sobre el uso de ai.generate_response con pandas, consulte este artículo. Para usar ai.generate_response con PySpark, consulte este artículo.

Parámetros opcionales

La ai.generate_response función ahora admite un response_format parámetro que permite solicitar una salida JSON estructurada. Puede especificar response_format='json' que reciba respuestas en formato JSON. Además, puede proporcionar un esquema JSON para aplicar una estructura de salida específica, lo que garantiza que la respuesta generada se ajusta a la forma de datos esperada. Esto es especialmente útil cuando se necesita una salida predecible y legible por máquina de la función de IA. Para obtener ejemplos detallados y patrones de uso, consulte la documentación de Pandas y PySpark.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        ("Scarves"),
        ("Snow pants"),
        ("Ski goggles")
    ], columns=["product"])

df["response"] = df.ai.generate_response("Write a short, punchy email subject line for a winter sale.")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Scarves",),
        ("Snow pants",),
        ("Ski goggles",)
    ], ["product"])

responses = df.ai.generate_response(prompt="Write a short, punchy email subject line for a winter sale.", output_col="response")
display(responses)

Calcular la similitud con ai.similarity

La ai.similarity función compara cada valor de texto de entrada con un texto de referencia común o con el valor correspondiente en otra columna (modo en pares). Los valores de puntuación de similitud de salida son relativos y pueden oscilar entre -1 (opuestos) y 1 (idénticos). Una puntuación de 0 indica que los valores no están relacionados en el significado. Para obtener instrucciones más detalladas sobre el uso de ai.similarity con pandas, consulte este artículo. Para usar ai.similarity con PySpark, consulte este artículo.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([ 
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture") 
    ], columns=["names", "industries"])
    
df["similarity"] = df["names"].ai.similarity(df["industries"])
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture")
    ], ["names", "industries"])

similarity = df.ai.similarity(input_col="names", other_col="industries", output_col="similarity")
display(similarity)

Resumir texto usando la función ai.summarize

ai.summarize La función invoca IA para generar resúmenes de texto de entrada (ya sea de los valores de una sola columna de un DataFrame o de los valores de fila en todas las columnas). Para obtener instrucciones más detalladas sobre el uso de ai.summarize con pandas, consulte este artículo. Para usar ai.summarize con PySpark, consulte este artículo.

Personalización de resúmenes con instrucciones

La ai.summarize función ahora admite un instructions parámetro que permite dirigir el tono, la longitud y el foco de los resúmenes generados. Puede proporcionar instrucciones personalizadas para guiar cómo se debe crear el resumen, como especificar un estilo determinado, una audiencia de destino o un nivel de detalle. Cuando no se proporcionan instrucciones, la función usa el comportamiento de resumen predeterminado. Para obtener ejemplos de uso del instructions parámetro , consulte la documentación detallada de Pandas y PySpark.

pandas
PySpark

# This code uses AI. Always review output for mistakes.

df= pd.DataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """)
    ], columns=["product", "release_year", "description"])

df["summaries"] = df["description"].ai.summarize()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """,),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """,)
    ], ["product", "release_year", "description"])

summaries = df.ai.summarize(input_col="description", output_col="summary")
display(summaries)

Traducción de texto con ai.translate

La función ai.translate invoca IA para traducir texto de entrada a un nuevo idioma que elija. Para obtener instrucciones más detalladas sobre el uso de ai.translate con pandas, consulte este artículo. Para usar ai.translate con PySpark, consulte este artículo.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "Hello! How are you doing today?", 
        "Tell me what you'd like to know, and I'll do my best to help.", 
        "The only thing we have to fear is fear itself."
    ], columns=["text"])

df["translations"] = df["text"].ai.translate("spanish")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

Visualización de estadísticas de uso con ai.stats

Las funciones de FABRIC AI proporcionan una manera integrada de inspeccionar las estadísticas de uso y ejecución de cualquier serie o dataframe generada por IA. Puede acceder a estas métricas llamando al resultado ai.stats devuelto por una función de IA.

ai.stats devuelve un DataFrame con las columnas siguientes:

num_successful: número de filas procesadas correctamente por la función de IA.
num_exceptions: número de filas que encontraron una excepción durante la ejecución. Estas filas se representan como instancias de aifunc.ExceptionResult.
num_unevaluated: número de filas que no se procesaron porque una excepción anterior hizo imposible continuar la evaluación. Estas filas son instancias de aifunc.NotEvaluatedResult.
num_harmful: número de filas bloqueadas por el filtro de contenido de Azure OpenAI. Estas filas son instancias de aifunc.FilterResult.
prompt_tokens: número total de tokens de entrada usados para la llamada a la función de IA.
completion_tokens: número total de tokens de salida generados por el modelo.

Tip

Puede llamar a ai.stats en cualquier serie o dataframe devuelto por una función de IA. Esto puede ayudarle a realizar un seguimiento del uso, comprender los patrones de error y supervisar el consumo de tokens.

Transparencia de costos

Las funciones de IA incluyen una calculadora configurable de costos de barra de progreso que muestra las estimaciones de tokens en tiempo real y las unidades de capacidad durante la ejecución. Puede establecer la calculadora en uno de los tres modos:

basic: muestra un resumen de los tokens estimados y las unidades de capacidad consumidas.
estadísticas: muestra estadísticas detalladas por llamada, incluidos los recuentos de tokens de entrada y salida.
disable: apaga la visualización del costo de la barra de progreso.

Para obtener más información sobre cómo configurar estos modos, consulte la documentación de configuración de Pandas y PySpark.

La aplicación De métricas de capacidad de Fabric ahora incluye una operación dedicada de AI Functions que separa el uso de funciones de IA de Spark y Dataflows Gen2, lo que proporciona una supervisión más clara del consumo de capacidad relacionado con la inteligencia artificial. Para obtener más información, consulte ¿Qué es la aplicación Métricas de capacidad de Microsoft Fabric?

Evaluación y aceleración

Los cuadernos de evaluación están disponibles para evaluar la calidad de la salida de la función de IA. Estos cuadernos usan LLM-como-un-Juez para calcular métricas como exactitud, precisión, recuperación, F1, coherencia, consistencia y relevancia. Puede usar estos flujos de trabajo para validar los resultados antes de realizar la implementación en producción. Los cuadernos de inicio también están disponibles, lo que proporciona ejemplos de un extremo a otro que muestran la ingesta de archivos, la inferencia de esquemas y la extracción para ayudarle a empezar a trabajar rápidamente.

Detecte opiniones con ai.analyze_sentiment in pandas o ai.analyze_sentiment in pyspark.
Clasificar texto con ai.classify in pandas o ai.classify in PySpark.
Genere incrustaciones de vectores con ai.embed in pandas o ai.embed in PySpark.
Extraiga entidades con ai.extract in pandas o ai.extract in PySpark.
Corrija la gramática con ai.fix_grammar in pandas o ai.fix_grammar in PySpark.
Responda a las solicitudes de usuario personalizadas con ai.generate_response in pandas o ai.generate_response in PySpark.
Calcule la similitud con ai.similarity in pandas o ai.similarity in PySpark.
Resumir texto con ai.summarize in pandas o ai.summarize in PySpark.
Traduzca texto con ai.translate in pandas o ai.translate in PySpark.
Personalice la configuración de las funciones de IA en pandas o la configuración de las funciones de IA en PySpark.
Use la entrada multimodal con funciones de IA para procesar imágenes, ARCHIVOS PDF y archivos de texto.
¿Perdimos una característica que necesita? Sugerirlo en el foro de Ideas de Fabric.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-03-31

Transformación y enriquecimiento de datos con funciones de IA

Prerequisites

Modelos y proveedores

Introducción a las funciones de IA

Rendimiento y simultaneidad

Instalación de dependencias

Importación de bibliotecas necesarias

Funciones auxiliares para la ingestión de archivos y el esquema de datos

Aplicación de funciones de IA

Detectar sentimiento con ai.analyze_sentiment

Parámetros opcionales

Clasificar texto con ai.classify

Generación de incrustaciones de vectores con ai.embed

Extracción de entidades con ai.extract

Etiquetas estructuradas

Corrección de la gramática con ai.fix_grammar

Responder a las solicitudes de usuario personalizadas con ai.generate_response

Parámetros opcionales

Calcular la similitud con ai.similarity

Resumir texto usando la función ai.summarize

Personalización de resúmenes con instrucciones

Traducción de texto con ai.translate

Visualización de estadísticas de uso con ai.stats

Transparencia de costos

Evaluación y aceleración

Contenido relacionado

Comentarios

Recursos adicionales