Partilhar via


Resumir texto com a função ai.summarize

A função ai.summarize usa IA generativa para produzir resumos de texto de entrada — valores de uma coluna de um DataFrame ou valores em todas as colunas — com uma única linha de código.

As funções de IA turbinam a engenharia de dados, colocando o poder dos modelos de grandes linguagens integrados do Fabric em suas mãos. Para saber mais, visite este artigo de resumo.

Importante

Esse recurso está no de visualização, para uso no de tempo de execução do Fabric 1.3 e superior.

  • Analise os pré-requisitos em este artigo de visão geral, incluindo as instalações da biblioteca que são temporariamente necessárias para usar funções de IA.
  • Por padrão, as funções de IA são atualmente alimentadas pelo modelo gpt-3.5-turbo (0125). Para saber mais sobre faturamento e taxas de consumo, visite este artigo.
  • Embora o modelo subjacente possa lidar com vários idiomas, a maioria das funções de IA são otimizadas para uso em textos em inglês.
  • Durante a implementação inicial das funções de IA, os usuários são temporariamente limitados a 1.000 solicitações por minuto com o endpoint de IA integrado do Fabric.

Use ai.summarize com pandas

A função ai.summarize estende a classe pandas Series. Chame a função em um pandas DataFrame coluna de texto para resumir cada valor de linha apenas dessa coluna. Como alternativa, você pode chamar a função ai.summarize em um DataFrame inteiro, para resumir valores em todas as colunas.

A função retorna uma série de pandas que contém resumos, que podem ser armazenados em uma nova coluna DataFrame.

Sintaxe

df["summaries"] = df["text"].ai.summarize()

Parâmetros

Nenhum

Devoluções

Um pandas Series que contém resumos para cada linha de texto de entrada. Se o texto de entrada for null, o resultado será null.

Exemplo

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df= pd.DataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """)
    ], columns=["product", "release_year", "description"])

df["summaries"] = df["description"].ai.summarize()
display(df)

Use ai.summarize com o PySpark

A função ai.summarize também está disponível para Spark DataFrames. Se você especificar o nome de uma coluna de entrada existente como um parâmetro, a função resumirá cada valor dessa coluna sozinho. Caso contrário, a função resume valores em todas as colunas do DataFrame, linha por linha.

A função retorna um novo DataFrame com resumos para cada linha de texto de entrada, a partir de uma única coluna ou de todas as colunas, armazenado numa coluna de saída.

Sintaxe

df.ai.summarize(input_col="text", output_col="summaries")

Parâmetros

Nome Descrição
input_col
Opcional
Uma cadeia de caracteres que contém o nome de uma coluna existente com valores de texto de entrada para resumir. Se esse parâmetro não estiver definido, a função resumirá valores em todas as colunas no DataFrame, em vez de valores de uma coluna específica.
output_col
Opcional
Uma cadeia de caracteres que contém o nome de uma nova coluna para armazenar resumos para cada linha de texto de entrada. Se esse parâmetro não estiver definido, um nome padrão será gerado para a coluna de saída.
error_col
Opcional
Uma cadeia de caracteres que contém o nome de uma nova coluna para armazenar quaisquer erros OpenAI resultantes do processamento de cada linha de texto de entrada. Se esse parâmetro não estiver definido, um nome padrão será gerado para a coluna de erro. Se uma linha de entrada não tiver erros, o valor nesta coluna será null.

Devoluções

Um Spark DataFrame com uma nova coluna que contém texto resumido para cada linha de texto de entrada. Se o texto de entrada for null, o resultado será null. Se nenhuma coluna de entrada for especificada, a função resumirá valores em todas as colunas no DataFrame.

Exemplo

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = spark.createDataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """,),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """,)
    ], ["product", "release_year", "description"])

summaries = df.ai.summarize(input_col="description", output_col="summaries")
display(summaries)