Partilhar via


Extrair frases-chave do texto

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Extrai frases-chave de texto dado

Categoria: Análise de Texto

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo explica como usar as Frases-Chave de Extração do módulo text in Machine Learning Studio (clássico), para pré-processar uma coluna de texto. Dada uma coluna de texto de linguagem natural, o módulo extrai uma ou mais frases significativas. Uma frase pode ser uma única palavra, um substantivo composto, ou um modificador mais um substantivo.

Este módulo é um invólucro para APIs de processamento de linguagem natural para extração de frase-chave. As frases são analisadas como potencialmente significativas no contexto da sentença por várias razões:

  • A frase capta o tema da frase.
  • A frase contém uma combinação de modificador e substantivo que indica sentimento.

Por exemplo, assumir que a sentença analisada é: "Foi um hotel maravilhoso para ficar, com decoração única e pessoal amigável."

As frases-chave de extração do módulo de texto podem devolver estas frases-chave:

  • maravilhoso hotel
  • pessoal amigável
  • decoração única

Como configurar extrato de frases-chave do texto

Para extrair frases-chave, deve ligar um conjunto de dados que tenha uma coluna de texto.

  1. Adicione as frases-chave de extração do módulo de texto à sua experiência no Machine Learning Studio (clássico). Em seguida, ligue um conjunto de dados que tenha pelo menos uma coluna de texto completo.

  2. Utilize o Seletor de Colunas para selecionar uma coluna de tipo de cadeia, a partir da qual extrair frases-chave.

  3. Para linguagem, selecione um idioma para usar ao analisar frases. Se especificar uma língua, apenas as frases na língua-alvo serão saídas.

  4. Se a coluna de texto contiver frases em várias línguas, escolha a opção, Linguagem identificada em colunas. É apresentado um novo seletor de colunas que permite selecionar uma coluna no seu conjunto de dados que contém um identificador de idioma. O identificador de línguas pode ser o nome da língua ou o identificador de cultura Iso6391. Por exemplo, ou "Inglês" ou "en" são aceitáveis.

    Dica

    Antes de executar extrato frases-chave de texto, utilize o módulo Deteção de Línguas para identificar o idioma em cada linha e gerar o identificador para si. Um erro é levantado se a coluna do identificador de idiomas contiver quaisquer idiomas não suportados por Frases-chave de extração de texto.

Resultados

A saída do módulo é um conjunto de dados que contém uma coluna de frases-chave separadas por vírgula.

Por exemplo, os seguintes resultados de exemplo são para um conjunto de dados de entrada contendo revisões em vários idiomas:

Frases-chave
romance,submarino nuclear,bom livro,história de aventura, avalanche de eventos, bons personagens
primer misterio,personajes,fã,aventura,isla
  • Todas as frases de saída estão contidas numa única coluna; nenhuma outra coluna é passada, e um identificador não é adicionado. No entanto, se pretender alinhar as frases de saída com o texto de origem, pode recombinar as frases de saída com a entrada utilizando o módulo Add Columns .

  • A saída da extração de frases-chave não sinaliza a linguagem das frases individuais.

  • Se for incluído um idioma que não seja suportado pelo módulo Extract Key Phrases , é levantado um erro (0039). Para evitar erros, certifique-se de filtrar o texto de entrada que tem um identificador de linguagem incompatível.

    Se houver muito poucas linhas de outras línguas, também pode evitar o erro omitindo o identificador de idiomas e analisando todo o texto usando uma única seleção linguística. No entanto, quando o fazes, os resultados são muito fracos, porque frases inteiras nas outras línguas podem ser saídas como uma única frase-chave.

Exemplos

O exemplo a seguir demonstra como usar este módulo para extrair frases-chave e, em seguida, construir uma nuvem de palavra a partir das frases: Extrair Frases-chave e Mostrar Nuvem de Palavra

Consulte a Galeria Azure AI para obter mais exemplos de processamento de texto utilizando Machine Learning.

Notas técnicas

Este módulo suporta atualmente os seguintes idiomas:

  • Neerlandês
  • Inglês
  • Francês
  • Alemão
  • Italiano
  • Espanhol

Para idiomas adicionais, considere usar a API text Analytics em Serviços Cognitivos Azure. Para mais informações, consulte Como extrair frases-chave em Text Analytics

Entradas esperadas

Nome Tipo Description
Conjunto de dados Tabela de Dados A tabela que contém o texto a ser processado.

Parâmetros do módulo

Nome Tipo Intervalo Opcional Predefinição Description
Coluna de cultura-língua Seleção de Colunas linguagem:Coluna contém linguagem Nome ou índice de base da coluna que contém a informação cultura-língua
Coluna de texto Seleção de Colunas Necessário Nome ou índice de uma base da coluna de texto.
Linguagem T_Language Inglês, Espanhol, Francês, Holandês, Alemão, Italiano, Coluna contém língua Necessário Inglês Selecione a linguagem do texto a processar.

Saídas

Nome Tipo Description
Conjunto de dados de resultados Tabela de Dados As frases-chave extraídas

Exceções

Exceção Description
Erro 0003 A exceção ocorre se uma ou mais entradas forem nulas ou vazias.
Erro 0010 A exceção ocorre se os conjuntos de dados de entrada tiverem nomes de colunas que devem coincidir, mas não.
Erro 0016 A exceção ocorre se os conjuntos de dados de entrada passados para o módulo devem ter tipos de coluna compatíveis, mas não o fazem.
Erro 0008 A exceção ocorre se o parâmetro não estiver ao alcance.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.

Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.

Ver também

Análise de Texto
Lista de Módulos A-Z