Compartir a través de


Elegir una tecnología de procesamiento de lenguaje específico de Azure AI

Los servicios de Azure AI ayudan a los desarrolladores y a las organizaciones a crear rápidamente aplicaciones inteligentes, vanguardistas, listas para el mercado y responsables con API y modelos listos para usar, precompilados y personalizables.

En este artículo se tratan los servicios de IA que proporcionan capacidades de procesamiento lingüístico específicas, como el procesamiento del lenguaje natural (NLP), el análisis de texto, la comprensión del lenguaje, la traducción y la extracción de datos de documentos. El lenguaje de IA de Microsoft Azure es una de las categorías más amplias de los servicios de IA. Puede usar las API de la carga de trabajo para incorporar características de lenguaje como el reconocimiento de entidades con nombre (NER), el análisis de sentimientos, la detección de idioma y el resumen de texto.

Servicios

Los siguientes servicios proporcionan capacidades de procesamiento de lenguaje específicas para los servicios de IA:

  • El lenguaje proporciona NLP para el análisis de textos.

    • Uso Idioma cuando necesite trabajar con documentos estructurados o no estructurados para la amplia gama de tareas relacionadas con el lenguaje que se describen en este artículo.

    • No usar Idioma si necesita buscar documentos con el chat, comprobar la seguridad del contenido o traducirlos.

  • Microsoft Azure AI Translator es un servicio de traducción automática. Puede realizar traducciones de texto en tiempo real, traducción de documentos por lotes y de un solo archivo, y traducciones personalizadas que puede usar para incorporar terminología especializada o lenguaje específico de la industria para su escenario. Translator es compatible con varios idiomas.

    • Uso Traductor cuando se necesita realizar una traducción de forma específica. Puede utilizar otros modelos de lenguaje básico de uso general para realizar la traducción. Sin embargo, el uso de Translator para su propósito especializado puede ser más eficaz y rentable debido a sus modelos de traducción específicos.

    • No usar Traductor si necesita interactuar con el chat, analizar el contenido en busca de opiniones o moderar el contenido. Para el análisis de sentimientos, use Idioma en su lugar. Para la moderación de contenido, use Seguridad de contenido de IA de Microsoft Azure.

  • Azure AI Document Intelligence es un servicio que puede convertir imágenes directamente en formularios electrónicos. Puede especificar los campos esperados y, a continuación, buscar las imágenes que proporcione para capturar esos campos sin intervención humana. Document Intelligence aloja muchos modelos prediseñados y también le permite crear sus propios modelos personalizados.

    • Uso Inteligencia de documentos cuando sabe exactamente qué campos necesita extraer de los documentos escaneados para completar los formularios electrónicos de manera adecuada.

    • Uso Inteligencia de documentos para identificar estructuras clave, como encabezados, pies de página y saltos de capítulo, en diversas colecciones de documentos para interactuar aún más mediante programación con el documento, como en una implementación de generación aumentada de recuperación (RAG).

    • No usar Document Intelligence como API de búsqueda en tiempo real.

Servicio Azure OpenAI

Azure OpenAI Service proporciona acceso a la API de REST a los eficaces modelos de lenguaje de OpenAI. Estos modelos incluyen O3-Mini, O1, O1-Mini, GPT-4o, GPT-4o Mini, GPT-4 Turbo with Vision, GPT-4, GPT-3.5-Turbo y la serie de modelos Embeddings. Estos modelos son altamente adaptables, lo que le permite adaptarlos a tareas como la generación de contenido, el resumen, el análisis de imágenes y la búsqueda semántica. También admiten la traducción de lenguaje natural a código, lo que los hace versátiles para diversas aplicaciones.

Capacidades

En la tabla siguiente se proporciona una lista de las funcionalidades disponibles en Azure OpenAI.

Capacidad Descripción
Generación y finalización de texto Genera texto similar al humano en función de indicaciones, completa automáticamente oraciones o párrafos, resume documentos largos en resúmenes concisos y responde preguntas según el contexto.
Charlar Cree chatbots y asistentes virtuales, mantenga el contexto en conversaciones de varios turnos y personalice las respuestas en función de la interacción del usuario.
Asistentes Cree una experiencia similar a la de un copiloto que mantenga una personalidad coherente en todas las interacciones con el usuario. Permita el uso de múltiples herramientas simultáneamente, como la implementación de código y la búsqueda de conocimientos.
Incrustraciones Convierta texto en vectores numéricos donde significados similares se colocan cerca uno del otro en el espacio vectorial. Este proceso permite una búsqueda de similitudes eficaz en servicios como Azure AI Search, Azure Cosmos DB, Azure SQL Database y Azure Database for PostgreSQL.
Filtrado de contenido Filtra tanto las entradas del usuario como las salidas de la IA en busca de contenido dañino en categorías como odio, contenido sexual, violencia y autolesión, con soporte para varios idiomas. También supervisa los patrones de uso para ayudar a garantizar el cumplimiento.
Personalización de LLM Proporciona técnicas de adaptación del modelo, incluida la ingeniería rápida para ajustes rápidos, RAG para incorporar información externa y ajuste fino para entrenar el modelo en tareas especializadas. Puede combinar estos métodos para optimizar el rendimiento para casos de uso específicos.

Lenguaje

Language es un servicio basado en la nube que proporciona funciones de NLP para comprender y analizar texto. Utilice este servicio para ayudar a crear aplicaciones inteligentes mediante Language Studio basado en web, las API de REST y las bibliotecas cliente.

Capacidades

En la tabla siguiente se proporciona una lista de las capacidades disponibles en Language.

Capacidad Descripción
Respuesta personalizada a preguntas Busca la respuesta más adecuada para las entradas de los usuarios. Se usa normalmente para crear aplicaciones cliente conversacionales, como aplicaciones de redes sociales, bots de chat y aplicaciones de escritorio habilitadas para voz.
Clasificación de texto personalizada Crea modelos de IA personalizados para clasificar documentos de texto no estructurados en clases personalizadas que usted defina.
Reconocimiento del lenguaje conversacional (CLU) Cree modelos personalizados de comprensión del lenguaje natural para predecir la intención general de un mensaje entrante y extraer información importante de él.
Vinculación de entidad Desambigua la identidad de las palabras o frases que se encuentran en el texto no estructurado y devuelve enlaces a Wikipedia.
Detección de idiomas Detecta el idioma en el que está escrito un documento y devuelve un código de idioma para una amplia gama de idiomas, variantes, dialectos y algunos idiomas regionales o culturales.
Extracción de frases clave Evalúa y devuelve los conceptos principales en texto no estructurado y los devuelve como una lista.
NER Clasifica palabras o frases en texto no estructurado en varios grupos de categorías predefinidos, como personas, eventos, lugares y fechas.
Flujo de trabajo de orquestación Úselo para conectar CLU.
Información de identificación personal (PII) y detección de información de salud de identificación personal Identifica, categoriza y redacta información confidencial tanto en documentos de texto no estructurados como en transcripciones de conversaciones, como números de teléfono, direcciones de correo electrónico y formas de identificación. Para obtener más información, consulte Categorías de entidades de PII admitidas.
Análisis de sentimiento y minería de opiniones Te ayuda a entender lo que la gente piensa de tu marca o tema analizando el texto en busca de signos de sentimiento positivo o negativo y vinculándolos a aspectos específicos del contenido.
Resumen Utiliza el resumen de texto extractivo para producir un resumen de documentos y transcripciones de conversaciones. Extrae frases que representan la información general más importante o pertinente del contenido original.
Análisis de Texto para la Salud Extrae y etiqueta información médica pertinente de textos no estructurados, como notas del médico, resúmenes de altas, documentos clínicos e historiales sanitarios electrónicos. Al diseñar la carga de trabajo, evalúe la ubicación de procesamiento y la residencia de datos de esta característica hospedada en la nube para asegurarse de que se alinea con sus expectativas de cumplimiento. Es posible que algunas cargas de trabajo estén restringidas en su capacidad para enviar datos sanitarios a una plataforma hospedada en la nube. Puede usar esta API como un contenedor de Docker para hospedar en su propio proceso en la nube o en el entorno local. Este proceso puede ayudar a abordar los problemas de cumplimiento que incluyen la plataforma como servicio. Para obtener más información, consulte Uso de Text Analytics para contenedores de estado.

Casos de uso

En la tabla siguiente se proporciona una lista de posibles casos de uso de Language.

Caso de uso Personalizable
Predecir la intención de las entradas del usuario y extraer información de ellas
Identifique y redacte información confidencial, como PII.
Identificación del idioma en el que se escribió un texto.
Extraiga información médica de documentos clínicos o médicos sin crear un modelo.
Extraiga información médica de documentos clínicos o médicos mediante un modelo entrenado con sus datos.
Extraer categorías de información sin crear un modelo personalizado
Extraiga categorías de información mediante un modelo específico para sus datos.
Extraer temas principales y frases importantes
Resumir un documento.
Clasificación de texto mediante el análisis de opiniones.
Clasificación de texto mediante clases personalizadas.
Clasificación de elementos en categorías proporcionadas en el momento de la inferencia.
Vinculación de una entidad con artículos de la base de conocimientos.
Comprender preguntas y respuestas (genérico).
Crear una aplicación de conversación que responda a las entradas del usuario.
Conecte aplicaciones de CLU y responda preguntas.

Si una función es personalizable, puede entrenar un modelo de IA utilizando nuestras herramientas para que se ajuste a sus datos específicos. De lo contrario, la función está preconfigurada, lo que significa que sus modelos de IA permanecen sin cambios. Usted proporciona sus datos y utiliza la salida de la característica en sus aplicaciones.

Traductor

Translator es un servicio de traducción automática que forma parte de los servicios de IA. Traductor potencia muchos productos y servicios de Microsoft.

Capacidades

En la tabla siguiente se proporciona una lista de las capacidades disponibles en Translator.

Capacidad Descripción
Traducción de Azure Text Realice la traducción de texto entre los idiomas de origen y destino admitidos en tiempo real. Cree un diccionario dinámico y aprenda a evitar traducciones mediante la API de Translator.
Traducción de documentos Traducción asincrónica por lotes: Traduzca archivos complejos y por lotes conservando la estructura y el formato de los documentos originales. El proceso de traducción por lotes requiere una cuenta de Azure Blob Storage que tenga contenedores para los documentos de origen y traducidos.
Traducción sincrónica de un solo archivo: Traduzca un solo archivo de documento o con un archivo de glosario, conservando la estructura y el formato del documento original. El proceso de traducción de archivos no requiere una cuenta de Blob Storage. La respuesta final contiene el documento traducido y se devuelve directamente al cliente que realiza la llamada.
Traductor personalizado Cree modelos personalizados para traducir terminología y estilo específicos del sector y del dominio. Cree un diccionario (oración o frase) para traducciones personalizadas.

Casos de uso

En la tabla siguiente se proporciona una lista de posibles casos de uso de Translator.

Caso de uso Documentación
Traducción de texto específico del sector. Traductor personalizado
Traducción de texto genérico que no es específico de un sector. Traducción de Azure Text

Inteligencia Documental

Language es un servicio basado en la nube que proporciona funciones de NLP para comprender y analizar texto. Utilice este servicio para ayudar a crear aplicaciones inteligentes mediante Language Studio basado en web, las API de REST y las bibliotecas cliente.

Capacidades

En la tabla siguiente se proporciona una lista de algunas de las capacidades disponibles en Document Intelligence.

Capacidad Descripción
Extracción de tarjetas de presentación El modelo de tarjetas de visita de Document Intelligence combina capacidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer datos de imágenes de tarjetas de visita. La API analiza las tarjetas de visita impresas, extrae información clave como el nombre, los apellidos, el nombre de la empresa, la dirección de correo electrónico y el número de teléfono y, a continuación, devuelve una representación de datos JSON estructurada.
Extracción de modelos de contrato El modelo de contrato de Document Intelligence utiliza capacidades de OCR para analizar y extraer campos clave y elementos de línea de un grupo selecto de entidades contractuales importantes. Los contratos pueden ser de varios formatos y calidad, incluidas imágenes capturadas por teléfono, documentos escaneados y PDF digitales. La API analiza el texto del documento, extrae información clave, como las partes, las jurisdicciones, el ID del contrato y el título, y luego devuelve una representación de datos JSON estructurada. Actualmente, el modelo admite formatos de documentos en inglés.
Extracción de tarjetas de crédito El modelo de tarjetas de crédito/débito de Document Intelligence utiliza capacidades de OCR para analizar y extraer campos clave de tarjetas de crédito y débito. Las tarjetas de crédito y débito pueden aparecer en varios formatos y calidades, incluidas imágenes capturadas por teléfono, documentos escaneados y PDF digitales. La API analiza el texto del documento, extrae información clave, como el número de tarjeta, el banco emisor y la fecha de caducidad, y luego devuelve una representación de datos JSON estructurada. Actualmente, el modelo admite formatos de documentos en inglés.
Extracción de tarjetas de seguro de salud El modelo de tarjeta de seguro de salud de Document Intelligence combina capacidades de OCR con modelos de aprendizaje profundo para analizar y extraer información clave de las tarjetas de seguro de salud de EE. UU. Una tarjeta de seguro médico es un documento clave para el procesamiento de atención y se puede analizar digitalmente para la incorporación de pacientes, la información financiera de coberturas, los pagos sin efectivo y el procesamiento de reclamaciones de seguros. El modelo de tarjeta de seguro médico analiza las imágenes de la tarjeta sanitaria, extrae información clave como el asegurador, el miembro, la receta y el número de grupo y, a continuación, devuelve una representación JSON estructurada. Las tarjetas de seguro de salud pueden aparecer en varios formatos y calidades, incluidas imágenes capturadas por teléfono, documentos escaneados y PDF digitales.
Extracción de documentos fiscales de EE. UU. El modelo de contrato de Document Intelligence utiliza capacidades de OCR para analizar y extraer campos clave y partidas de un grupo selecto de documentos fiscales. Los documentos fiscales pueden ser de varios formatos y calidad, incluidas imágenes capturadas por teléfonos, documentos escaneados y PDF digitales. La API analiza el texto del documento, extrae información clave, como el nombre del cliente, la dirección de facturación, la fecha de vencimiento y el importe adeudado, y luego devuelve una representación de datos JSON estructurada. Actualmente, el modelo admite formatos específicos de documentos fiscales en inglés.
Bibliotecas de cliente Document Intelligence admite una amplia variedad de modelos que le permiten agregar procesamiento inteligente de documentos a sus aplicaciones y flujos. Puede usar un modelo específico del dominio precompilado o entrenar un modelo personalizado adaptado a necesidades empresariales y casos de uso específicos. "Document Intelligence puede utilizarse con la API REST o las bibliotecas cliente de Python, C#, Java y JavaScript."

Para obtener más información sobre los escenarios de modelo, consulte ¿Qué modelo debo elegir?

Pasos siguientes