Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Las tecnologías de inteligencia artificial (IA) son útiles para diversas experiencias de comunicación. La inteligencia artificial puede ayudar a los humanos a comunicarse mejor y lograr su misión de forma más eficaz, por ejemplo, un empleado bancario puede usar un resumen de reuniones generado por IA para ayudarle a realizar el seguimiento. La inteligencia artificial puede reducir las cargas de trabajo humanas y permitir una interacción más flexible con los clientes, como el funcionamiento de un bot telefónico disponible 24/7 al que llaman los clientes para comprobar su saldo de cuenta.
Estos son algunos ejemplos:
- Operación de un chat o un bot de voz que responda a la conversación humana.
- Transformación del contenido de voz en transcripciones de texto.
- Transformación de una fuente de vídeo para desenfocar el fondo del usuario.
- Anotar y analizar conversaciones para identificar tendencias y oportunidades para mejorar el servicio.
- Transformar un corpus de chat de texto y transcripciones de reuniones en resúmenes. Esta experiencia podría implicar una interfaz de IA generativa en la que un usuario le pregunta: "resumir todas las conversaciones entre el usuario Joe y yo".
En este artículo se resume la disponibilidad de las características adyacentes de IA e IA en Azure Communication Services. Hay dos amplias categorías de funcionalidad de inteligencia artificial:
- IA integrada: Azure Communication Services se integra directamente con Azure AI y Microsoft Copilot Studio. Por lo general, estas características requieren que cree y vincule los recursos de Azure Communication Services y Azure AI en Azure Portal. Después de esta vinculación única, el uso de estas características de IA es tan sencillo como una sola llamada API.
- Descriptores de acceso: Azure Communication Services proporciona varias API que otorgan acceso sin procesar y transformado a los datos de comunicación, lo que facilita la conexión de sus propios servicios externos y sistemas de IA.
Mensajería: SMS, chat, correo electrónico, WhatsApp
En esta sección se resumen las características para integrar la inteligencia artificial en la mensajería de Azure Communication.
Integraciones directas
- Análisis avanzado de mensajes: las API de mensajería de Azure Communication Services para WhatsApp proporcionan una integración predefinida con Azure OpenAI que analiza y anota mensajes. Esta integración puede detectar el idioma del usuario, reconocer su intención y extraer frases clave.
- Azure Bot Service: integración del canal de chat: el sistema de chat de Azure Communication Services se integra directamente con Azure Bot Service. Esta integración simplifica la creación de bots de chat que interactúan con usuarios humanos.
Descriptores de acceso
Todas las funcionalidades de mensajería de Azure Communication Services son accesibles a través de las API de REST, los SDK orientados al servidor y las notificaciones de Event Grid. Puede usar estos SDK para exportar contenido a un almacén de datos externo y adjuntar un modelo de lenguaje para resumir las conversaciones. O bien, puede usar los SDK para integrar un bot que interactúe directamente con los usuarios humanos. Por ejemplo, en esta muestra de GitHub se muestra cómo se puede acceder a las API de Azure Communication Services para chat a través de las API de REST y, a continuación, analizarlas mediante Azure OpenAI.
Voz, vídeo y telefonía
En esta sección se resumen las características para integrar la inteligencia artificial en las llamadas de voz y vídeo de Azure Communication.
Integraciones directas
- API de REST y SDK de automatización de llamadas: Azure Communication Services tiene API sencillas para sintetizar y reconocer la voz. El escenario más común para estas API es implementar bots de voz, a veces denominados respuesta interactiva de voz (IVR).
- Microsoft Copilot Studio: Copilot Studio se integra directamente con la telefonía de Azure Communication Services. Esta integración está diseñada para bots de voz e IVR.
- Subtítulos de cliente: el SDK de cliente de la llamada proporciona API para subtítulos en tiempo real, optimizados para mejorar la accesibilidad.
- Copilot en Azure Portal: puede usar Copilot en Azure Portal para formular preguntas sobre Azure Communication Services. Copilot usa la documentación técnica de Azure para responder a sus preguntas y se usa mejor para formular preguntas sobre los códigos de error y el comportamiento de la API.
- Efectos de fondo del cliente: los SDK de cliente de llamada proporcionan las API para desenfocar o reemplazar el fondo de un usuario.
- Efectos y mejora del ruido de fondo del cliente: el SDK del cliente de llamada integra un modelo de Machine Learning DeepVQE para mejorar la calidad del audio a través de la cancelación del eco y la supresión del ruido de fondo. Esta transformación es activada y desactivada mediante el SDK de cliente.
Descriptores de acceso
De forma similar a la mensajería de Azure Communication Services, hay API de REST para muchas características de llamadas de voz y vídeo. Sin embargo, la naturaleza en tiempo real de la llamada requiere SDK de código cerrado y API más complejas, como el streaming de WebSocket.
- API REST y SDK de automatización de llamadas: los servicios y las aplicaciones de IA usan las API REST de Automatización de llamadas para responder, enrutar y administrar todos los tipos de llamadas de voz y videollamadas de Azure.
- Streaming de audio de servicio a servicio: las aplicaciones de IA usan la API WebSockets de servicio a servicio de Azure para transmitir datos de audio. Esto funciona en ambas direcciones, la IA puede escuchar una llamada y hablar.
- Transcripción en tiempo real de servicio a servicio: las aplicaciones de inteligencia artificial usan la API WebSockets de servicio a servicio de Azure para transmitir una transcripción en tiempo real generada por Azure. En comparación con el contenido de audio o vídeo, a menudo es más fácil para los modelos de inteligencia artificial razonar con los datos de transcripción.
- Grabación de llamadas: puede grabar llamadas de Azure en su propio almacén de datos y, a continuación, dirigir los servicios de inteligencia artificial para que procesen ese contenido.
- Audio y vídeo del cliente sin procesar: el SDK del cliente de llamada proporciona las API para acceder y modificar la fuente de audio y vídeo sin procesar. Un escenario de ejemplo es tomar la fuente de vídeo, usar Computer Vision para distinguir al hablante humano de su fondo y personalizar ese fondo.