Compartir a través de


Administrar los controles de tecnología de reconocimiento de voz para un altavoz inteligente

Este artículo proporciona instrucciones sobre cómo los administradores pueden habilitar Salas de Teams para el reconocimiento de voz y la transcripción en directo. Como administrador, tiene la capacidad de ajustar hasta qué punto su organización permite a los usuarios usar el reconocimiento de voz y las capacidades de los altavoces inteligentes.

Nota

El altavoz inteligente está disponible en todos los países y regiones. Consulte Configuraciones regionales admitidas para obtener una lista de las configuraciones regionales compatibles actualmente con la inscripción biométrica y la transcripción en la reunión.

Nota

  • Los altavoces inteligentes están disponibles para los clientes con licencias de Teams Room Pro.
  • Los dispositivos seleccionados con licencias de Salas de Microsoft Teams Premium heredadas seguirán siendo compatibles.

Optimización de la precisión de la transcripción con altavoces inteligentes

Cuando haya activado Altavoz inteligente para su Salas de Microsoft Teams, la transcripción de la reunión no solo podrá distinguir entre diferentes oradores de la sala, sino también identificarlos y atribuirlos a la persona correcta. El altavoz inteligente permite casos de uso críticos para Copilot y un resumen inteligente.

El reconocimiento de altavoces está habilitado por altavoces inteligentes certificados para Teams. Los altavoces inteligentes certificados están diseñados con varios micrófonos para proporcionar audio de alta calidad, maximizar la precisión en el reconocimiento y la transcripción, y cuentan con una reducción líder en la industria de lo que se conoce como "tasa de error de palabras".

Dicho esto, lo obtenemos: el hardware certificado para altavoces inteligentes aún no está disponible en todas las salas de Teams. Por eso ampliamos esta característica al hardware existente. Aunque estamos encantados de ampliar la capacidad de reconocimiento de altavoces a más salas, es importante tener en cuenta que la calidad puede no coincidir con la de un dispositivo con certificación de altavoz inteligente. Por lo tanto, es esencial evaluar las ventajas de incorporar un orador inteligente, especialmente en espacios cruciales donde lograr la transcripción y atribución de la más alta calidad es vital.

Mantener su identidad en reuniones optimizadas para Copilot y resumen de reuniones

La entrada más esencial para Copilot en Teams es la identidad de cada orador. Copiloto necesita una transcripción de la reunión, con atribución para cada orador, para ofrecer resúmenes de la reunión, perspectivas y elementos de acción. En una reunión híbrida, sin el reconocimiento de oradores, el vídeo y la fuente de audio de las personas de la sala se atribuirían al espacio (por ejemplo, sala de conferencias 1), no a las personas que hablan, lo que dificultaba consultar las contribuciones de los usuarios, resumir las perspectivas de todos y abordar esas tareas pendientes.

Salas de Teams dispositivos usan tecnología avanzada denominada reconocimiento de altavoces para analizar las distintas características vocales de cada altavoz, como el tono, el tono y el estilo de habla, para crear una huella vocal para cada participante, similar a una huella digital para su voz.

Con el reconocimiento de oradores, Salas de Teams puede identificar los oradores durante la transcripción en directo en salas de reuniones compartidas, lo que garantiza una captura de voz clara y precisa para cada participante. Esto le permite realizar un seguimiento sin esfuerzo de quién dijo qué durante la reunión a través de un resumen inteligente de la reunión y Copilot.

Para habilitar el reconocimiento de altavoces para los empleados, puede configurar un perfil de voz en cuestión de minutos con la aplicación de escritorio de Teams. Cada persona obtiene una firma de voz única, almacenada de forma segura en el espacio empresarial de su organización en Microsoft Cloud para garantizar que todas las contribuciones se capturan con precisión en cada reunión, lo que habilita copiloto y resumen inteligente de reuniones, y le ayuda a impulsar su trabajo hacia adelante.

Captura de pantalla que muestra una reunión en curso.

Requisitos y recomendaciones

  • Salas de Teams en Windows
  • Para garantizar la mejor precisión para la transcripción, le sugerimos limitar el número de asistentes en persona a un máximo de 10 personas.
  • Personas identificarse en la sala, debe inscribirse con su perfil de voz e invitarlo a la reunión programada.
  • La limitación actual para las personas invitadas con perfil de voz es actualmente 20.
  • Para admitir audio y vídeo de alta calidad durante las reuniones, recomendamos que la sala de reuniones tenga una velocidad de carga de al menos 7 Mbps.

Nota

Hemos ampliado los altavoces inteligentes para trabajar con todos los micrófonos certificados. Puedes probar esto para Salas de Teams con la versión 5.0.111.0 o posterior.

Habilitar un reconocimiento de usuario de altavoz inteligente

Los datos de perfil de voz se pueden usar en cualquier reunión con un altavoz inteligente. Vea Directivas de reuniones de Teams y los cmdlets de reuniones de PowerShell para obtener información sobre la configuración de la reunión.

Set-CsTeamsMeetingPolicy -Identity PolicyName -roomAttributeUserOverride Attribute -AllowTranscription $true

Nota

Si su perfil de voz no está disponible en la pestaña Reconocimiento de Configuración y no se le atribuyen transcripciones, vuelva a inscribir su perfil de voz.

Las siguientes son las directivas necesarias para establecer un altavoz inteligente y el reconocimiento de usuario.

Directiva Descripción Valores y comportamiento
roomAttributeUserOverride Controle la identificación de usuario basada en voz en las salas de reuniones. Esta configuración es necesaria para las cuentas de Salas de Teams. Desactivado
  • El dispositivo Salas de Teams no enviará ancho de banda de ahorro de secuencias de audio desde la sala.
  • Los usuarios de las salas de reuniones no se atribuirán ni distinguirán, y sus firmas de voz no se recuperarán ni se usarán en absoluto.
  • Se desconocen los usuarios de las salas de reuniones.

Atributo
  • Los usuarios de salas se atribuirán en función de su estado de inscripción.
  • Los usuarios inscritos se muestran con su nombre en la transcripción.
  • Los usuarios que no están inscritos se muestran como altavoz <n>.
  • El dispositivo Salas de Teams enviará siete transmisiones de audio desde la sala.

Distinguir
  • Salas de Teams usuarios se distinguirán y separarán como altavoz 1, altavoz 2, .... orador <n> en la transcripción.
  • Independientemente del estado de inscripción del usuario, su nombre no se mostrará en la transcripción.
  • El dispositivo Salas de Teams enviará siete transmisiones de audio desde la sala.
AllowTranscription Necesario para las cuentas de usuarios y salas de Teams. Verdadero y falso

En el Centro de administración de Teams, establezca la directiva de transcripción . La configuración está desactivada de forma predeterminada.

Nota

Después de asignar una directiva, pueden tardar hasta 48 horas en surtir efecto. Para que la directiva surta efecto antes, es necesario cerrar la sesión de las cuentas y volver a iniciarla.

Las siguientes configuraciones regionales de transcripción en reunión son compatibles en todos los países y regiones.

Configuraciones regionales de transcripción durante la reunión

Una vez que un usuario final se inscribe, su voz se puede reconocer durante las reuniones e identificarse en la transcripción cuando la reunión se establece en uno de los siguientes idiomas:

Inglés (Estados Unidos), inglés (Canadá), inglés (India), inglés (Reino Unido), inglés (Australia), inglés (Nueva Zelanda), árabe (Emiratos Árabes), árabe (Arabia Saudí), chino (China simplificada), chino (tradicional, Hong Kong RAE), chino (tradicional, Taiwán), checo (Checo), danés (Dinamarca), neerlandés (Bélgica), neerlandés (Países Bajos), francés (Canadá), francés (Francia), finlandés (Finlandia), alemán (Alemania), griego (Grecia), hebreo (Israel), hindi (India), húngaro (Hungría), italiano (Italia), Japonés (Japón), coreano (Corea), noruego (Noruega), polaco (Polonia), portugués (Brasil), portugués (Portugal), rumano (Rumania), ruso (Rusia), eslovaco (Eslovaquia), español (México), español (España), sueco (Suecia), tailandés (Tailandia), turco (Turquía), ucraniano (Ucrania), vietnamita (Vietnam), galés (Reino Unido)

Preguntas más frecuentes (P+F)

Revisa el documento de reconocimiento facial y de inscripción de voz si tienes más preguntas sobre el uso y el almacenamiento de datos del perfil de voz.

Artículo de soporte técnico: Usar altavoces inteligentes para identificar a los participantes en la sala