Partager via


Gérer les contrôles de technologie de reconnaissance vocale pour un haut-parleur intelligent

Cet article fournit des conseils sur la façon dont les administrateurs peuvent activer salles Teams pour la reconnaissance vocale et la transcription en direct. En tant qu’administrateur, vous avez la possibilité d’ajuster la mesure dans laquelle votre organisation permet aux utilisateurs d’utiliser la reconnaissance vocale et les haut-parleurs intelligents.

Remarque

Intelligent Speaker est disponible dans tous les pays et régions. Consultez Paramètres régionaux pris en charge pour obtenir la liste des paramètres régionaux actuellement pris en charge pour l’inscription biométrique et la transcription en réunion.

Optimisation de la précision de transcription avec des haut-parleurs intelligents

Lorsque vous avez activé l’orateur intelligent pour vos salles Microsoft Teams, la transcription de la réunion est en mesure non seulement de faire la distinction entre les différents intervenants dans la salle, mais également de les identifier et de les attribuer à la personne appropriée. Intelligent Speaker permet des cas d’usage critiques pour Copilot et un récapitulatif intelligent.

La reconnaissance de l’orateur est activée par des haut-parleurs intelligents certifiés pour Teams. Les haut-parleurs intelligents certifiés sont conçus avec plusieurs microphones pour fournir un son de haute qualité, optimiser la précision de la reconnaissance et de la transcription, et se vanter d’une réduction de ce que l’on appelle le « taux d’erreur de mot ».

Cela dit, nous l’obtenons : le matériel certifié de haut-parleur intelligent n’est pas encore disponible dans toutes les salles Teams. C’est pourquoi nous étendons cette fonctionnalité au matériel existant. Bien que nous sommes ravis d’étendre la fonctionnalité de reconnaissance de l’orateur à davantage de salles, il est important de noter que la qualité peut ne pas correspondre à celle d’un appareil certifié haut-parleur intelligent. Il est donc essentiel d’évaluer les avantages de l’intégration d’un orateur intelligent, en particulier dans les espaces cruciaux où l’obtention de la meilleure qualité de transcription et d’attribution est essentielle.

Maintenir votre identité dans les réunions optimisées pour Copilot et le récapitulatif des réunions

L’entrée la plus essentielle pour Copilot dans Teams est l’identité de chaque orateur. Copilot a besoin d’une transcription de réunion, avec attribution pour chaque intervenant, pour fournir des résumés de réunion, des insights et des éléments d’action. Dans une réunion hybride, sans reconnaissance de l’orateur, le flux vidéo et audio pour les personnes dans la salle serait attribué à l’espace (par exemple, salle de conférence 1), et non aux personnes qui parlent, ce qui rend difficile d’interroger les contributions des individus, de résumer les points de vue de chacun et de s’attaquer à ces tâches.

Les appareils Salles Teams utilisent une technologie avancée appelée reconnaissance de l’orateur pour analyser les caractéristiques vocales distinctes de chaque orateur, telles que la hauteur, le ton et le style d’élocution, afin de créer une empreinte vocale pour chaque participant, semblable à une empreinte digitale pour sa voix.

Avec la reconnaissance de l’orateur, les salles Teams peuvent identifier les orateurs lors de la transcription en direct dans les salles de réunion partagées, garantissant ainsi une capture vocale claire et précise pour chaque participant. Cela vous permet de suivre facilement qui a dit quoi pendant la réunion grâce à un récapitulatif intelligent des réunions et à Copilot.

Pour activer la reconnaissance de l’orateur pour vos employés, vous pouvez configurer un profil vocal en quelques minutes à l’aide de l’application de bureau Teams. Chaque personne obtient une signature vocale unique, stockée en toute sécurité dans le locataire de votre organisation dans le cloud Microsoft pour garantir que chaque contribution est capturée avec précision lors de chaque réunion, ce qui permet à Copilot et à un récapitulatif intelligent des réunions, et de vous aider à faire avancer votre travail.

Capture d’écran montrant une réunion en cours.

Exigences et recommandations

  • Salles Teams sur Windows
  • Pour garantir une meilleure précision pour la transcription, nous vous suggérons de limiter le nombre de participants en personne à un maximum de 10 personnes.
  • Les personnes à identifier dans la salle doivent être inscrites avec leur profil vocal et être invitées à la réunion planifiée.
  • La limitation actuelle pour les personnes invitées avec profil vocal est actuellement de 20.
  • Pour prendre en charge l’audio et la vidéo de haute qualité pendant les réunions, nous recommandons que la salle de réunion ait une vitesse de chargement d’au moins 7 Mbits/s.

Remarque

Nous étendons le haut-parleur intelligent pour qu’il fonctionne avec tous les microphones certifiés. Vous pouvez l’essayer dans le cadre de notre programme de préversion publique pour les salles Teams avec la version 5.0.111.0 ou ultérieure.

Activer la reconnaissance utilisateur d’un haut-parleur intelligent

Les données de profil vocal peuvent être utilisées dans n’importe quelle réunion avec un haut-parleur intelligent. Pour plus d’informations sur les paramètres de réunion, consultez Stratégies de réunions Teams et applets de commande de réunion PowerShell .

Set-CsTeamsMeetingPolicy -Identity PolicyName -roomAttributeUserOverride Attribute -AllowTranscription $true

Remarque

Si votre profil vocal n’est pas disponible sous l’onglet Reconnaissance dans Paramètres et que vous n’êtes pas attribué dans les transcriptions, réinscrivez votre profil vocal.

Voici les stratégies requises pour définir un haut-parleur intelligent et une reconnaissance utilisateur.

Stratégie Description Valeurs et comportement
roomAttributeUserOverride Contrôler l’identification de l’utilisateur par la voix dans les salles de réunion. Ce paramètre est requis pour les comptes Salles Teams. Désactivé
  • L’appareil Salles Teams n’envoie pas de bande passante d’enregistrement de flux audio à partir de la salle.
  • Les utilisateurs de salle de réunion ne seront pas attribués ou distingués, et leurs signatures vocales ne seront pas récupérées ou utilisées du tout.
  • Les utilisateurs de salle de réunion sont inconnus.

Attribut
  • Les utilisateurs des salles seront attribués en fonction de leur statut d’inscription.
  • Les utilisateurs inscrits sont affichés avec leur nom dans la transcription.
  • Les utilisateurs qui ne sont pas inscrits s’affichent en tant que présentateur <n>.
  • L’appareil Salles Teams envoie sept flux audio à partir de la salle.

Distinguer
  • Les utilisateurs des salles Teams seront distingués et séparés en tant qu’orateur 1, orateur 2, .... speaker <n> dans la transcription.
  • Quel que soit l’état d’inscription de l’utilisateur, son nom n’apparaît pas dans la transcription.
  • L’appareil Salles Teams envoie sept flux audio à partir de la salle.
AllowTranscription Obligatoire pour les comptes d’utilisateur et de salles Teams. True et False

Dans le Centre d’administration Teams, définissez la stratégie de transcription . Les paramètres sont désactivés par défaut.

Remarque

Une fois qu’une stratégie est affectée, son application peut prendre jusqu’à 48 heures. Pour que la stratégie prenne effet plus rapidement, les comptes doivent être déconnectés et reconnecté.

Les paramètres régionaux de transcription de réunion suivants sont pris en charge dans tous les pays et régions.

Paramètres régionaux de transcription en réunion

Une fois qu’un utilisateur final s’inscrit, sa voix peut être reconnue pendant les réunions et identifiée dans la transcription lorsque la réunion est définie sur l’une des langues suivantes :

Anglais (États-Unis), anglais (Canada), anglais (Inde), anglais (Royaume-Uni), anglais (Australie), anglais (Nouvelle-Zélande), arabe (Émirats arabes unis), arabe (Arabie saoudite), chinois (Chine simplifiée), chinois (traditionnel, Hong Kong SAR), Chinois (traditionnel, Taïwan), Tchèque (Tchéquie), Danois (Danemark), Néerlandais (Belgique), Néerlandais (Pays-Bas), Français (Canada), Français (France), Finnois (Finlande), Allemand (Allemagne), Grec (Grèce), Hébreu (Israël), Hindi (Inde), Hongrois (Hongrie), Italien (Italie), Japonais (Japon), Coréen (Corée), Norvégien (Norvège), Polonais (Pologne), Portugais (Brésil), Portugais (Portugal), Roumain (Roumanie), Russe (Russie), Slovaque (Slovaquie), Espagnol (Mexique), Espagnol (Espagne), Suédois (Suède), Thaï (Thaïlande), Turc (Turquie), Ukrainien (Ukraine), Vietnamien (Vietnam), Gallois (Royaume-Uni)

Forum aux questions (FAQ)

Consultez le document d’inscription de visage et de voix si vous avez d’autres questions sur l’utilisation et le stockage des données de profil vocal

Article de support : Utiliser des haut-parleurs intelligents pour identifier les participants dans la salle