Confort

Dans le processus de vision naturelle, le système visuel humain s’appuie sur plusieurs sources d’informations, ou « signaux », pour interpréter les formes 3D et la position relative des objets. Certains signaux ne reposent que sur un œil (signaux monoculaires), notamment :

D’autres signaux reposent sur les deux yeux (signaux binoculaires), notamment :

  • Vergence : rotations oculaires relatives nécessaires pour regarder un objet
  • Disparité binoculaire : différences entre les projections de la scène sur la rétine de chaque œil

Pour garantir un confort maximal sur les afficheurs placés sur la tête, il est important de créer du contenu et de le présenter d’une manière qui imite les signaux du monde réel. D’un point de vue physique, il est également important de concevoir du contenu qui ne nécessite pas de mouvements fatigants du cou ou des bras. Dans cet article, nous allons voir comment atteindre ces objectifs.

Conflit entre la vergence et l’accommodation

Pour voir clairement les objets, l’homme doit procéder à une accommodation, c’est-à-dire qu’il doit ajuster son focus par rapport à la distance de l’objet. En même temps, la rotation des deux yeux doit converger au niveau de l’objet afin d’éviter de voir double. Dans le processus de vision naturelle, la vergence et l’accommodation sont liées. Lorsque vous regardez quelque chose de près (par exemple, une mouche sur votre nez), vos yeux se croisent et s’accommodent sur un point proche. Inversement, lorsque vous regardez quelque chose avec une optique infinie (à partir de 6 mètres pour une vision normale), vos lignes de regard deviennent parallèles et votre cristallin s’accommode à l’infini.

Avec la plupart des casques audiovisuels, les utilisateurs ajustent (accommodent) toujours leur vision à la distance focale de l’écran (pour obtenir une image nette), mais ils convergent au niveau de l’objet qui les intéresse (pour obtenir une seule image). Lorsque l’accommodation et la convergence se font à des distances différentes, le lien naturel entre ces deux signaux est rompu, ce qui entraîne une gêne visuelle ou de la fatigue.

Conseils pour les appareils holographiques

L’affichage des casques HoloLens est configuré sur une distance optique d’environ 2 mètres de l’utilisateur. Les utilisateurs doivent systématiquement ajuster leur vision sur environ 2 mètres pour avoir une image nette. Les développeurs d’applications peuvent guider l’endroit de convergence des yeux en plaçant du contenu et des hologrammes à différents niveaux de profondeur. La gêne due au conflit vergence-accommodation peut être évitée ou réduite en gardant le contenu sur lequel les yeux convergent à une distance la plus proche possible de 2 mètres. Par exemple, dans une scène avec une grande profondeur, placez les zones d’intérêt à une distance de 2 mètres de l’utilisateur, si possible. Lorsque le contenu ne peut pas être placé à une distance proche de 2 mètres, le conflit vergence-accommodation est accentué quand le regard de l’utilisateur passe d’une distance à une autre. En d’autres termes, il est bien plus confortable de regarder un hologramme stationnaire situé à 50 cm que de regarder un hologramme situé à 50 cm qui se rapproche et s’éloigne de vous continuellement.

Distance optimale pour le placement des hologrammes par rapport à l’utilisateur.
Distance optimale pour le placement des hologrammes par rapport à l’utilisateur

Bonnes pratiques pour HoloLens (1re génération) et HoloLens 2

Pour un confort optimal, l’hologramme doit être placé à une distance comprise entre 1,25 m et 5 m. Dans tous les cas, les concepteurs doivent tenter de structurer les scènes de contenu en vue d’encourager les utilisateurs à interagir à 1 m ou plus du contenu (par exemple, en ajustant les paramètres de taille du contenu et de positionnement par défaut).

Même si le contenu doit parfois être affiché à une distance inférieure à 1 m, nous vous déconseillons de présenter les hologrammes à une distance inférieure à 40 cm. Par conséquent, nous vous recommandons de commencer à faire disparaître le contenu situé à 40 cm et à placer un plan de découpage du rendu à 30 cm pour éviter que des objets ne soient plus proches.

Les objets qui changent de profondeur sont plus susceptibles d’entraîner une gêne que les objets stationnaires, en raison du conflit vergence-accommodation. De même, le fait de demander aux utilisateurs de changer rapidement de focus (par exemple, en raison d’un hologramme nécessitant une interaction directe) peut entraîner une gêne visuelle et de la fatigue. Il est important de réduire la fréquence à laquelle les utilisateurs voient du contenu qui change de profondeur ou à laquelle ils doivent changer rapidement de focus entre un hologramme proche et un hologramme éloigné.

Autres considérations sur HoloLens 2 et les distances d’interaction proches

Lorsque vous concevez du contenu pour une interaction directe (proche) dans HoloLens 2, ou dans des applications où le contenu doit être placé à une distance inférieure à 1 mètre, il est important de garantir le confort visuel de l’utilisateur. Les risques de gêne dus au conflit vergence-accommodation augmentent de façon exponentielle lorsque la distance d’affichage diminue. De plus, l’utilisateur peut constater que l’image devient plus floue à mesure que le contenu avec lequel il interagit se rapproche. Il est donc recommandé de tester l’affichage du contenu dans la zone de positionnement optimal des hologrammes, mais également à une distance plus proche (inférieure à 1 mètre du plan de découpage) afin de garantir un affichage net et confortable.

Nous vous recommandons de créer un « budget profondeur » pour les applications, dans lequel vous évaluerez le nombre de fois qu’un utilisateur doit s’attendre à voir du contenu proche (à une distance inférieure à 1 mètre) et à voir des changements de profondeur. Par exemple, vous pouvez limiter ces situations à 25 % du temps. Si le budget profondeur est dépassé, nous vous recommandons de procéder à de nombreux tests utilisateur pour garantir une utilisation confortable.

En général, nous recommandons également de procéder à de nombreux tests afin de veiller à ce que les demandes d’interaction (rapidité de mouvement, accessibilité, etc.) restent confortables pour les utilisateurs à des distances d’interaction plus proches.

Conseils pour les appareils immersifs

Les instructions et les bonnes pratiques relatives à HoloLens s’appliquent également aux appareils immersifs. Toutefois, les valeurs de la zone de confort changent en fonction de la distance focale de l’écran. En général, les distances focales de ces écrans sont comprises entre 1,25 m et 2,5 m. En cas de doute, évitez d’afficher les objets d’intérêt trop près de l’utilisateur et essayez plutôt de conserver une distance minimale de 1 mètre.

Écart pupillaire et décalage vertical

Lorsque vous affichez du contenu numérique sur des casques audiovisuels, la position des yeux de l’utilisateur par rapport à la position d’affichage du contenu numérique est essentielle. Plus précisément, l’écart pupillaire (IPD) et le décalage vertical (VO) sont importants pour garantir un confort de lecture du contenu numérique sur les casques audiovisuels.

L’écart pupillaire fait référence à la distance qui sépare les deux pupilles, c’est-à-dire le centre des yeux de l’utilisateur. Le décalage vertical fait référence au décalage vertical potentiel du contenu numérique qui est présenté à chaque œil par rapport à l’axe horizontal des yeux de l’utilisateur (important : ce n’est pas la même chose que le décalage horizontal ou que la disparité binoculaire). Si l’un de ces facteurs, voire les deux, ne sont pas respectés, cela peut augmenter la gêne causée par le conflit vergence-accommodation, même après réduction de celui-ci (par exemple, en affichant du contenu à une distance focale de 2 mètres du casque HoloLens).

Conseils pour les appareils holographiques

HoloLens (1ère génération)

Pour HoloLens (1ère génération), l’écart pupillaire est estimé et défini lors de l’étalonnage de l’appareil. Les nouveaux utilisateurs qui disposent d’un appareil déjà configuré doivent effectuer l’étalonnage ou définir manuellement l’écart pupillaire. Le décalage vertical dépend entièrement de la manière dont l’appareil est ajusté. En effet, pour réduire la valeur du décalage vertical, l’utilisateur doit placer le casque sur sa tête de telle sorte que l’écran soit au niveau de l’axe de ses yeux.

HoloLens 2

Pour HoloLens 2, l’écart pupillaire est estimé et défini au cours de l’étalonnage du regard ou de l’appareil. Les nouveaux utilisateurs qui disposent d’un appareil déjà configuré doivent effectuer l’étalonnage ou vérifier que l’écart pupillaire est correctement défini. Le décalage vertical est pris en compte automatiquement dans HoloLens 2.

Conseils pour les appareils immersifs

Les casques audiovisuels immersifs Windows Mixed Reality ne permettent pas d’étalonner automatiquement l’écart pupillaire et le décalage vertical. L’écart pupillaire peut être défini manuellement dans le logiciel (dans les paramètres du portail de réalité mixte, sous Étalonnage). Certains casques audiovisuels comprennent un curseur mécanique qui permet à l’utilisateur d’ajuster l’espacement des verres sur une position confortable correspondant approximativement à son écart pupillaire.

Fréquences d’images

Les applications de réalité mixte sont uniques, dans le sens où les utilisateurs peuvent se déplacer librement dans le monde réel tout en interagissant avec du contenu virtuel, comme s’ils s’agissait d’objets réels. Pour maintenir cette impression, il est essentiel d’afficher les hologrammes de manière à ce qu’ils paraissent stables dans le monde réel et s’animent progressivement. Un rendu avec un minimum de 60 images par seconde (FPS) permet d’atteindre cet objectif. Certains appareils de réalité mixte prennent en charge le rendu à des fréquences d’images de plus de 60 FPS. Pour ces appareils, il est recommandé d’augmenter la fréquence d’images afin d’offrir une expérience utilisateur optimale.

Pour aller plus loin

Pour créer des hologrammes qui paraissent stables dans le monde réel comme dans le monde virtuel, les applications doivent rendre les images depuis la position de l’utilisateur. Étant donné que le rendu d’images prend du temps, HoloLens et les autres appareils Windows Mixed Reality doivent prédire à quel endroit sera la tête de l’utilisateur lorsque les images seront affichées sur l’écran. Cet algorithme de prédiction permet d’obtenir une approximation. Les algorithmes et le matériel Windows Mixed Reality ajustent l’image affichée en tenant compte de l’écart entre la position prédite de la tête et sa position réelle. Avec ce processus, l’image que voit l’utilisateur paraît s’afficher au bon endroit et les hologrammes semblent stables. Les mises à jour fonctionnent mieux pour les légers changements de position de la tête et elles ne peuvent pas entièrement tenir compte des différences entre les images affichées, comme celles provoquées par la parallaxe de mouvement.

En utilisant un rendu de fréquence d’images minimale de 60 FPS, vous effectuez deux opérations qui permettent de stabiliser les hologrammes :

  1. Vous réduisez l’impression de vibration, qui se caractérise par des mouvements irréguliers et des images dédoublées. Les mouvements rapides des hologrammes et les fréquences d’images peu élevées provoquent une impression de vibration plus prononcée. Par conséquent, en gardant une fréquence d’images de 60 FPS (ou la fréquence d’images maximale de votre appareil), vous pouvez éviter l’impression de vibration qui est associée au mouvement des hologrammes.
  2. Vous réduisez la latence globale. Dans un moteur où sont exécutés conjointement un thread de jeu et un thread de rendu, l’utilisation d’une fréquence d’images de 30 IPS peut ajouter une latence supplémentaire de 33,3 ms. En réduisant la latence, vous diminuez le risque d’erreur de prédiction et vous augmentez la stabilité des hologrammes.

Analyse des performances

Différents outils peuvent être utilisés pour évaluer la fréquence d’images de votre application. En voici quelques exemples :

  • GPUView
  • Le débogueur de graphiques Visual Studio
  • Les profileurs intégrés aux moteurs 3D, tels que Frame Debugger dans Unity

Mouvement propre et locomotion utilisateur

La seule limitation est liée à la taille de votre espace physique. Si vous souhaitez permettre aux utilisateurs d’aller plus loin dans l’environnement virtuel qu’ils ne le peuvent dans l’espace physique où ils se trouvent, vous devez implémenter une forme de mouvement purement virtuel. Toutefois, un mouvement virtuel prolongé ne correspondant pas au mouvement physique réel de l’utilisateur peut parfois provoquer des vertiges et des nausées. Ceci est dû au fait que les signaux visuels obtenus par les mouvements propres effectués dans le monde virtuel sont en conflit avec les signaux vestibulaires obtenus par les mouvements propres effectués dans le monde réel.

Heureusement, il existe des astuces d’implémentation de la locomotion utilisateur qui permettent d’éviter ce problème :

  • Permettez toujours à l’utilisateur de contrôler ses mouvements. Les mouvements propres inattendus sont problématiques.
  • Les êtres humains sont sensibles au sens de la gravité. Par conséquent, il faut éviter les mouvements verticaux dont l’utilisateur n’est pas à l’initiative.

Conseils pour les appareils holographiques

L’une des méthodes possibles pour permettre à l’utilisateur de se déplacer dans un grand environnement virtuel consiste à lui donner l’impression qu’il déplace un petit objet dans la scène. Cet effet peut être obtenu de la façon suivante :

  1. Fournissez une interface dans laquelle l’utilisateur peut sélectionner un endroit de l’environnement virtuel vers lequel il souhaite se déplacer.
  2. Une fois la sélection effectuée, réduisez le rendu de la scène à un disque entourant l’endroit souhaité.
  3. Tout en maintenant la sélection de l’endroit, permettez à l’utilisateur de le déplacer comme s’il s’agissait d’un petit objet. L’utilisateur peut alors déplacer la sélection à proximité de ses pieds.
  4. Lorsque vous désélectionnez l’endroit, vous revenez au rendu intégral de la scène.

Conseils pour les appareils immersifs

La méthode précédente qui s’applique aux appareils holographiques ne fonctionne pas aussi bien sur les appareils immersifs, car elle implique que l’application affiche un grand écran noir ou un autre environnement par défaut lors du déplacement du disque de sélection. De cette façon, l’utilisateur perd la sensation d’immersion. Pour la locomotion utilisateur avec un casque immersif, il existe une astuce appelée la méthode « blink ». Cette implémentation permet à l’utilisateur de contrôler ses mouvements et donne une brève impression de mouvement. Cependant, cette impression est si brève que l’utilisateur est moins susceptible d’être désorienté par ses mouvements propres purement virtuels :

  1. Fournissez une interface dans laquelle l’utilisateur peut sélectionner un endroit de l’environnement virtuel vers lequel il souhaite se déplacer.
  2. Lors de la sélection, commencez par simuler un mouvement rapide (100 m/s) vers cet endroit tout en faisant disparaître rapidement le rendu.
  3. Une fois la translation terminée, affichez de nouveau le rendu.

Affichage tête haute

Dans les jeux vidéos de tir à la première personne, l’affichage tête haute présente des informations persistantes, telles que la santé du joueur, des mini-cartes ou des inventaires, directement sur l’écran. L’affichage tête haute permet de tenir le joueur informé sans perturber le jeu. Dans les expériences de réalité mixte, l’affichage tête haute peut provoquer une gêne importante et doit être adapté aux contextes les plus immersifs. Plus particulièrement, les affichages tête haute qui sont verrouillés sur l’orientation de la tête de l’utilisateur sont susceptibles d’entraîner une gêne. Si une application nécessite un affichage tête haute, nous vous recommandons de choisir un verrouillage du corps plutôt qu’un verrouillage de la tête. Cela peut être implémenté sous forme d’ensemble d’affichages immédiatement translatés pour l’utilisateur, mais qui ne pivoteront pas avec la tête de l’utilisateur tant qu’un certain seuil de rotation n’aura pas été atteint. Une fois la rotation effectuée, l’affichage tête haute peut se réorienter pour présenter les informations dans le champ visuel de l’utilisateur. Évitez d’implémenter la rotation et la translation « 1:1 » de l’affichage tête haute en fonction des mouvements de tête de l’utilisateur.

Lisibilité du texte

Une lisibilité optimale du texte peut réduire la fatigue oculaire et assurer le confort visuel des utilisateurs, en particulier dans les applications ou les scénarios qui obligent les utilisateurs à lire quand ils se servent d’un casque audiovisuel. La lisibilité du texte dépend de différents facteurs, notamment :

  • Les propriétés d’affichage telles que la densité des pixels, la luminosité et le contraste.
  • Les propriétés des lentilles comme les aberrations chromatiques.
  • Les propriétés de texte/police telles que le poids, l’espacement, les empattements et la couleur de police/d’arrière-plan.

En général, nous vous recommandons de tester la lisibilité sur certaines applications et d’agrandir autant que possible les tailles de police pour un confort visuel maximal. Vous trouverez des conseils plus détaillés sur les appareils holographiques et immersifs dans nos pages Typographie et Texte dans Unity.

Considérations relatives aux cadres holographiques

Pour les expériences de réalité mixte avec des objets volumineux ou nombreux, il est essentiel de prendre en compte l’étendue du déplacement de la tête et du cou nécessaire pour interagir avec le contenu. En termes de mouvement de la tête, les expériences peuvent être divisées en trois catégories :

  • Horizontales (d’un côté à l’autre)
  • Verticales (vers le haut et vers le bas)
  • Immersives (à la fois horizontales et verticales)

Dans la mesure du possible, limitez la plupart des interactions aux catégories horizontales ou verticales. Dans l’idéal, la plupart des expériences doivent avoir lieu au centre du cadre holographique quand la tête de l’utilisateur se trouve dans une position neutre. Évitez les interactions qui obligent l’utilisateur à déplacer constamment sa vue dans des positions de tête non naturelles (par exemple, regarder tout le temps en haut pour accéder à une interaction de menu essentielle).

La région optimale pour le contenu est comprise entre 0 et 35 degrés en dessous de l’horizon
La région optimale pour le contenu est comprise entre 0 et 35 degrés en dessous de l’horizon

Les mouvements horizontaux de la tête conviennent davantage aux interactions fréquentes, tandis que les mouvements verticaux doivent être réservés aux événements rares. Par exemple, une expérience impliquant une longue chronologie horizontale doit limiter le mouvement vertical de la tête aux interactions (comme la recherche d’un menu).

Favorisez le mouvement complet du corps, plutôt que juste le déplacement de la tête, en plaçant des objets autour de l’espace de l’utilisateur. En cas d’expérience avec des objets en mouvement ou de grands objets, vous devez prêter une attention particulière aux mouvements de la tête, en particulier quand ils nécessitent un mouvement fréquent le long des axes horizontal et vertical.

Direction du regard

Pour éviter la fatigue oculaire et les douleurs cervicales, le contenu doit être conçu de manière à éviter de trop nombreux mouvements des yeux et du cou.

  • Évitez les angles de regard de plus de 10 degrés au-dessus de l’horizon (mouvement vertical)
  • Évitez les angles de regard de plus de 60 degrés en dessous de l’horizon (mouvement vertical)
  • Évitez les rotations du cou de plus de 45 degrés par rapport au centre (mouvement horizontal)

L’angle de regard optimal (de repos) est situé entre 10 et 20 degrés en dessous de l’horizon, car la tête tend à pencher légèrement vers le bas, en particulier pendant les activités.

Positions des bras

Une fatigue musculaire peut s’installer si les utilisateurs sont censés garder une main levée pendant toute la durée de l’expérience. Les clics aériens répétés peuvent également se révéler fatigants s’ils doivent être effectués sur une longue période. Nous vous recommandons donc d’éviter les expériences qui exigent des gestes répétés ou maintenus. Pour cela, vous pouvez intégrer de courtes pauses ou proposer une combinaison de saisies gestuelles et vocales pour interagir avec l’application.

Voir aussi