Partager via


Références de caractères et d'entités

Les références de caractères et d'entités permettent d'inclure des informations dans des documents XML par référence plutôt qu'en tapant des caractères directement dans le document. Cela peut être utile dans les cas où :

  • des caractères ne peuvent pas être introduits directement dans un document parce qu'ils seraient interprétés comme des balises ;

  • des caractères ne peuvent pas être introduits directement dans un document en raison de limitations de l'appareil de saisie ;

  • des caractères ne peuvent pas être transportés de manière fiable via un processeur limité à des caractères codés sur un octet ;

  • une chaîne de caractères ou un fragment de document apparaît de manière répétée et peut être abrégé.

Pour représenter le contenu, XML offre un certain nombre de constructions syntaxiques commençant par une esperluette (&) et se terminant par un point-virgule (;).

Les références de caractères permettent d'insérer des caractères Unicode identifiés par un nombre qui pointe vers un point de code Unicode. Les points de code peuvent être identifiés en notation décimale ou hexadécimale.

  • & #value;
    Syntaxe utilisée pour les références décimales.
  • &# xvalue;
    Syntaxe utilisée pour les références hexadécimales.

Par exemple, pour insérer le symbole de l'euro, un caractère qui manque encore sur bien des claviers, vous pouvez insérer € ou € dans un document.

Le tableau suivant énumère les cinq entités intégrées correspondant aux caractères utilisés pour les balises XML.

Entité Référence d'entité Signification

lt

<

< (inférieur à)

gt

&gt;

> (supérieur à)

amp

&amp;

& (esperluette)

apos

&apos;

' (apostrophe ou guillemet simple)

quot

&quot;

" (guillemet double)

Lorsqu'un caractère risque de provoquer une mauvaise interprétation de la structure du document par l'analyseur XML, utilisez l'entité au lieu de taper simplement ce caractère. Les références d'entité &apos; et &quot; sont très couramment utilisées dans les valeurs des attributs.

Pour écrire Me&You, par exemple, utilisez Me&amp;You. Pour a<b, utilisez a&lt;b. Pour b>c, utilisez b&gt;c.

Vous pouvez aussi définir vos propres entités, de la façon dont le HTML définit une série d'entités à utiliser en HTML. &apos n'est pas reconnu comme un fichier HTML ; $#.... doit être utilisé lors de la transformation en HTML.

Si vous utilisez une DTD qui possède des entités définies, vous pouvez y faire référence dans le contenu d'un document en utilisant la syntaxe suivante.

&entityName;