Présentation des formats de fichiers XML dans Office 2010

 

S’applique à : Office 2010

Dernière rubrique modifiée : 2016-11-29

Microsoft Office 2010 et Microsoft Office System 2007 prennent en charge des formats de fichiers XML robustes qui simplifient l’échange de données entre les applications Office et les systèmes d’entreprise. Basés sur des normes ouvertes, ces formats de fichiers XML autorisent la création rapide de documents à partir de différentes sources de données et accélèrent l’assemblage de document, l’exploration de données et la réutilisation du contenu.

Office System 2007 prend en charge la norme ECMA-376 Office Open XML Formats, soumise ultérieurement à l’ISO/IEC et publiée fin 2008 sous le nom de norme ISO/IEC 29500 Office Open XML Formats. Office 2010 fournit une prise en charge en lecture de la norme ECMA-376, une prise en charge en lecture/écriture de la norme ISO/IEC 29500 Transitional et une prise en charge en lecture de la norme ISO/IEC 29500.

La documentation relative à la norme ISO/IEC 29500 Office Open XML Formats est disponible auprès de l’ISO/IEC et la documentation relative à la norme ECMA-376 est disponible auprès d’Ecma International. Pour obtenir des informations détaillées sur la prise en charge de ces formats dans Office 2010 et Office System 2007, voir Documents aux formats de fichiers Microsoft Office (éventuellement en anglais) (https://go.microsoft.com/fwlink/?linkid=191143\&clcid=0x40C) sur MSDN.

Dans cet article :

  • Avantages offerts par les formats Open XML

  • Structures des formats Open XML

Avantages offerts par les formats Open XML

Les formats Open XML procurent plusieurs avantages aux développeurs, professionnels de l’informatique et utilisateurs, notamment les suivants :

  • Format de fichier compact   Les documents sont compressés automatiquement, jusqu’à 75 pour cent.

  • Amélioration de la récupération des fichiers endommagés   Le stockage de données modulaire permet d’ouvrir les fichiers même si un composant du fichier (tel qu’un graphique ou un tableau) est endommagé.

  • Amélioration de la sécurité des documents   Le code incorporé, tel que les objets OLE ou le code Microsoft Visual Basic pour Applications (VBA), est stocké dans une section distincte dans le fichier afin de pouvoir être facilement identifié en vue d’un traitement spécial. Les administrateurs informatiques peuvent bloquer les documents qui contiennent des macros ou des contrôles indésirables. Ceci contribue à renforcer la sécurité des documents pour les utilisateurs lorsqu’ils sont ouverts.

  • Facilité d’intégration   Les développeurs disposent d’un accès direct au contenu spécifique dans le fichier, tel que les graphiques, commentaires et métadonnées de documents.

  • Transparence et amélioration de la sécurité des informations   Les documents peuvent être partagés en toute confidentialité car les informations personnellement identifiables et les informations d’entreprise confidentielles (telles que les noms d’utilisateurs, commentaires, modifications suivies et chemins d’accès aux fichiers) peuvent être identifiées et supprimées facilement.

  • Compatibilité   Grâce au Pack de compatibilité Microsoft Office, les utilisateurs des éditions Microsoft Office 2000, Microsoft Office XP et Microsoft Office 2003 peuvent ouvrir, modifier et enregistrer des documents dans l’un des nouveaux formats XML.

Structures des formats Open XML

La structure de base des formats Open XML se compose des cinq éléments suivants, qui sont décrits plus en détail dans les sections qui suivent.

  • Partie de démarrage   Partie la plus haut placée dans la hiérarchie.

  • Parties XML   Fichiers ou dossiers constitués de code XML qui composent le contenu du fichier.

  • Parties non-XML   Parties autres que du code XML, généralement des images ou des objets OLE.

  • Partie de relation   Type de partie qui pointe généralement vers d’autres parties pour définir la hiérarchie relationnelle de la structure de parties.

  • Package ZIP   Empaquète les parties en un fichier unique.

Partie de démarrage

La partie de démarrage, une partie XML qui est également une partie de relation et peut être considérée comme la partie de rang supérieur, détermine le type de fichier. Par exemple, si le nom du conteneur principal est WordDoc, l’extension de nom de fichier est .docx.

Parties XML

Lorsqu’un fichier Office au format XML est enregistré dans Office 2010 ou Office System 2007, il est divisé en un ensemble de parties logiques qui décrit le fichier entier. Pour Microsoft Word, la division du fichier en ces parties permet de l’interroger ou de le modifier facilement en dehors de l’application Office d’origine.

Il est par exemple plus facile pour un développeur de supprimer des propriétés de document d’un fichier car elles sont placées dans une partie unique et celle-ci peut simplement être supprimée du conteneur de document. Avec WordprocessingML (fourni comme format de fichier XML facultatif dans Office 2003), la suppression de commentaires nécessitait l’analyse du fichier entier afin de rechercher et supprimer le code XML représentant le contenu du commentaire. Avec le nouveau format de fichier, les données liées aux fonctionnalités sont divisées en parties. Les commentaires, liens, en-têtes, pieds de page et autres données se trouvent dans des parties distinctes qui peuvent être supprimées. Il est inutile d’analyser le document Word entier.

Parties non-XML

Les parties non-XML sont généralement des images ou des objets OLE. Tout type de fichier qui utilise du contenu binaire ou n’utilise pas de code XML est identifié comme non-XML. Une partie non-XML est en général un fichier attaché ou incorporé à un document. La documentation du schéma de format de fichier Word explique la relation littérale et la hiérarchie de schéma utilisées par Word pour les fichiers de ce type.

Partie de relation

Une partie de relation est du code XML qui pointe vers d’autres parties et définit la hiérarchie relationnelle des parties. La plupart des parties XML de haut niveau sont des parties de relation. Les parties XML qui contiennent des données et ne pointent pas vers d’autres parties sont également appelées « primitives » et leur type de contenu est généralement application/xml.

Package ZIP

L’utilisation d’un package ZIP procure les avantages suivants dans toutes les applications :

  • Norme ouverte   L’algorithme de compression ZIP est une norme ouverte bien définie.

  • Réduction de la taille de fichier   Les fichiers sont généralement plus petits qu’un fichier binaire équivalent. En moyenne, les fichiers Open XML Word sont 75 pour cent plus petits que leurs équivalents binaires, selon le nombre d’images.

  • Amélioration de la robustesse   Les fichiers sont plus robustes et moins sensibles aux erreurs potentiels dans le fichier. Auparavant, les fichiers devaient être totalement intacts pour fonctionner correctement.

Bien que le recours à un package ZIP signifie que le fichier est binaire, le jeu d’interfaces de programmation d’application (API, Application Programming Interface) WinFX fournit une prise en charge native du format de package dans l’espace de noms System.IO.Packaging. Cela permet aux développeurs de créer des outils qui traitent le format et opèrent directement sur le modèle logique (les parties) sans avoir à se soucier de l’expansion ou de la compression du package.