Partager via


Présentation du format de fichier binaire Outlook MS-PST (traduction automatique)

Important

Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Résumé : Découvrez le format de fichier binaire MS-PST utilisé dans Microsoft Outlook, y compris les structures de base et les concepts fondamentaux pour interagir sur celui-ci par programmation.

Dernière modification : jeudi 23 juin 2011

S’applique à : Office 2007 | Office 2010

Dans cet article
Vue d'ensemble du Format de fichier PST-MS
Conclusion
Ressources supplémentaires

**S'applique à:**Microsoft Outlook 2010 | Microsoft Office Outlook 2007 | Microsoft OfficeOutlook 2003 | Microsoft Outlook 2002 | Microsoft Outlook 2000

Publication :  Février 2011

Fournie par :  Microsoft Corporation

Sommaire

  • Vue d'ensemble du Format de fichier PST-MS

  • Composants clés du Format de fichier PST-MS

  • Extraction de données à partir d'un fichier Outlook

  • Conclusion

  • Ressources supplémentaires

Cet article décrit les structures et des procédures permettant de travailler avec les fichiers PST-MS. Il s'agit de la partie d'une série d'articles qui présentent les formats de fichier binaire utilisés par les produits de Microsoft Office. Ces articles sont conçus pour être utilisé en conjonction avec le Microsoft Office File Format Documents sur MSDN.

Vue d'ensemble du Format de fichier PST-MS

Le format de fichier binaire MS PST est la banque de messages locale pour Microsoft Outlook. Microsoft Outlook 2010, Microsoft Office Outlook 2007, Microsoft OfficeOutlook 2003, Microsoft Outlook 2002 et Microsoft Outlook 2000 utilisent ce format. Il est basé sur la banque de données Exchange, qui n'est pas du tout liés à SQL ou tout autre environnement de base de données d'usage général et propriétaires. Un fichier .pst représente une banque de messages qui contient une hiérarchie de dossiers, et ces dossiers contiennent des messages, qui peuvent eux-mêmes contenir des pièces jointes. Informations sur les dossiers, les messages et pièces jointes sont stockées dans les propriétés.

Composants clés du Format de fichier PST-MS

Au niveau logique, un fichier .pst a trois couches : la couche de base de données de nœud (NDB), des listes, des Tables et des propriétés (LTP) couche et la couche de messagerie.

  • La couche NDB comprend l'en-tête, des informations d'allocation de fichiers et les nœuds et blocs qui contiennent les données du message, plus nœuds aident à localiser les données. Il utilise deux Btrees pour aider à localiser des données : le nœud BTree (NBT) et le bloc Btree (BBT).

  • La couche de propriétés (LTP) concerne principalement les propriétés, il stocke dans les tableaux à deux dimensions.

  • La couche de messagerie possède la logique pour combiner les deux autres couches dans les dossiers, les messages, les pièces jointes et les propriétés.

Au niveau physique, le fichier démarre avec un en-tête, suivi d'une liste facultative de densité, et ensuite une série de structures de mappage mêlées à intervalles réguliers entre les blocs de données. Les structures de mappage sont de taille fixe et répétez aussi souvent que nécessaire pour encapsuler des zones de données que le fichier augmente. Pour afficher l'ordre dans un fichier, consultez le diagramme suivant dans section 1.3.2 de la documentation de MS-PST.

Avertissement

La plupart des fichiers .pst utiliser texte Unicode, mais certaines anciennes versions de Outlook créent des fichiers .pst sur ANSI. Votre code doit reconnaître si le fichier PST est Unicode ou ANSI, car dans les fichiers ANSI, les décalages où se trouvent les différentes parties du fichier doivent être calculés différemment.

  • structure de Header

    La structure de l'en-tête se trouve au début du fichier et contient trois groupes principaux d'informations : mappent des métadonnées, l'enregistrement racine et carte libre initiale (FMap) et page libre (FPMap).

  • page de Allocation Map (AMap)

    Une page Allocation Map (AMap) effectue le suivi de l'état affectation de la section de données qui suit immédiatement la page AMap dans le fichier. Vous pouvez afficher la page AMap complète en tant que tableau de bits, où chaque bit correspond à l'état de l'allocation de 64 octets de données. Une page de AMap s'affiche environ chaque 250 Ko dans le fichier .pst.

  • Density List (Dlist)

    La Liste de la densité (DList) est une liste de références aux pages AMap, triés dans l'ordre croissant de densité. Il optimise l'allocation d'espace afin que les données sont écrites dans les sections avec le plus d'espace libre de tout d'abord. Le DList est toujours situé au décalage 0x4200 dans le fichier.

    N'oubliez pas que certaines anciennes versions de Outlook n'utilisent pas un DList. En outre, le DList peut parfois être écrasée par les processus transitoire et peut retourner une vérification non valide de redondance cyclique (CRC).

  • Autres pages de mappage

    Dans les fichiers .pst qui ne contiennent pas un DList valide, vous pouvez naviguer en utilisant les structures de mappage hérités AMap similaires suivantes, qui sont conservés pour la compatibilité descendante et à maintenir la position de fichier fixe.

    • page de Page Map (PMap)

      Une page Page Map (PMap) est utilisée pour le stockage BBT et NBT, qui contiennent la plupart des métadonnées dans le fichier .pst, afin d'optimiser pour la recherche des pages disponibles. La page de PMap est de 512 octets et mappe les pages de 512 octets. Une page PMap apparaît environ toutes les 2 Mo, ou page d'un PMap pour toutes les pages AMap 8.

    • page de Free Map (FMap)

      Une page Free Map (FMap) fournit un mécanisme de localiser rapidement les contigu. Chaque octet dans la page FMap correspond à une page AMap. La valeur de chaque octet indique le nombre maximal de bits libres trouvée dans la page correspondante du fichier AMap. Chaque page de FMap (496 octets) s'étend sur environ 125 Mo de données.

    • page de Free Page Map (FPMap)

      Chaque bit de la page Free Page Map (FPMap) correspond à une page de PMap et la valeur du bit indique si toutes les pages dans cette page PMap libres. Avec 496 octets, une page de FPMap s'étend sur environ 8 Go d'espace.

  • Autres structures

    Il y a trop de structures importantes dans un fichier .pst pour les définir dans le cadre de cet article. Voici certaines structures de base qu'ils sont construits sur.

  • Blocks

    Les blocs sont des unités fondamentales de stockage des données au niveau de la couche NDB. Les blocs sont affectés dans des tailles sont un multiple de 64 octets et alignée sur les limites de 64 octets, avec un maximum de 8 Ko. Chaque bloc stocke ses métadonnées dans une remorque de bloc à la fin du bloc. Blocs de données stockent des données brutes. Blocs de sous-nœuds représentent les sous-nœuds contenues dans un nœud.

  • Nodes

    Un nœud se compose d'un bloc de données et un Subnode BTree. Il est utilisé pour diviser les données .pst en flux logiques.

  • Node BTree (NBT) and Block BTree (BBT)

    Le Node BTree (NBT) et Block BTree (BBT) contiennent des références à tous les nœuds accessibles et les blocs dans le fichier. Elles se trouvent dans le nœud ROOT de l'en-tête.

  • enregistrements Property Context (PC)

    Propriétés de message sont stockées au niveau de la couche LPT en tant qu'enregistrements de Property Context (PC). Un enregistrement de PC repose sur les flux de données du nœud sur un BTree-on-Heap (BTH).

Extraction de données à partir d'un fichier Outlook

Fichiers PST sont volumineux et complexes. Plutôt que d'essayer de construire un lecteur .pst personnalisé, vous pouvez utiliser le SDK de Format de fichier PST (éventuellement en anglais). Le Kit de développement du Format de fichier PST inclut les outils et la documentation pour effectuer l'extraction de messages et d'autres tâches de base suffisante. Vous pouvez également parcourir les structures internes d'un fichier .pst à l'aide de l' Outil d'affichage Structure PST données (éventuellement en anglais).

Conclusion

La compréhension et l'utilisation de fichier binaire formate en général, et le format de fichier MS-PST en particulier, peut être un défi. Heureusement, le Kit de développement du Format de fichier PST existe pour faciliter cette opération. En associant les informations contenues dans cet article avec les outils et la documentation fournie avec le Kit de développement et à l'aide de documents de l'ouverture de spécifications en tant que référence, vous avez plusieurs outils pour vous aider à atteindre vos objectifs.

Ressources supplémentaires

Pour plus d’informations, consultez les ressources suivantes :

Notes

Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.