Grundlegendes zum Binärdateiformat Outlook MS-PST Binary File Format (maschinell übersetzt)
Wichtig
Dieser Artikel wurde maschinell übersetzt. Bitte beachten Sie den Haftungsausschluss. Die englische Version des Artikels ist als Referenz hier verfügbar: here.
Zusammenfassung: Hier erhalten Sie Informationen zu dem in Microsoft Outlook verwendeten Binärdateiformat MS-PST, einschließlich der grundlegenden Struktur und zentraler Konzepte für die programmgesteuerte Interaktion mit diesem Format.
Letzte Änderung: Donnerstag, 23. Juni 2011
Gilt für: Office 2007 | Office 2010
Inhalt dieses Artikels
Übersicht über MS-PST-Dateiformat
Schlussbemerkung
Weitere Ressourcen
Veröffentlicht: Februar 2011
Zur Verfügung gestellt von: Microsoft Corporation
Inhalt
Übersicht über MS-PST-Dateiformat
Hauptkomponenten von MS-PST-Dateiformat
Extrahieren von Daten aus einer Datei von Outlook
Schlussbemerkung
Weitere Ressourcen
Dieser Artikel beschreibt die Strukturen und einige Verfahren zum Arbeiten mit MS-PST-Dateien. Es ist der Teil einer Serie von Artikeln, die die binären Dateiformaten wird von Microsoft Office Produkten vorstellen. Diese Artikel sind für die Verwendung in Verbindung mit der Microsoft Office File Format Documents auf MSDN vorgesehen.
Grundlegendes zu Grafiken in Office-Binärdateiformaten (maschinell übersetzt)
Grundlegendes zum Binärdateiformat Excel MS-XLS (maschinell übersetzt)
Grundlegendes zu Office-Binärdateiformaten (maschinell übersetzt)
Grundlegendes zum Binärdateiformat MS-PPT in PowerPoint (maschinell übersetzt)
Übersicht über MS-PST-Dateiformat
Das binäre Dateiformat von MS-PST-Datei ist die lokale Nachrichtenspeicher für Microsoft Outlook. Microsoft Outlook 2010, Microsoft Office Outlook 2007, Microsoft OfficeOutlook 2003, Microsoft Outlook 2002, und Microsoft Outlook 2000 verwenden Sie dieses Format. Es basiert auf den Exchange-Datenspeicher, der proprietären und gar nicht im Zusammenhang mit SQL oder einer anderen Allzweck-Datenbank-Umgebung ist. Eine PST-Datei stellt einen Nachrichtenspeicher, der eine Hierarchie von Ordnern enthält, und diese Ordner enthalten Nachrichten, die selbst Anlagen enthalten kann. Informationen zu Ordnern, Nachrichten und Anlagen werden in den Eigenschaften gespeichert.
Hauptkomponenten von MS-PST-Dateiformat
Auf der logischen Ebene eine PST-Datei bestehen aus drei Schichten: der Knoten-Datenbank (NDB) Ebene, die Listen, Tabellen und Eigenschaften (LTP), auch die Messaging-Ebene.
Die NDB-Schicht umfasst den Header, Datei Zuordnungsinformationen, und Knoten und Blöcke, die die Meldungsdaten zu halten sowie Knoten, mit deren Hilfe die Daten zu suchen. Es verwendet zwei Btrees, um Daten zu suchen: die Knoten BTree (NBT) und Block Btree (BBT).
Die Eigenschaften (LTP) Ebene befasst sich hauptsächlich mit Eigenschaften, die in zweidimensionale Tabellen gespeichert.
Die Messaging-Schicht ist die Logik, die beiden anderen Schichten in Ordnern, Nachrichten, Anlagen und Eigenschaften zu kombinieren.
Auf der physikalischen Ebene die Datei beginnt mit einem Header, gefolgt von einer Liste optionaler Dichte und dann eine Reihe von Mapping-Strukturen Vorlagenverzeichnissen in festgelegten Intervallen zwischen Datenblöcke. Die Mapping-Strukturen mit fester Größe sind, und wiederholen Sie so oft wie nötig, um Bereiche der Daten zu kapseln, zunehmender Dateigröße. Die Reihenfolge, in eine Datei finden Sie im folgende Diagramm im section 1.3.2 der MS-PST-Dokumentation.
Warnung
Die meisten PST-Dateien verwenden Unicode-Text, aber einige älteren Versionen von Outlook ANSI-basierte PST-Dateien erstellen. Ihr Code sollte, ob die PST-Datei Unicode oder ANSI, erkennen, da in ANSI-Dateien, die Offsets, wo die verschiedenen Teile der Datei gespeichert sind, anders berechnet werden müssen.
Header-Struktur
Die Headerstruktur befindet sich ganz am Anfang der Datei, und enthält drei Hauptgruppen von Informationen: Metadaten, Stammdatensatz und ersten freien Map (FMap) und freie Seite zuordnen (FPMap).
Allocation Map (AMap)-Seite
Eine Allocation Map (AMap) Seite verfolgt den Zuordnungsstatus des Datenabschnitts, die die AMap-Seite in der Datei unmittelbar folgt. Sie können die vollständige AMap-Seite als ein Array von Bits, anzeigen, wobei jedes Bit der Allocation Status des 64-Byte an Daten entspricht. Eine AMap-Seite wird ca. alle 250 KB in der PST-Datei angezeigt.
-
Die Liste der Dichte (DList) ist eine Liste von Verweisen auf AMap-Seiten, die nach der Dichte aufsteigend sortiert. Die Speicherplatzzuordnung optimiert, dass die Daten zunächst in den Abschnitten mit dem meisten freien Speicher geschrieben werden. Die DList befindet sich immer am Offset in der Datei 0x4200.
Denken Sie daran, dass einige älteren Versionen des Outlook eines DList nicht verwenden. Darüber hinaus die DList kann manchmal durch vorübergehende Prozesse überschrieben werden und möglicherweise eine ungültige zyklische Redundanzprüfung (CRC) zurück.
Andere Seitenzuordnungen
In PST-Dateien, die keine gültige DList enthalten, können Sie navigieren Sie mithilfe der folgenden AMap-ähnliche legacy-Zuordnung-Strukturen, die für die Abwärtskompatibilität und reparierte Datei Positionen verwalten verwaltet werden.
Page Map (PMap)-Seite
Eine Page Map (PMap)-Seite dient zum Speichern der BBT und NBT, die größten Teil der Metadaten in der PST-Datei enthalten, für die Suche der verfügbaren Seiten optimieren. Die Seite PMap beträgt 512 Byte und ordnet 512-Byte-Seiten. Eine PMap-Seite wird ca. alle 2 MB bzw. eine PMap Seite für jede 8 AMap Seiten angezeigt.
Free Map (FMap)-Seite
Eine Free Map (FMap)-Seite bietet einen Mechanismus zusammenhängenden freien Speicherplatz schnell zu finden. Jedes Byte in der FMap-Seite entspricht einer AMap-Seite. Der Wert jedes Byte gibt die maximale Anzahl von freien Bits, die in der entsprechenden AMap-Seite gefunden. Jede Seite FMap (496 Bytes) umfasst ca. 125 MB Daten.
Free Page Map (FPMap)-Seite
Jedes Bit in der Free Page Map (FPMap)-Seite zu einer Seite PMap entspricht, und der Wert des Bits angibt, ob es freien Seiten innerhalb dieser PMap-Seite sind. 496 Bytes umfasst eine Seite FPMap ca. 8 GB Speicherplatz.
Andere Strukturen
Es gibt zu viele wichtige Strukturen in einer PST-Datei, um alle in den Anwendungsbereich dieses Artikels zu definieren. Hier sind einige Core-Strukturen, die sie auf erstellt werden.
-
Blöcke stellen die grundlegende Einheit der Datenspeicherung auf der Ebene der NDB. Blöcke werden in Größen zugewiesen, die ein Vielfaches von 64 Bytes und ausgerichteten auf 64-Byte-Grenzen bis zu einem Maximum von 8 KB sind. Jeder Block speichert seine Metadaten in einem Block Anhänger am Ende des Blocks. Datenblöcke raw-Daten gespeichert werden. Unterknoten Blöcke repräsentieren die untergeordneten Knoten in einem Knoten enthaltene.
-
Ein Knoten besteht aus einem Datenblock und ein Subnode BTree. Es wird verwendet, um PST-Daten in logische Streams zu unterteilen.
Node BTree (NBT) and Block BTree (BBT)
Verweise auf alle Knoten zugänglich und Blöcke in der Datei enthalten, die NBT (Node BTree) und Block BTree (BBT). Sie befinden sich in der ROOT-Knoten des Headers.
Property Context (PC)-Datensätze
Nachrichteneigenschaften werden als Property Context (PC)-Datensätze auf die LPT-Ebene gespeichert. Ein Datensatz PC baut auf den Knoten-Datenstrom auf eine BTree-on-Heap (BTH).
Extrahieren von Daten aus einer Datei von Outlook
PST-Dateien sind Groß und komplex. Anstatt zu versuchen, einen benutzerdefinierte PST-Reader zu erstellen, können Sie die PST-Datei-Format-SDK. Die PST-Datei-Format-SDK enthält ausreichende Tools und Dokumentation Nachricht Extraktion und andere grundlegenden Aufgaben ausführen. Sie können auch die internen Strukturen einer PST-Datei suchen, mit dem Tool zum Anzeigen von PST-Daten-Struktur.
Schlussbemerkung
Verständnis und Arbeiten mit Binärdatei im Allgemeinen formatiert und das MS-PST-Dateiformat kann insbesondere eine Herausforderung sein. Glücklicherweise existiert die PST-Datei-Format-SDK um dies zu erleichtern. Durch die Kombination die Informationen in diesem Artikel mit den Tools und Dokumentation im SDK bereitgestellten und die Spezifikationen zu offenen Dokumenten als Referenz verwenden, haben Sie mehrere Tools, die Sie beim Erreichen Ihrer Ziele unterstützen.
Weitere Ressourcen
Weitere Informationen finden Sie in den folgenden Ressourcen:
Microsoft Office File Format Documents
[MS-DOC]: Word Binary File Format (.doc) Structure Specification
[MS-PPT]: PowerPoint Binary File Format (.ppt) Structure Specification
[MS-XLS]: Excel Binary File Format (.xls) Structure Specification
Grundlegendes zum Binärdateiformat Excel MS-XLS (maschinell übersetzt)
Grundlegendes zu Office-Binärdateiformaten (maschinell übersetzt)
Grundlegendes zum Binärdateiformat MS-PPT in PowerPoint (maschinell übersetzt)
Hinweis
Haftungsausschluss für maschinelle Übersetzungen: Dieser Artikel wurde mithilfe eines Computersystems und ohne jegliche Bearbeitung durch Personen übersetzt. Microsoft bietet solche maschinellen Übersetzungen als Hilfestellung für Benutzer ohne Englischkenntnisse an, damit Sie von den Informationen zu Produkten, Diensten und Technologien von Microsoft profitieren können. Da es sich bei diesem Artikel um eine maschinelle Übersetzung handelt, enthält er möglicherweise Fehler in Bezug auf (Fach-)Terminologie, Syntax und/oder Grammatik.