Teilweise indizierte Elemente in der Inhaltssuche
Tipp
eDiscovery (Vorschauversion) ist jetzt im neuen Microsoft Purview-Portal verfügbar. Weitere Informationen zur Verwendung der neuen eDiscovery-Benutzeroberfläche finden Sie unter Informationen zu eDiscovery (Vorschauversion).
Eine Inhaltssuche, die Sie im Microsoft Purview-Complianceportal ausführen, schließt beim Ausführen einer Suche automatisch teilweise indizierte Elemente in die geschätzten Suchergebnisse ein. Teilweise indizierte Elemente sind Exchange-Postfachelemente und -Dokumente auf SharePoint- und OneDrive for Business-Websites, die aus irgendeinem Grund nicht vollständig für die Suche indiziert wurden. In Exchange enthält ein teilweise indiziertes Element in der Regel eine Datei (eines Dateityps, der nicht indiziert werden kann), die an eine E-Mail-Nachricht angefügt ist. Im Folgenden finden Sie einige weitere Gründe, warum Elemente nicht für die Suche indiziert werden können und als teilweise indizierte Elemente zurückgegeben werden, wenn Sie eine eDiscovery-Suche ausführen:
- Der Dateityp wird nicht erkannt oder wird nicht für die Indizierung unterstützt.
- Nachrichten verfügen über eine angefügte Datei, die nicht geöffnet werden kann. dies ist die häufigste Ursache für teilweise indizierte E-Mail-Elemente.
- Der Dateityp wird für die Indizierung unterstützt, aber es ist ein Indizierungsfehler für eine bestimmte Datei aufgetreten.
- Die E-Mail enthält zu viele Dateien im Anhang.
- Die an die E-Mail angehängte Datei ist zu groß.
- Eine Datei wurde mit Technologien von anderen Anbietern als Microsoft verschlüsselt.
- Eine Datei ist kennwortgeschützt.
Hinweis
Die meisten Organisationen verfügen über weniger als 1 % der Inhalte nach Volumen und weniger als 12 % nach Größe, die teilweise indiziert ist. Der Grund für den Unterschied zwischen Volumen und Größe ist, dass größere Dateien mit höherer Wahrscheinlichkeit Inhalte enthalten, die nicht vollständig indiziert werden können.
Für rechtliche Untersuchungen ist Ihre Organisation möglicherweise verpflichtet, teilweise indizierte Elemente zu überprüfen. Sie können auch angeben, ob teilweise indizierte Elemente eingeschlossen werden sollen, wenn Sie Suchergebnisse auf einen lokalen Computer exportieren oder wenn Sie die Ergebnisse für die Analyse mit eDiscovery (Premium) vorbereiten. Weitere Informationen finden Sie unter Untersuchen von teilweise indizierten Elementen in eDiscovery.
Tipp
Wenn Sie kein E5-Kunde sind, verwenden Sie die 90-tägige Testversion von Microsoft Purview-Lösungen, um zu erfahren, wie zusätzliche Purview-Funktionen Ihre Organisation bei der Verwaltung von Datensicherheits- und Complianceanforderungen unterstützen können. Starten Sie jetzt im Testhub für Microsoft Purview-Complianceportal. Erfahren Sie mehr über Anmelde- und Testbedingungen.
Für die Suche nicht indizierte Dateitypen
Bestimmte Dateitypen, z. B. Bitmapdateien (.bmp) oder MP3-Dateien (.mp3), enthalten keinen Inhalt, der indiziert werden kann. Daher führen die Suchindizierungsserver in Exchange und SharePoint keine Volltextindizierung für diese Dateitypen durch. Diese Dateitypen werden als nicht unterstützte Dateitypen betrachtet. Es gibt außerdem Dateitypen, für die die Volltextindizierung deaktiviert wurde (entweder standardmäßig oder durch den Administrator). Nicht unterstützte und deaktivierte Dateitypen werden in Inhaltssuchen als nicht indizierte Elemente bezeichnet. Wie bereits erwähnt, können teilweise indizierte Elemente in die Gruppe der Suchergebnisse aufgenommen werden, wenn Sie eine Suche ausführen, die Suchergebnisse auf einen lokalen Computer exportieren oder Suchergebnisse für eDiscovery (Premium) vorbereiten.
Eine Liste der unterstützten und deaktivierten Dateiformate finden Sie in den folgenden Artikeln:
- Umtausch - Von der Exchange-Suche indizierte Dateiformate
- Umtausch - Get-SearchDocumentFormat
- SharePoint - Standardmäßig durchforstete Dateinamenerweiterungen und analysierte Dateitypen in SharePoint
Nachrichten und Dokumente mit teilweise indizierten Dateitypen können in Suchergebnissen zurückgegeben werden.
Nicht jede E-Mail-Nachricht mit einer teilweise indizierten Dateianlage oder jedes teilweise indizierte SharePoint-Dokument wird automatisch als teilweise indiziertes Element zurückgegeben. Das liegt daran, dass andere Nachrichten- oder Dokumenteigenschaften, z. B. die Subject-Eigenschaft in E-Mail-Nachrichten und die Eigenschaften Title oder Author für Dokumente indiziert sind und für die Suche verfügbar sind. Beispielsweise gibt eine Schlüsselwortsuche nach "financial" Elemente mit einer teilweise indizierten Dateianlage zurück, wenn dieses Schlüsselwort im Betreff einer E-Mail-Nachricht oder im Dateinamen oder Titel eines Dokuments angezeigt wird. Wenn das Schlüsselwort jedoch nur im Textkörper der Datei angezeigt wird, wird die Nachricht oder das Dokument als teilweise indiziertes Element zurückgegeben.
Ebenso werden Nachrichten mit teilweise indizierten Dateianlagen und Dokumente eines teilweise indizierten Dateityps in die Suchergebnisse aufgenommen, wenn andere Nachrichten- oder Dokumenteigenschaften, die indiziert und durchsuchbar sind, den Suchkriterien entsprechen. Zu den Nachrichteneigenschaften, die für die Suche indiziert werden, gehören Sende- und Empfangsdatum, Absender und Empfänger, Dateiname von Anhängen sowie der Nachrichtentext. Zu den für die Suche indizierten Dokumenteigenschaften gehören erstellte und geänderte Daten. Obwohl es sich bei einer Nachrichtenanlage um ein teilweise indiziertes Element handeln kann, wird die Nachricht in die regulären Suchergebnisse aufgenommen, wenn der Wert anderer Nachrichten- oder Dokumenteigenschaften den Suchkriterien entspricht.
Eine Liste der E-Mail- und Dokumenteigenschaften, nach denen Sie mithilfe von eDiscovery-Tools im Complianceportal suchen können, finden Sie unter Schlüsselwortabfragen und Suchbedingungen für eDiscovery.
Hinweis
Wenn ein Postfachelement aus einem Ordner verschoben wird, der indiziert ist, in einen Ordner, der nicht indiziert ist, wird ein Flag festgelegt, um die Indizierung des Elements aufzuheben, und das Element wird aus dem Index entfernt und kann nicht durchsucht werden. Wenn dasselbe Element später zurück in einen ordner verschoben wird, der indiziert ist, wird das Flag nicht zurückgesetzt. Dies bedeutet, dass das Element nicht indiziert und nicht durchsucht werden kann.
Teilweise indizierte Elemente, die in den Suchergebnissen enthalten sind
Ihre Organisation muss möglicherweise zusätzliche Analysen für teilweise indizierte Elemente identifizieren und durchführen, um zu bestimmen, was sie sind, was sie enthalten und ob sie für eine bestimmte Untersuchung relevant sind. Wie bereits erläutert, werden die teilweise indizierten Elemente in den durchsuchten Inhaltsspeicherorten automatisch in die geschätzten Suchergebnisse einbezogen. Sie haben die Möglichkeit, diese teilweise indizierten Elemente einzuschließen, wenn Sie Suchergebnisse exportieren oder die Suchergebnisse für eDiscovery (Premium) vorbereiten.
Beachten Sie Folgendes bei teilweise indizierten Elementen:
Wenn Sie eine eDiscovery-Suche ausführen, werden die Gesamtzahl und Größe der teilweise indizierten Exchange-Elemente (die von der Suchabfrage zurückgegeben werden) in der Suchstatistik auf der Flyoutseite angezeigt und als nicht indizierte Elemente bezeichnet. Statistiken zu teilweise indizierten Elementen, die auf der Flyoutseite angezeigt werden, enthalten keine teilweise indizierten Elemente in SharePoint-Websites oder OneDrive-Konten.
Wenn die Suche, aus der Sie Ergebnisse exportieren, eine Suche nach bestimmten Inhaltsspeicherorten oder allen Inhaltsspeicherorten in Ihrer Organisation war, werden nur die nicht indizierten Elemente von Inhaltsspeicherorten exportiert, die Elemente enthalten, die den Suchkriterien entsprechen. In other words, if no search results are found in a mailbox or site, then any unindexed items in that mailbox or site won't be exported. Der Grund dafür ist, dass das Exportieren von teilweise indizierten Elementen von vielen Standorten in der Organisation die Wahrscheinlichkeit von Exportfehlern erhöhen und die Zeit zum Exportieren und Herunterladen der Suchergebnisse erhöhen kann.
Um teilweise indizierte Elemente aus allen Inhaltsspeicherorten für eine Suche zu exportieren, konfigurieren Sie die Suche so, dass alle Elemente zurückgegeben werden (durch Entfernen von Schlüsselwörtern aus der Suchabfrage), und exportieren Sie dann nur teilweise indizierte Elemente, wenn Sie die Suchergebnisse exportieren (indem Sie unter Ausgabeoptionennur Elemente auswählen, die ein unbekanntes Format aufweisen, verschlüsselt sind oder aus anderen Gründen nicht indiziert wurden).
Wenn Sie alle Postfachelemente in die Suchergebnisse einschließen oder eine Suchabfrage keine Schlüsselwörter oder nur einen Datumsbereich angibt, werden teilweise indizierte Elemente möglicherweise nicht in die PST-Datei kopiert, die die teilweise indizierten Elemente enthält. Dies liegt daran, dass alle Elemente, einschließlich aller teilweise indizierten Elemente, automatisch in die regulären Suchergebnisse einbezogen werden.
Teilweise indizierte Elemente können nicht in der Vorschau angezeigt werden. Sie müssen die Suchergebnisse exportieren, um teilweise indizierte Elemente anzuzeigen, die von der Suche zurückgegeben werden.
Wenn Sie außerdem Suchergebnisse exportieren und teilweise indizierte Elemente in den Export einschließen, werden teilweise indizierte Elemente aus SharePoint-Elementen in einen Ordner mit dem Namen Uncrawlable exportiert. Wenn Sie teilweise indizierte Exchange-Elemente exportieren, werden diese unterschiedlich exportiert, je nachdem, ob die teilweise indizierten Elemente mit der Suchabfrage und der Konfiguration der Exporteinstellungen übereinstimmen.
Die folgende Tabelle zeigt das Exportverhalten von indizierten und teilweise indizierten Elementen und gibt an, ob jedes element für die verschiedenen Exportkonfigurationseinstellungen enthalten ist.
Konfiguration exportieren Indizierte Elemente, die der Suchabfrage entsprechen Teilweise indizierte Elemente, die der Suchabfrage entsprechen Teilweise indizierte Elemente, die nicht mit der Suchabfrage übereinstimmen Nur indizierte Elemente exportieren Exportiert Exportiert (in den exportierten indizierten Elementen enthalten) Nicht exportiert Nur teilweise indizierte Elemente exportieren Nicht exportiert Exportiert (als teilweise indizierte Elemente) Exportiert (als teilweise indizierte Elemente) Exportieren von indizierten und teilweise indizierten Elementen Exportiert Exportiert (in den exportierten indizierten Elementen enthalten) Exportiert (als teilweise indizierte Elemente)
Datumsbereiche und ausschließen von teilweise indizierten Elementen
In der Inhaltssuche und in Microsoft Purview eDiscovery können Sie keinen Datumsbereich verwenden, um teilweise indizierte Elemente von der Rückgabe durch eine Suchabfrage auszuschließen. Mit anderen Worten, teilweise indizierte Elemente, die außerhalb eines Datumsbereichs liegen, werden weiterhin als teilweise indizierte Elemente in den Suchstatistiken und beim Exportieren von teilweise indizierten Elementen eingeschlossen. In eDiscovery (Premium) können teilweise indizierte Elemente gesammelt und dann vor dem Export in einem Überprüfungssatz gefiltert werden.
Indizierungsgrenzwerte für Nachrichten
In der folgenden Tabelle werden die Indizierungsgrenzwerte beschrieben, die dazu führen können, dass eine E-Mail-Nachricht als teilweise indiziertes Element in einer eDiscovery-Suche in Microsoft 365 zurückgegeben wird.
Eine Liste der Indizierungsgrenzwerte für SharePoint-Dokumente finden Sie unter Suchgrenzwerte für SharePoint Online.
Indizierungslimit | Maximalwert | Beschreibung |
---|---|---|
Maximale Anlagengröße (ohne Excel-Dateien) |
150 MB |
Die maximale Größe einer E-Mail-Anlage, die für die Indizierung analysiert wird. Anlagen, die diesen Grenzwert überschreiten, werden nicht für die Indizierung analysiert, und die Nachricht mit der Anlage wird als teilweise indiziert markiert. Anmerkung: Die Analyse ist der Prozess, bei dem der Indizierungsdienst Text aus der Anlage extrahiert, unnötige Zeichen wie Interpunktionszeichen und Leerzeichen entfernt und dann den Text in Wörter unterteilt (in einem Prozess, der als Tokenisierung bezeichnet wird), die dann im Index gespeichert werden. |
Maximale Größe von Excel-Dateien |
4 MB |
Die maximale Größe einer Excel-Datei, die sich auf einer Website befindet oder an eine E-Mail-Nachricht angefügt ist, die für die Indizierung analysiert wird. Jede Excel-Datei, die diesen Grenzwert überschreitet, wird nicht analysiert, und die Datei oder die E-Mail der Nachricht mit der Dateianlage wird als nicht indiziert markiert. |
Maximale Anzahl von Anlagen |
250 |
Die maximale Anzahl von Dateien, die an eine E-Mail-Nachricht angefügt sind und für die Indizierung analysiert werden. Wenn eine Nachricht mehr als 250 Anlagen enthält, werden die ersten 250 Anlagen analysiert und indiziert, und die Nachricht wird als teilweise indiziert markiert, da sie zusätzliche Anlagen enthält, die nicht analysiert wurden. |
Maximale Anlagentiefe |
30 |
Die maximale Anzahl geschachtelter Anlagen, die analysiert werden. Wenn einer E-Mail-Nachricht beispielsweise eine weitere Nachricht angefügt ist und die angefügte Nachricht über ein angefügtes Word-Dokument verfügt, werden das Word-Dokument und die angefügte Nachricht indiziert. Dieses Verhalten wird für bis zu 30 geschachtelte Anlagen fortgesetzt. |
Maximale Anzahl angefügter Bilder |
0 |
Ein Bild, das an eine E-Mail-Nachricht angefügt ist, wird vom Parser übersprungen und nicht indiziert. |
Maximaler Zeitaufwand für die Analyse eines Elements |
30 Sekunden |
Maximal 30 Sekunden werden für die Analyse eines Elements für die Indizierung aufgewendet. Wenn die Analysezeit 30 Sekunden überschreitet, wird das Element als teilweise indiziert markiert. |
Maximale Parserausgabe |
2 Millionen Zeichen |
Die maximale Textausgabemenge des parsers, der indiziert wird. Wenn der Parser beispielsweise 8 Millionen Zeichen aus einem Dokument extrahiert hat, werden nur die ersten 2 Millionen Zeichen indiziert. |
Maximale Anzahl von Anmerkungstoken |
2 Mio. |
Wenn eine E-Mail-Nachricht indiziert wird, wird jedes Wort mit unterschiedlichen Verarbeitungsanweisungen versehen, die angeben, wie dieses Wort indiziert werden soll. Jeder Satz von Verarbeitungsanweisungen wird als Anmerkungstoken bezeichnet. Um die Dienstqualität in Office 365 aufrechtzuerhalten, gibt es einen Grenzwert von 2 Millionen Anmerkungstoken für eine E-Mail-Nachricht. |
Maximale Textgröße im Index |
67 Millionen Zeichen |
Die Gesamtanzahl der Zeichen im Textkörper einer E-Mail-Nachricht und aller zugehörigen Anlagen. Wenn eine E-Mail-Nachricht indiziert wird, wird der gesamte Text im Nachrichtentext und in allen Anlagen in einer einzigen Zeichenfolge verkettet. Die maximale Größe dieser indizierten Zeichenfolge beträgt 67 Millionen Zeichen. |
Maximale Anzahl eindeutiger Token im Text |
1 Million |
Wie bereits erläutert, sind Token das Ergebnis des Extrahierens von Text aus Inhalten, entfernen Satzzeichen und Leerzeichen und teilen ihn dann in Wörter (als Token bezeichnet) auf, die im Index gespeichert sind. Der Ausdruck "cat, mouse, bird, dog, dog" enthält beispielsweise 5 Token. Aber nur 4 davon sind eindeutige Token. Es gibt ein Limit von 1 Million eindeutigen Token pro E-Mail-Nachricht, wodurch verhindert wird, dass der Index mit zufälligen Token zu groß wird. |
Weitere Informationen zu teilweise indizierten Elementen
- Wie bereits erwähnt, kann eine Schlüsselwortsuche Ergebnisse zurückgeben, wenn dieses Schlüsselwort in den indizierten Metadaten angezeigt wird, da Nachrichten- und Dokumenteigenschaften und deren Metadaten indiziert sind. Diese Schlüsselwortsuche gibt jedoch möglicherweise nicht dasselbe Element zurück, wenn das Schlüsselwort nur im Inhalt eines Elements mit einem nicht unterstützten Dateityp angezeigt wird. In diesem Fall würde das Element als teilweise indiziertes Element zurückgegeben.
- Wenn ein teilweise indiziertes Element in den Suchergebnissen enthalten ist, weil es den Suchabfragekriterien entspricht, wird es beim Exportieren von Suchergebnissen nicht in teilweise indizierte Elemente eingeschlossen.
- Obwohl ein Dateityp für die Indizierung unterstützt und indiziert wird, kann es zu Indizierungs- oder Suchfehlern kommen, die dazu führen, dass eine Datei als teilweise indiziertes Element zurückgegeben wird. Das Durchsuchen einer großen Excel-Datei kann z. B. teilweise erfolgreich sein (da die ersten 4 MB indiziert sind), schlägt dann aber fehl, da die Dateigrößenbeschränkung überschritten wird. In diesem Fall ist es möglich, dass dieselbe Datei mit den Suchergebnissen und als teilweise indiziertes Element zurückgegeben wird.
- Dateien, die mit Microsoft-Verschlüsselungstechnologien verschlüsselt sind und an eine E-Mail-Nachricht angefügt sind, die den Kriterien einer Suche entspricht, können in der Vorschau angezeigt werden und werden beim Export entschlüsselt. Zu diesem Zeitpunkt werden Dateien, die mit Microsoft-Verschlüsselungstechnologien verschlüsselt (und in SharePoint oder OneDrive for Business gespeichert sind) teilweise indiziert.
- Mit S/MIME verschlüsselte E-Mail-Nachrichten werden teilweise indiziert. Dazu gehören verschlüsselte Nachrichten mit oder ohne Dateianlagen.
- Mit Azure Rights Management geschützte E-Mail-Nachrichten werden indiziert und in die Suchergebnisse aufgenommen, wenn sie mit der Suchabfrage übereinstimmen. Durch Rechte geschützte E-Mail-Nachrichten werden entschlüsselt und können in der Vorschau angezeigt und exportiert werden. Diese Funktionalität erfordert, dass Ihnen die RMS Decrypt-Rolle zugewiesen wird, die standardmäßig der Rollengruppe eDiscover Manager zugewiesen ist.
- Wenn Sie einen abfragebasierten Aufbewahrungsspeicher erstellen, der einem eDiscovery-Fall zugeordnet ist, werden alle teilweise indizierten Elemente in den Halteraum versetzt. Dies schließt teilweise indizierte Elemente ein, die nicht den Suchabfragekriterien für den Halteraum entsprechen. Weitere Informationen zum Erstellen abfragebasierter eDiscovery-Haltebereiche finden Sie unter Erstellen eines eDiscovery-Speichers.