Examen des éléments partiellement indexés dans eDiscovery

Une recherche eDiscovery que vous exécutez à partir du portail de conformité Microsoft Purview inclut automatiquement des éléments partiellement indexés dans les résultats estimés de la recherche lorsque vous exécutez une recherche. Les éléments partiellement indexés sont des éléments de boîte aux lettres Exchange et des documents sur SharePoint et OneDrive Entreprise sites qui, pour une raison quelconque, n’ont pas été complètement indexés pour la recherche. La plupart des messages électroniques et des documents de site sont correctement indexés, car ils entrent dans les limites d’indexation des messages électroniques. Toutefois, certains éléments peuvent dépasser ces limites d’indexation et seront partiellement indexés. Voici d’autres raisons pour lesquelles les éléments ne peuvent pas être indexés pour la recherche et sont retournés en tant qu’éléments partiellement indexés lorsque vous exécutez une recherche eDiscovery :

  • Email messages ont un fichier joint qui ne peut pas être ouvert ; il s’agit de la cause la plus courante d’éléments de courrier partiellement indexés.
  • Le nombre de fichiers joints à un message électronique est trop important.
  • Un fichier joint à un message électronique est trop volumineux.
  • Le type de fichier est pris en charge pour l'indexation, mais une erreur d'indexation s'est produite pour un fichier spécifique.

Bien que cela varie, la plupart des clients des organisations ont moins de 1 % du contenu par volume et moins de 12 % du contenu par taille qui est partiellement indexé. La raison de la différence entre le volume et la taille est que les fichiers plus volumineux ont une probabilité plus élevée de contenir du contenu qui ne peut pas être complètement indexé.

Pour plus d’informations sur les éléments à indexer partiellement dans la recherche de contenu, consultez Examen des éléments partiellement indexés dans la recherche de contenu.

Conseil

Si vous n’êtes pas un client E5, utilisez la version d’évaluation de 90 jours des solutions Microsoft Purview pour découvrir comment des fonctionnalités Supplémentaires purview peuvent aider vos organization à gérer les besoins en matière de sécurité et de conformité des données. Commencez dès maintenant au hub d’essais portail de conformité Microsoft Purview. En savoir plus sur les conditions d’inscription et d’essai.

Après avoir exécuté une recherche eDiscovery, le nombre total et la taille des éléments partiellement indexés dans les emplacements recherchés sont répertoriés dans les statistiques de résultats de recherche affichées dans les statistiques détaillées de la recherche. Notez que ces éléments sont appelés éléments non indexés dans les statistiques de recherche. Voici quelques éléments qui affecteront le nombre d’éléments partiellement indexés retournés dans les résultats de recherche :

  • Si un élément est partiellement indexé et correspond à la requête de recherche, il est inclus dans le nombre (et la taille) d’éléments de résultats de recherche et d’éléments partiellement indexés. Toutefois, lorsque les résultats de cette même recherche sont exportés, l’élément est inclus uniquement avec un ensemble de résultats de recherche ; il n’est pas inclus en tant qu’élément partiellement indexé.
  • Les éléments partiellement indexés situés dans les sites SharePoint et OneDrive ne sont pas inclus dans l’estimation des éléments partiellement indexés qui sont affichés dans les statistiques détaillées pour la recherche. Toutefois, les éléments partiellement indexés peuvent être exportés lorsque vous exportez les résultats d’une recherche eDiscovery. Par exemple, si vous recherchez uniquement des sites, le nombre estimé d’éléments partiellement indexés sera égal à zéro.

Calcul du ratio des éléments partiellement indexés dans votre organization

Pour comprendre l’exposition de votre organization aux éléments partiellement indexés, vous pouvez exécuter une recherche pour tout le contenu de toutes les boîtes aux lettres (à l’aide d’une requête mot clé vide). Dans l’exemple suivant, il y a 1 629 904 (146,46 Go) d’éléments entièrement indexés et 10 025 (10,27 Go) partiellement indexés.

Exemple de statistiques de recherche montrant des éléments partiellement indexés.

Vous pouvez déterminer le pourcentage d’éléments partiellement indexés à l’aide des calculs suivants.

Pour calculer le ratio des éléments partiellement indexés dans votre organization :

(Total number of partially indexed items/Total number of items) x 100

(10025/1629904) x 100 = 0.62%

En utilisant les résultats de recherche de l’exemple précédent, 0,62 % de tous les éléments de boîte aux lettres sont partiellement indexés.

Pour calculer le pourcentage de taille des éléments partiellement indexés dans votre organization :

(Size of all partially indexed items/Size of all items) x 100

(10.27 GB/146.46 GB) x 100 = 7.0%

Ainsi, dans l’exemple précédent, 7 % de la taille totale des éléments de boîte aux lettres proviennent d’éléments partiellement indexés. Comme indiqué précédemment, la plupart des clients des organisations ont moins de 1 % du contenu par volume et moins de 12 % du contenu par taille qui est partiellement indexé.

Utilisation d’éléments partiellement indexés

Dans les cas où vous devez examiner des éléments partiellement indexés pour vérifier qu’ils ne contiennent pas d’informations pertinentes, vous pouvez exporter un rapport de recherche de contenu qui contient des informations sur les éléments partiellement indexés. Lorsque vous exportez un rapport de recherche de contenu, veillez à choisir l’une des options d’exportation qui inclut des éléments partiellement indexés.

Choisissez la deuxième ou la troisième option pour exporter des éléments partiellement indexés.

Lorsque vous exportez des résultats de recherche eDiscovery ou un rapport de recherche à l’aide de l’une de ces options, l’exportation inclut un rapport nommé Unindexed Items.csv. Ce rapport contient la plupart des mêmes informations que le fichier ResultsLog.csv ; Toutefois, le fichier de Items.csv non indexé inclut également deux champs liés aux éléments partiellement indexés : Balises d’erreur et Propriétés d’erreur. Ces champs contiennent des informations sur l’erreur d’indexation pour chaque élément partiellement indexé. L’utilisation des informations contenues dans ces deux champs peut vous aider à déterminer si l’erreur d’indexation d’un particulier a ou non un impact sur votre investigation.

Remarque

Le fichier de Items.csv non indexé contient également des champs nommés Type d’erreur et Message d’erreur. Il s’agit de champs hérités qui contiennent des informations similaires à celles des champs Balises d’erreur et Propriétés d’erreur , mais avec des informations moins détaillées. Vous pouvez ignorer en toute sécurité ces champs hérités.

Les balises d’erreur sont constituées de deux éléments d’informations : l’erreur et le type de fichier. Par exemple, dans cette paire erreur/type de fichier :

 parseroutputsize_xls

parseroutputsize est l’erreur et xls est le type de fichier du fichier sur lequel l’erreur s’est produite. Dans les cas où le type de fichier n’a pas été reconnu ou si le type de fichier ne s’applique pas à l’erreur, vous verrez la valeur noformat à la place du type de fichier.

Voici une liste des erreurs d’indexation et une description de la cause possible de l’erreur.

Balise d’erreur Description
attachmentcount
Un e-mail contient trop de pièces jointes, et certaines de ces pièces jointes n’ont pas été traitées.
attachmentdepth
Le récupérateur de contenu et l’analyseur de documents ont trouvé trop de niveaux de pièces jointes imbriqués dans d’autres pièces jointes. Certaines de ces pièces jointes n’ont pas été traitées.
attachmentrms
Le décodage d’une pièce jointe a échoué, car elle était protégée par RMS.
attachmentsize
Un fichier joint à un e-mail était trop volumineux et n’a pas pu être traité.
indexingtruncated
Lors de l’écriture du message électronique traité dans l’index, l’une des propriétés indexables était trop volumineuse et tronquée. Les propriétés tronquées sont répertoriées dans le champ Propriétés d’erreur.
invalidunicode
Un e-mail contenait du texte qui n’a pas pu être traité comme unicode valide. L’indexation de cet élément peut être incomplète.
parserencrypted
Le contenu de la pièce jointe ou du message électronique est chiffré, et Microsoft 365 n’a pas pu décoder le contenu.
parsererror
Une erreur inconnue s’est produite lors de l’analyse. Cela résulte généralement d’un bogue logiciel ou d’un incident de service.
parserinputsize
Une pièce jointe était trop grande pour que l’analyseur le gère, et l’analyse de cette pièce jointe n’a pas eu lieu ou n’a pas été terminée.
parsermalformed
Une pièce jointe était incorrecte et ne pouvait pas être gérée par l’analyseur. Ce résultat peut être dû à d’anciens formats de fichiers, à des fichiers créés par des logiciels incompatibles ou à des virus prétendant être autre chose que revendiqué.
parseroutputsize
La sortie de l’analyse d’une pièce jointe était trop grande et a dû être tronquée.
parserunknowntype
Une pièce jointe avait un type de fichier que Microsoft 365 n’a pas pu détecter.
parserunsupportedtype
Une pièce jointe avait un type de fichier que Office 365 pouviez détecter, mais l’analyse de ce type de fichier n’est pas prise en charge.
propertytoobig
La valeur d’une propriété d’e-mail dans Exchange Store était trop grande pour être récupérée et le message n’a pas pu être traité. Cela se produit généralement uniquement pour la propriété body d’un e-mail.
retrieverrms
Le récupérateur de contenu n’a pas pu décoder un message protégé par RMS.
wordbreakertruncated
Trop de mots ont été identifiés dans le document pendant l’indexation. Le traitement de la propriété s’est arrêté lors de l’atteinte de la limite et la propriété est tronquée.

Les champs d’erreur décrivent les champs affectés par l’erreur de traitement répertoriée dans le champ Balises d’erreur. Si vous recherchez une propriété telle que subject ou participants, les erreurs dans le corps du message n’ont pas d’impact sur les résultats de votre recherche. Cela peut être utile pour déterminer exactement les éléments partiellement indexés que vous devrez peut-être examiner plus en détail.