Rilevamento quasi duplicato in eDiscovery (Premium)

Si consideri un insieme di documenti da rivedere in cui un sottoinsieme si basa sullo stesso modello e ha per lo più lo stesso linguaggio boilerplate, con alcune differenze presenti. Se un revisore potesse identificare questo subset, esaminarne uno accuratamente ed esaminare le differenze per il resto, non avrebbe perso alcuna informazione univoca, impiegando solo una frazione di tempo che avrebbe richiesto loro di leggere tutte le copertine dei documenti per coprire. Il rilevamento di documenti simili raggruppa documenti con similarità testuali per contribuire a rendere più efficiente il processo di revisione.

Consiglio

Se non si è un cliente E5, usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare l'organizzazione a gestire le esigenze di sicurezza e conformità dei dati. Iniziare ora dall'hub delle versioni di valutazione Portale di conformità di Microsoft Purview. Informazioni dettagliate sull'iscrizione e le condizioni di valutazione.

Come funziona?

Quando viene eseguito il rilevamento di documenti simili, il sistema analizza ogni documento con testo. Confronta quindi ogni documento con gli altri per determinare se la similarità è maggiore della soglia impostata. Se è questo il caso, i documenti vengono raggruppati. Dopo aver confrontato e raggruppato tutti i documenti, un documento di ogni gruppo viene contrassegnato come "pivot"; durante la revisione dei documenti, è possibile esaminare prima il pivot e dopo gli altri documenti dello stesso insieme, concentrandosi sulla differenza tra il pivot e il documento in revisione.