Informazioni sulle impostazioni di ricerca e analisi nei casi di eDiscovery

È possibile configurare le impostazioni per ogni caso di eDiscovery per controllare le funzionalità seguenti:

Documenti simili e threading posta elettronica
Temi
Query dell'insieme da rivedere automatica
Testo da ignorare
Riconoscimento ottico dei caratteri

Consiglio

Introduzione a Microsoft Security Copilot per esplorare nuovi modi per lavorare in modo più intelligente e veloce usando la potenza dell'IA. Altre informazioni su Microsoft Security Copilot in Microsoft Purview.

Configurare le impostazioni di analisi per un caso

Per configurare le impostazioni di ricerca e analisi per un caso:

Passare al portale di Microsoft Purview e accedere con le credenziali per un account utente a cui sono assegnate le autorizzazioni di eDiscovery.
Selezionare la scheda della soluzione eDiscovery , quindi selezionare Case nel riquadro di spostamento a sinistra.
Selezionare un caso, quindi selezionare Impostazioni case.
In Impostazioni case selezionare Ricerca & analytics.
Verrà visualizzata la pagina Ricerca & analisi del caso. Queste impostazioni si applicano a tutti i set di revisione in un caso.
Dopo aver selezionato le opzioni di ricerca e analisi applicabili, selezionare Salva.

Le sezioni seguenti descrivono le impostazioni di analisi che è possibile configurare per un caso.

Documenti simili e threading posta elettronica

In questa sezione impostare i parametri per il rilevamento duplicati, il rilevamento quasi duplicato e il threading della posta elettronica.

Quasi duplicati/threading di posta elettronica: Quando si attiva questa impostazione, il flusso di lavoro include il rilevamento duplicati, il rilevamento quasi duplicato e il threading della posta elettronica quando si eseguono analisi sui dati in un set di revisione.
Soglia di somiglianza di documenti e messaggi di posta elettronica: Se il livello di somiglianza per due documenti supera la soglia, entrambi i documenti si trovano nello stesso set quasi duplicato.
Numero minimo/massimo di parole: Queste impostazioni specificano che i duplicati vicini e l'analisi del threading della posta elettronica vengono eseguiti solo su documenti con almeno il numero minimo di parole e al massimo il numero massimo di parole.

Rilevamento di documenti simili

Si consideri un set di documenti da esaminare in cui un subset di documenti usa lo stesso modello e per lo più lo stesso linguaggio boilerplate, con alcune differenze. Se un revisore è in grado di identificare questo sottoinsieme, esaminare accuratamente uno dei documenti ed esaminare le differenze per il resto, non perde alcuna informazione univoca, impiegando solo una frazione del tempo necessario per leggere tutti i documenti trattati per coprire. Il rilevamento di documenti simili raggruppa documenti con similarità testuali per contribuire a rendere più efficiente il processo di revisione.

Quando si esegue il rilevamento quasi duplicato, il sistema analizza ogni documento con testo. Confronta quindi ogni documento con gli altri per determinare se la similarità è maggiore della soglia impostata. In caso affermativo, il sistema raggruppa i documenti. Dopo aver confrontato e raggruppato tutti i documenti, il sistema contrassegna un documento di ogni gruppo come "pivot". Esaminando i documenti, è possibile esaminare prima un pivot ed esaminare gli altri documenti nello stesso set quasi duplicato, concentrandosi sulla differenza tra il pivot e il documento in esame.

Threading posta elettronica

Si consideri una conversazione di posta elettronica che viene attivata per un po'. Nella maggior parte dei casi, l'ultimo messaggio nel thread di posta elettronica include il contenuto di tutti i messaggi precedenti. Pertanto, la revisione dell'ultimo messaggio fornisce un contesto completo della conversazione che si è verificata nel thread. Il threading di posta elettronica identifica tali messaggi in modo che i revisori possano esaminare una frazione dei documenti raccolti senza perdere alcun contesto.

Email threading in eDiscovery è il processo di organizzazione di una sequenza di messaggi di posta elettronica correlati che fanno parte della stessa conversazione. Questa sequenza include il messaggio di posta elettronica iniziale e tutte le risposte e gli inoltramenti successivi collegati al messaggio di posta elettronica originale. Raggruppando questi messaggi di posta elettronica in thread, i revisori vedono l'intero contesto di una conversazione, semplificando la comprensione del flusso di comunicazione. Questo approccio consente ai revisori di identificare le informazioni pertinenti in modo più efficiente ed elimina la necessità di esaminare ogni messaggio di posta elettronica singolarmente. Email messaggi inclusi nel processo di analisi vengono popolati i metadati seguenti:

È inclusivo: questo campo identifica se un messaggio di posta elettronica contiene tutto il contenuto univoco di un thread, incluse tutte le risposte precedenti. Garantisce che venga esaminato solo il messaggio di posta elettronica più completo in un thread, essenziale per comprendere il contesto completo della conversazione senza dover esaminare ogni singola risposta.
Allegati univoci: questo campo contrassegna i messaggi di posta elettronica che contengono allegati non trovati in altri messaggi di posta elettronica all'interno dello stesso thread. Anche se il contenuto del messaggio di posta elettronica è duplicato, gli allegati univoci vengono contrassegnati per garantire la revisione di tutti i documenti pertinenti. Questo aspetto è importante nel processo di revisione legale per garantire che non venga trascurata alcuna prova univoca, anche se l'organismo di posta elettronica stesso non è univoco.

Qual è la differenza rispetto alle conversazioni in Outlook?

A colpo d'occhio, questo processo suona simile ai raggruppamenti di conversazioni in Outlook. Esistono tuttavia alcune importanti differenze. Si consideri una conversazione di posta elettronica che genera il fork in due conversazioni. Ad esempio, qualcuno risponde a un messaggio di posta elettronica che non è l'ultimo della conversazione, quindi gli ultimi due messaggi di posta elettronica nella conversazione hanno entrambi contenuto univoco.

Outlook raggruppa ancora i messaggi di posta elettronica in un'unica conversazione. La lettura solo dell'ultimo messaggio di posta elettronica potrebbe non essere presente nel contesto del messaggio di posta elettronica dal secondo all'ultimo, che contiene anche contenuto univoco. Poiché il threading della posta elettronica analizza ogni messaggio di posta elettronica in singoli componenti e li confronta, il threading della posta elettronica contrassegna entrambi gli ultimi due messaggi di posta elettronica come inclusivi, assicurandosi di non perdere alcun contesto finché si leggono tutti i messaggi di posta elettronica contrassegnati come inclusivi.

Si consideri anche un thread di posta elettronica con più risposte, in cui alcune risposte includono risposte inline che modificano il contenuto tra virgolette. Se una risposta inline modifica parte del messaggio di posta elettronica precedente, la risposta più recente non include completamente il contenuto del messaggio di posta elettronica precedente. Sia la risposta più recente che il messaggio di posta elettronica precedente con contenuto univoco sono contrassegnati come inclusivi. Questo approccio garantisce che tutte le informazioni univoche della risposta inline vengano mantenute e non trascurate.

Temi

In questa sezione impostare i parametri seguenti per i temi:

Temi: Quando è attivato, il flusso di lavoro esegue il clustering dei temi quando si eseguono analisi sui dati in un set di revisione.
Numero massimo di temi: Specifica il numero massimo di temi che il flusso di lavoro può generare quando si esegue l'analisi sui dati in un set di revisione.
Includere numeri nei temi: Quando è attivato, il flusso di lavoro include numeri che identificano un tema durante la generazione di temi.
Regolare dinamicamente il numero massimo di temi: In determinate situazioni, in un set di revisione potrebbero non essere presenti documenti sufficienti per produrre il numero desiderato di temi. Quando si abilita questa impostazione, eDiscovery regola dinamicamente il numero massimo di temi anziché tentare di applicare il numero massimo di temi.

Quando si crea un nuovo documento, in genere si inizia con una o più idee che si desidera trasmettere nel documento. Quindi si compone il documento usando parole che si allineano a queste idee. Quanto più un'idea è diffusa, tanto più frequenti sono le parole correlate a quell'idea. Questo metodo si allinea anche al modo in cui i lettori utilizzano i documenti. Le cose importanti da comprendere dalla lettura di un documento sono le idee principali che il documento sta cercando di trasmettere. Questa comprensione include anche quali idee appaiono dove e quali sono le relazioni tra le idee.

È possibile estendere questo processo al modo in cui un revisore di eDiscovery vuole utilizzare un set di documenti in un caso. Vogliono vedere quali idee sono presenti nei set di revisione e quali documenti discutono tali idee. Se trovano un particolare documento di interesse, vogliono essere in grado di vedere documenti che discutono idee simili.

La funzionalità Temi in eDiscovery tenta di simulare il motivo dei documenti da parte degli utenti. Analizza i temi illustrati in un set di revisione e assegna un tema ai documenti nel set di revisione. In eDiscovery i temi vanno oltre e identificano il tema dominante in ogni set di revisione e documento. Il tema dominante è quello che appare più spesso in un documento.

Come funzionano i temi?

La funzionalità Temi analizza i documenti con testo in un set di revisione per analizzare i temi comuni visualizzati in tutti i documenti del set di revisione. eDiscovery assegna i temi ai documenti in cui sono visualizzati. Ogni tema viene inoltre etichettato con le parole utilizzate nei documenti che ne sono rappresentativi. Poiché un documento può contenere vari tipi di argomenti, eDiscovery spesso assegna più temi per esaminare set e documenti. Questa assegnazione viene definita elenco temi. Il tema che appare più in primo piano in un set di revisioni o in un documento è designato come tema dominante.

Configurare i temi

I casi supportano i temi e si applicano a tutti i set di revisione al loro interno. È possibile configurare le impostazioni per i temi quando si crea un nuovo caso oppure è possibile aggiornare le impostazioni del tema per un caso esistente.

Per configurare i temi in un caso, completare la procedura seguente:

Passare al portale di Microsoft Purview e accedere con le credenziali per un account utente a cui sono assegnate le autorizzazioni di eDiscovery.
Selezionare la scheda della soluzione eDiscovery e quindi selezionare Case nel riquadro di spostamento a sinistra.
Selezionare un caso, quindi selezionare Impostazioni case.
In Impostazioni case selezionare Ricerca & analytics.
Selezionare le opzioni del tema seguenti in base alle esigenze:
- Numero massimo di temi: Specifica il numero massimo di temi che il flusso di lavoro può generare quando si eseguono analisi sui dati nei set di revisione inclusi in un caso. Per altre informazioni sui limiti, vedere Limiti in eDiscovery.
- Includere numeri nei temi: I numeri che identificano un tema vengono inclusi durante la generazione dei temi.
- Regolare dinamicamente il numero massimo di temi: In determinate situazioni, in un set di revisione potrebbero non essere presenti documenti sufficienti per produrre il numero desiderato di temi per il caso. Quando si abilita questa impostazione, il numero massimo di temi viene regolato dinamicamente anziché tentare di applicare il numero massimo di temi.
Se è necessario escludere le parole chiave associate ai temi, immettere il testo o l'espressione regolare necessaria nel campo Ignora testo . Nel campo Applica a selezionare Temi per applicare il testo o l'espressione regolare a tutti i temi.
Seleziona Salva.

Dopo aver creato un nuovo caso, il flusso di lavoro esegue automaticamente l'analisi sui dati quando si aggiungono i set di revisione al caso. Il flusso di lavoro genera temi per i set di revisione come parte dell'elaborazione dell'analisi.

Query dell'insieme da rivedere

Se si seleziona la casella di controllo Crea automaticamente una ricerca salvata per la revisione dopo l'analisi , eDiscovery genera automaticamente una query del set di revisioni denominata For Review.

Questa query esclude gli elementi duplicati dal set di revisione, in modo da poter esaminare rapidamente gli elementi univoci nel set di revisione. Questa query viene creata solo quando si esegue l'analisi per un set di revisione nel caso. Per altre informazioni sulle query sui set di revisione, vedere Eseguire query sui dati in un set di revisione.

Testo da ignorare

Un determinato testo può ridurre la qualità dell'analisi, ad esempio lunghe dichiarazioni di non responsabilità che vengono aggiunte ai messaggi di posta elettronica indipendentemente dal contenuto del messaggio di posta elettronica. Se si conosce il testo che deve essere ignorato, è possibile escluderlo dall'analisi specificando la stringa di testo e la funzionalità di analisi (quasi duplicati, threading della posta elettronica, temi e rilevanza) per cui il testo deve essere escluso. Il sistema supporta anche l'uso di espressioni regolari (RegEx) per il testo ignorato.

Riconoscimento ottico dei caratteri (OCR)

Quando si attiva questa impostazione, l'elaborazione OCR viene eseguita sui file di immagine quando sono indicizzati e aggiunti a un set di revisione. Quando si applica OCR ai file di immagine, il testo in questi file è disponibile nei set di revisione. Questo testo estratto è quindi ricercabile all'interno del set di revisione. OCR viene eseguito solo sugli elementi elaborati durante l'indicizzazione avanzata (se si seleziona questa opzione nella query di ricerca).

Ad esempio, se durante l'indicizzazione avanzata viene elaborato un file PDF di grandi dimensioni parzialmente indicizzato o con altri errori di indicizzazione, viene applicato il registro OCR. L'elaborazione OCR si verifica solo nei file reindicizzati durante il processo di indicizzazione avanzata. Questa condizione significa che potrebbero esserci situazioni in cui il contenuto viene aggiunto a un set di revisioni, ma alcuni allegati di posta elettronica non vengono elaborati per OCR perché questi file non vengono elaborati durante l'indicizzazione avanzata.

Dopo aver aggiunto dati a un set di revisione, è possibile esaminare, cercare, contrassegnare e analizzare il testo dell'immagine. È possibile visualizzare il testo estratto nel visualizzatore testo del file di immagine selezionato nel set di revisione. Per altre informazioni, vedere:

L'OCR Purview eDiscovery non rende le immagini ricercabili durante la ricerca iniziale. L'impostazione a livello di case per OCR è distinta dall'impostazione OCR a livello di tenant e non comporta gli addebiti associati a tale impostazione. Per altre informazioni sull'OCR a livello di tenant, vedere https://learn.microsoft.com/en-us/purview/ocr-learn-about.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-09