Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Indagini sulla sicurezza dei dati usa l'intelligenza artificiale generativa (IA), i modelli linguistici di grandi dimensioni e l'orchestrazione nell'analisi dei dati nell'organizzazione. I risultati generati dall'IA potrebbero non essere sempre accurati o completi. Mentre ci impegniamo a fornire informazioni affidabili e utili, i sistemi di IA possono produrre risultati errati o falsi. È importante verificare le informazioni e usarle con cautela. Microsoft non fornisce alcuna garanzia, esplicita, implicita o legale per quanto riguarda le informazioni fornite dai sistemi di intelligenza artificiale.
Indagini sulla sicurezza dei dati (anteprima) usa i servizi e gli strumenti di intelligenza artificiale per esaminare e intervenire rapidamente sugli elementi associati agli eventi imprevisti di sicurezza. I servizi correlati all'intelligenza artificiale includono gli strumenti seguenti:
- Ricerca vettoriale
- Categorizzazione
- Esame
Ricerca vettoriale
La ricerca vettoriale in Indagini sulla sicurezza dei dati (anteprima) offre un modo per eseguire una ricerca contestuale tra i dati aggiunti all'ambito di indagine usando orchestrazioni e incorporamenti avanzati. La ricerca vettoriale è una tecnologia del motore di ricerca incentrata sulla comprensione del significato e del contesto alla base di parole e frasi in una query, anziché solo di parole chiave corrispondenti.
Alcuni aspetti chiave della ricerca vettoriale sono:
- Comprensione contestuale: la ricerca vettoriale interpreta il contesto dei termini di ricerca, considerando fattori come l'organizzazione, la cronologia di ricerca e il significato complessivo della query.
- Riconoscimento delle finalità: la ricerca vettoriale consente di comprendere la finalità, indipendentemente dal fatto che si cerchino informazioni, si tenti di eseguire un'azione o si cerchi un tipo specifico di contenuto associato a una ricerca.
- Rilevanza e accuratezza: concentrandosi sulla semantica (il significato e la finalità delle parole nella query), la ricerca vettoriale fornisce risultati più accurati e pertinenti e migliora l'esperienza di ricerca complessiva.
Quando gli investigatori dell'organizzazione esaminano i set di dati compromessi, la ricerca vettoriale in Indagini sulla sicurezza dei dati (anteprima) può migliorare significativamente l'indagine risolvendo diverse sfide chiave:
- Identificazione delle informazioni rilevanti: ricerca vettoriale comprende il contesto e la finalità alla base delle query. Questo focus consente di individuare rapidamente documenti, messaggi di posta elettronica o record rilevanti, anche se non contengono le parole chiave esatte usate.
- Gestione dell'ambiguità: ricerca vettoriale disambigua termini che hanno più significati, assicurandosi di ottenere risultati contestualmente appropriati per l'indagine.
- Riduzione del rumore: la ricerca vettoriale filtra le informazioni irrilevanti, consentendo di concentrarsi sui dati più pertinenti e ridurre il tempo trascorso a setacciare i risultati non correlati.
- Miglioramento dell'efficienza: la ricerca vettoriale semplifica il processo di ricerca, rendendo l'indagine più efficiente ed efficace visualizzando rapidamente le informazioni più rilevanti.
Come funziona
Dopo aver creato un'indagine, definito l'ambito e preparato i dati per l'intelligenza artificiale, è possibile eseguire ricerche vettoriali sul set di dati. Mentre i passaggi precedenti del processo consentono la ricerca semplice di parole chiave, metadati e intervalli di date. La ricerca vettoriale usa gli incorporamenti di intelligenza artificiale per eseguire ricerche contestuali tra i dati. Questo processo consente agli investigatori di trovare elementi senza conoscere il contenuto esatto.
La ricerca vettoriale funziona eseguendo prima di tutto tutti i dati con ambito in un'indagine tramite un modello di incorporamento di intelligenza artificiale. Questo modello estrae significato semantico da ogni elemento del set di dati e li suddivide in parti più piccole. Questa operazione è denominata incorporamento e consente a Indagini sulla sicurezza dei dati (anteprima) di usare i valori delle dimensioni per comprendere il contesto dei dati. Un indice di ricerca semantica viene compilato da questi valori su cui è possibile eseguire query.
Quando si crea una query di ricerca vettoriale in un'indagine, l'intelligenza artificiale espande e amplia automaticamente la query ed esegue la query tramite l'indice di ricerca semantica. Indagini sulla sicurezza dei dati (anteprima) corrisponde quindi al significato semantico della query con il significato semantico del contenuto e restituisce tutti gli elementi rilevanti dal punto di vista del contesto.
Ad esempio, se si cerca "Dati riservati inclusi nel progetto Contoso Security", il motore di ricerca vettoriale riconosce che si stanno cercando dati riservati in questo progetto specifico anziché semplicemente parole chiave corrispondenti (confidential, data, Contoso e così via) contenute nella query di ricerca. Usando la ricerca vettoriale, è possibile eseguire query interessate per trovare tutti gli elementi di dati correlati a un particolare soggetto, anche se mancano parole chiave.
Per altre informazioni sui concetti relativi alla ricerca vettoriale, vedere la sezione relativa ai concetti nell'articolo Vectors in Azure AI Search .For more information on vector search concepts, see the concepts section in the Vectors in Azure AI Search article.
Categorizzazione
Quando l'organizzazione viene violata e vengono identificati i dati interessati, gli investigatori devono iniziare a assegnare priorità ai dati per iniziare a identificare i rischi per la sicurezza. Le categorie in Indagini sulla sicurezza dei dati (anteprima) eliminano la necessità di assegnare manualmente le categorie agli elementi in ambiti di analisi complessi e di grandi dimensioni.
È possibile usare la categorizzazione basata su intelligenza artificiale in Indagini sulla sicurezza dei dati (anteprima) per ragionare più rapidamente e assegnare priorità ai dati potenzialmente interessati. Per classificare i dati, è possibile selezionare tutte o alcune opzioni di categoria predefinite, usare le categorie suggerite dall'intelligenza artificiale in base alla loro indagine o creare categorie personalizzate.
Le categorie generate dall'intelligenza artificiale sono arricchite con informazioni aggiuntive per il contenuto a livello di soggetto nell'ambito:
- Nome: nome della categoria/area in base al contenuto
- Riepilogo: breve descrizione del contenuto sottostante
All'interno di ogni categoria, è possibile usare strumenti di ricerca vettoriale ed esame su qualsiasi contenuto.
Categorie predefinite
Indagini sulla sicurezza dei dati (anteprima) include categorie predefinite per classificare gli elementi nell'ambito dell'indagine. Quando si esegue la categorizzazione, è possibile selezionare tutte le categorie predefinite o solo le categorie predefinite applicabili all'ambito della revisione. Le categorie predefinite non selezionate vengono ignorate nell'analisi e i risultati per queste categorie non sono disponibili durante la revisione degli elementi.
Le categorie predefinite iniziali determinate dall'elaborazione dell'intelligenza artificiale per gli elementi di contenuto sono:
- Informazioni aziendali: informazioni generali sull'azienda. Questa categoria contiene in genere un numero elevato di elementi. Alcune aree di esempio in questa categoria possono includere l'engagement digitale e l'analisi, le risorse umane e degli utenti, la comunicazione amministrativa di routine, l'engagement/esperienza dei clienti e altro ancora.
- Record di comunicazione: informazioni generali sulla comunicazione. Questa categoria contiene in genere anche un numero elevato di elementi. Gli utenti possono usare questa categoria per visualizzare le indagini in base alle aree di comunicazione. Alcune aree di esempio in questa categoria potrebbero includere reclami dei clienti, messaggi di saluto per le festività, promemoria interni, aggiornamenti del progetto e altro ancora.
- Credenziali e informazioni di accesso Si concentra sulle informazioni relative all'accesso agli asset nelle indagini. Queste informazioni consentono di identificare dati e comunicazioni potenzialmente rischiosi nell'organizzazione. Alcune aree di esempio in questa categoria possono includere credenziali utente, accesso non autorizzato al database, esposizione dei dati e altro ancora.
- Informazioni sui clienti: si concentra sulle informazioni condivise con i clienti. Questa categoria può essere usata per comprendere quali dati dei clienti potrebbero essere a rischio. Alcune aree di esempio in questa categoria potrebbero includere conferme di pagamento, miglioramento dell'esperienza del cliente, informazioni sulla consegna e altro ancora.
- Informazioni utente: si concentra sulle informazioni relative agli utenti dell'organizzazione. Questa categoria contiene in genere anche un numero elevato di elementi. Alcune aree di esempio in questa categoria possono includere informazioni sull'occupazione degli utenti, strategie di conservazione degli utenti, appartenenze a gruppi specializzati e altro ancora.
- Informazioni finanziarie: si concentra sulle informazioni finanziarie in un'indagine. Alcune aree di esempio in questa categoria possono includere pianificazione finanziaria, opportunità di concessione, budget, rendiconti finanziari e altro ancora.
- Informazioni sulla salute: si concentra su elementi correlati alla salute e al medico in un'indagine. Alcune aree di esempio in questa categoria potrebbero includere i record di benessere e integrità, gli aggiornamenti del protocollo di sicurezza COVID-19, le attestazioni sull'integrità e i report sugli eventi imprevisti e altro ancora.
- Informazioni su eventi imprevisti e indagini: si concentra su elementi relativi a eventi imprevisti e indagini in un'indagine. Questa categoria include gli eventi imprevisti e le indagini di sicurezza all'interno dell'organizzazione. Alcune aree di esempio in questa categoria possono includere violazioni dei dati, eventi imprevisti dei record di integrità, monitoraggio degli account client ad alto rischio e altro ancora.
- Proprietà intellettuale: incentrata sui dati della proprietà intellettuale (IP) in un'indagine. Alcune aree di esempio in questa categoria potrebbero includere applicazioni di brevetti future, attività di ricerca e sviluppo, metriche dei risultati dell'esperimento e altro ancora.
- Informazioni di marketing Si concentra sui dati di marketing in un'indagine. Alcune aree di esempio in questa categoria possono includere comunicati stampa, campagne pubblicitarie, piani di marketing e di vendita o strategie e altro ancora.
- Informazioni operative: si concentra sui dati operativi dell'organizzazione. Alcune aree di esempio in questa categoria possono includere logistica, spedizione, inventario, conformità, record fiscali e altro ancora.
- Informazioni personali: si concentra sui dati personali del gruppo e sugli elementi correlati in un'indagine. Alcune aree di esempio in questa categoria possono includere elenchi guest di eventi, sessioni di personale e formazione, informazioni personali dei dipendenti e altro ancora.
- Dati regolamentati: si concentra sui dati regolamentati in un'indagine. Alcune aree di esempio in questa categoria possono includere normative, protezione dei dati, record normativi e altro ancora.
Categorie suggerite
Indagini sulla sicurezza dei dati (anteprima) fornisce anche categorie suggerite generate dall'intelligenza artificiale in base al contenuto analizzato nell'ambito dell'indagine. Queste categorie suggerite vengono create automaticamente per consentire alle indagini di esaminare gli elementi raggruppati in aree impreviste o sconosciute. A seconda del tipo di contenuto incluso, le categorie suggerite variano.
Se il contenuto analizzato è incentrato principalmente su un'area oggetto specifica al di fuori delle aree di categoria predefinite, le categorie suggerite vengono personalizzate in base a tale area di contenuto specifica. Ad esempio, se il contenuto analizzato è incentrato su un soggetto altamente riservato con termini e concetti specifici per l'organizzazione, le categorie suggerite vengono create automaticamente per queste aree. Queste categorie sono univoche per l'organizzazione e il contenuto analizzato.
Categorie personalizzate
Indagini sulla sicurezza dei dati (anteprima) consente di creare manualmente categorie personalizzate per il processo generativo di intelligenza artificiale da usare durante l'analisi del contenuto. Definendo le categorie più applicabili alle esigenze di analisi, è possibile risparmiare tempo e consentire al processo di intelligenza artificiale di classificare automaticamente gli elementi in base a queste categorie personalizzate.
Le categorie personalizzate possono essere parole o frasi specifiche che acquisiscono la natura specifica del contenuto di interesse nell'indagine. Ad esempio, le categorie personalizzate possono includere vulnerabilità di sicurezza, correzione di bug, nomi di codice di progetto specifici o proprietà intellettuali personalizzate come R&D correlate a un medicinale specifico o a candidati di farmaci.
Esame
Quando si identificano gli elementi che richiedono un'analisi più approfondita, Indagini sulla sicurezza dei dati (anteprima) offre funzionalità di esame basate sull'intelligenza artificiale che consentono di concentrarsi sui rischi principali per la sicurezza e i dati sensibili.
Credenziali: usare questa area di interesse dell'esame per analizzare ed estrarre le credenziali da tutti gli elementi selezionati in un ambito di indagine. Queste informazioni forniscono agli investigatori un modo rapido per comprendere quali account e credenziali sono associati a un evento imprevisto di sicurezza e che potrebbero essere potenzialmente esfiltrati.
Rischio: usare questa area di interesse per l'esame per assegnare punteggi a tutte le aree di rischio nei file selezionati per aiutare gli investigatori a concentrarsi e assegnare priorità alle indagini. Questo strumento fornisce il rischio complessivo per ogni elemento, se l'elemento è contenuto con privilegi, e altri rischi specifici per l'elemento.
I tipi di aree di rischio includono:
- Identificatori di asset
- Credenziali e segreti
- Prove delle discussioni degli attori della minaccia violano le discussioni
- Eventi imprevisti di sicurezza urgenti
- Vulnerabilità e igiene della sicurezza
- Contenuto personale e sensibile
- Informazioni sulla rete e sull'accesso
- Conformità dei criteri e protezione dei dati
- Informazioni sull'infrastruttura
- Informazioni personalizzate
- Informazioni governative
- Informazioni con privilegi
- Segreti commerciali
Attenuazione: usare questa area di interesse per l'esame per assegnare un punteggio al rischio per i file selezionati e abilitare Indagini sulla sicurezza dei dati (anteprima) per fornire istruzioni di mitigazione per le operazioni successive. I file selezionati ottengono un punteggio di rischio, un riepilogo dei rischi e raccomandazioni dettagliate sulla mitigazione per evitare ulteriori danni da una violazione del contenuto.
Raccomandazioni per l'analisi dell'intelligenza artificiale
La tabella seguente illustra raccomandazioni, scenari di esempio e procedure consigliate quando si usano gli strumenti di analisi dell'intelligenza artificiale in Indagini sulla sicurezza dei dati (anteprima).
Consigli | Ricerca vettoriale | Categorizzazione | Esame |
---|---|---|---|
Quando si usano | Cercare esempi di elementi specifici all'interno di un set di dati vettoriali (fatture, correzioni di bug e così via) per confermare e approfondire le ipotesi di indagine. Usare la ricerca vettoriale per un'analisi interattiva rapida, i risultati vengono popolati rapidamente. |
Ordinare rapidamente grandi quantità di dati in categorie predefinite, personalizzate o generate dall'intelligenza artificiale per assegnare priorità allo stato attivo dell'indagine in base alla sensibilità e alla gravità. A seconda delle dimensioni del set di dati, il completamento della categorizzazione potrebbe richiedere del tempo. |
L'analisi mirata a livello di elemento per un set di dati con ambito consente di estrarre informazioni dettagliate da un asset di dati confermato per i passaggi successivi. Usare l'esame per identificare gli elementi per la mitigazione. |
Scenario di esempio | Valutazione di attività potenzialmente fraudolente. | Definizione della priorità degli elementi per l'analisi dopo una violazione di grandi dimensioni. | Estrazione delle credenziali da un set di dati convalidato e passaggi di mitigazione consigliati. |
Procedure consigliate | Cercare in tutti i contenuti vettoriali gli elementi di interesse per generare categorie suggerite di intelligenza artificiale più significative. | Selezionare una o più categorie e usare la ricerca vettoriale per eseguire ricerche all'interno della categoria. Esaminare le aree generate dall'intelligenza artificiale all'interno di ogni categoria per comprendere il contenuto specifico all'interno del set di dati. |
Usare l'esame per analizzare elementi specifici con sensibilità elevata per ottenere singoli punteggi e risultati. |