Condividi tramite


Indice semantico per Copilot

L'indice semantico viene generato dal contenuto in Microsoft Graph. Viene usato per facilitare la produzione di risposte contestualmente rilevanti alle query degli utenti. Consente alle organizzazioni di cercare miliardi di vettori (rappresentazioni matematiche di caratteristiche o attributi) e restituire i risultati correlati. In combinazione con i miglioramenti apportati a Microsoft Graph, l'indice semantico consente di connettersi con le informazioni rilevanti nell'organizzazione. Si basa sull'approccio completo di Microsoft in materia di sicurezza, conformità, privacy e rispetta tutti i limiti dell'organizzazione all'interno del tenant.

Che cos'è un indice?

Il concetto di indicizzazione dei dati è ben consolidato in Microsoft 365. L'indicizzazione è uno dei modi importanti in cui i servizi di Microsoft 365 accedono all'enorme quantità di dati in Microsoft Graph, dove risiede il tenant di Microsoft 365. Con l'indicizzazione, gli utenti visualizzano i risultati della ricerca da Microsoft Graph, inclusi il contenuto e i segnali della maggior parte delle applicazioni Microsoft 365 nel tenant. Ciò garantisce che i risultati della ricerca siano personalizzati ed elevati in base alle connessioni tra contenuto e persone nella rete.

Le interazioni con i dati in Microsoft Graph si basano su corrispondenza di parole chiave, personalizzazione e corrispondenza di social networking. Query di ricerca di parole chiave su un indice in Microsoft Graph, mappato alle posizioni nei documenti o in un set di documenti. Microsoft 365 usa Microsoft Graph per classificare i contenuti più rilevanti in base alla sua conoscenza di segnali aggiuntivi per gli utenti e la loro rete vicina. Questa funzionalità è nota come personalizzazione e corrispondenza social in Microsoft 365, che determina la rilevanza per le query sul contenuto dell'organizzazione. L'accesso ai dati del tenant in Microsoft Graph è controllato dal controllo degli accessi in base al ruolo. Le organizzazioni hanno sempre il controllo delle funzionalità di Microsoft Search tramite il portale di ricerca e intelligence nel interfaccia di amministrazione di Microsoft 365.

Come l'indice semantico consente di gestire i dati

L'indice semantico migliora le funzionalità di Microsoft 365 che consentono di trovare contenuti pertinenti in base a parole chiave, preferenze personali e connessioni di social networking. Questa operazione viene eseguita creando indici vettorizzati. Un vettore è una rappresentazione numerica di una parola, di un pixel di un'immagine o di un altro punto di dati. Il vettore viene disposto o mappato con numeri vicini posizionati in prossimità l'uno dell'altro per rappresentare la somiglianza. I vettori vengono archiviati in spazi multidimensionali in cui i punti dati semanticamente simili vengono raggruppati nello spazio vettoriale, consentendo a Microsoft 365 di gestire un set più ampio di query di ricerca oltre la "corrispondenza esatta".

In pratica, ciò significa che i servizi di Microsoft 365, ad esempio Microsoft 365 Copilot, possono:

  • Comprendere le relazioni tra diverse forme di parole (ad esempio, tecnologia, tecnologia, tecnologie; USA, Stati Uniti, Stati Uniti, Stati Uniti d'America; cane, gatto, animale domestico).
  • Acquisire sinonimi per espandere la quantità di informazioni ricercabili, inclusa la finalità di frasi, frammenti, documenti e riunioni.
  • Identificare gli asset correlati alla query o al contenuto di esempio.

L'immagine seguente usa il testo (anziché i numeri usati dagli indici vettoriali) per mostrare un esempio di somiglianza tra i punti dati:

Immagine che mostra un esempio di come i punti dati per l'indice semantico vengono raggruppati.

L'indice semantico consente di eseguire rapidamente e accuratamente la ricerca e il recupero dei dati in base alla distanza del vettore o alla somiglianza. Ciò significa che oltre a usare metodi lessicali tradizionali per l'esecuzione di query in base a corrispondenze esatte o criteri predefiniti, l'indice semantico può trovare i dati più simili o rilevanti in base al significato semantico o contestuale.

Funzionalità

Le funzionalità di indice semantico seguenti non migliorano i risultati della ricerca; interagiscono per aiutare a comprendere i dati, trovare informazioni più rapidamente e migliorare la produttività. Gli utenti possono interagire inizialmente con l'indice semantico tramite l'integrazione Microsoft 365 Copilot. Viene generato un indice semantico per gli utenti con una licenza Microsoft 365 Copilot a pagamento. Ecco i dettagli del funzionamento di ogni funzionalità.

Microsoft Copilot con chat basata su Graph

L'indice semantico consente di visualizzare i risultati all'interno Microsoft Copilot con la chat basata su grafico, comprendendo la finalità della query e aggiungendo informazioni aggiuntive alla richiesta di Microsoft Copilot. Le informazioni rilevanti vengono ottenute in Microsoft Graph e nell'indice semantico per fornire al modello LLM (Large Language Model) altre informazioni su cui ragionare. Si supponga, ad esempio, di voler Microsoft Copilot di individuare un messaggio di posta elettronica in cui un collega ha lodato il lavoro di progettazione di un fornitore. L'indice semantico include parole vicine (ad esempio, elated, eccitate, stupite) nella ricerca per ampliare l'area di ricerca e dare il miglior risultato. Tutto questo lavoro viene eseguito dietro le quinte per aggiungere rilevanza ai risultati cercati con Microsoft Copilot, senza aggiungere complessità.

Funzionamento dell'indice semantico

L'indice semantico migliora Microsoft Copilot e i risultati della ricerca nell'app Microsoft 365, in SharePoint Online e in Microsoft Teams. Supporta un'esperienza di ricerca avanzata e una comprensione concettuale dei dati online abilitata automaticamente da Microsoft.

Attualmente, l'indice semantico viene creato a livello di tenant. Si tratta di un indice a livello di organizzazione generato da file di SharePoint Online basati su testo accessibili da due o più persone tramite l'ereditarietà del sito. Tuttavia, visualizza i risultati a un utente solo se l'utente ha già accesso al contenuto controllato dal controllo degli accessi in base al ruolo. Inoltre, il sito di SharePoint Online deve rimanere ricercabile. Nel tempo, verrà generato anche il contenuto dell'indice a livello di utente. In questo modo viene aggiunto un indice personalizzato di un working set di dati accessibile per gli utenti che eseguono attività quotidiane. Ciò include qualsiasi contenuto basato su testo con cui si crea o interagisce, ad esempio messaggi di posta elettronica, documenti che indicano l'utente o che si commenta o si condivide.

La sezione seguente illustra come abilitare ogni indice, come il flusso di dati in Microsoft 365 Copilot usa l'indice semantico, quali tipi di file possono gestire ogni indice e come ogni indice gestisce gli aggiornamenti.

Abilitazione

Ogni Microsoft 365 Copilot cliente ha ora un indice semantico a livello di tenant. Il processo di indicizzazione non richiede alcun coinvolgimento amministrativo.

Flussi di dati

L'indice semantico interagisce con Microsoft Graph per fornire agli utenti l'accesso alle informazioni nell'indice. Il diagramma seguente illustra il funzionamento del flusso di dati per una richiesta usando Microsoft 365 Copilot.

Screenshot che mostra la relazione tra Microsoft 365 Copilot, Microsoft 365 Apps, Microsoft Graph e Large Language Model.

Le richieste degli utenti dalle app di Microsoft 365 vengono inviate a Copilot (1) e Copilot accede a Microsoft Graph e all'indice semantico per l'elaborazione (2). Copilot invia la richiesta modificata al modello large language (3), riceve la risposta LLM (4) e quindi accede a Microsoft Graph e all'indice semantico per la post-elaborazione (5). Copilot invia quindi la risposta e il comando dell'app alle app di Microsoft 365. Tutte le richieste vengono crittografate da HTTPS e i dati dei clienti rimangono crittografati inattivi.

Tipi di contenuto supportati

L'indice semantico supporta l'indicizzazione delle cassette postali utente e dei tipi di file elencati nella tabella seguente, con più tipi di file supportati nel tempo. Nella tabella è incluso un elenco dei tipi di file supportati per l'indice a livello di utente e l'indice a livello di tenant.

Contenuto/tipo di file Livello utente Livello tenant
Cassetta postale utente Supportato Non applicabile
Cassetta postale delegata Non supportato Non applicabile
Cassetta postale condivisa Non supportato Non applicabile
Dati cassetta postale archiviati Non supportato Non applicabile
Dati di SharePoint archiviati Non supportato Non supportato
Word documenti (doc/docx) Supportato Supportato
PowerPoint (pptx) Supportato Supportato
File PDF Supportato Supportato
Pagine Web (aspx) Supportato Supportato
File di OneNote (uno) Supportato Supportato
Dati del connettore Graph Non applicabile Supportato

Aggiornamenti degli indici

Quando l'indice semantico completa l'indicizzazione per un cliente per la prima volta, i documenti creati dagli utenti vengono indicizzati quasi in tempo reale nella cassetta postale dell'utente. I nuovi documenti aggiunti ai siti di SharePoint Online accessibili, tramite ereditarietà del sito, da due o più utenti vengono indicizzati quotidianamente. Quando un documento a livello di utente e tenant indicizzato viene aggiornato, le modifiche vengono immediatamente indicizzate.

Amministrazione

Forniamo agli amministratori attività facoltative per preparare e gestire l'indice semantico tramite il interfaccia di amministrazione di Microsoft 365. Non è necessario alcun coinvolgimento amministrativo per abilitare l'indice semantico, perché il servizio viene abilitato automaticamente da Microsoft. L'indice semantico è un miglioramento di Microsoft 365 Search e non può essere disabilitato.

Gli amministratori possono scegliere di preparare e gestire l'indice semantico esaminando le considerazioni relative alla pianificazione e alla distribuzione di una collaborazione sui file in SharePoint e alla condivisione delle autorizzazioni nell'esperienza moderna di SharePoint. Gli amministratori possono scegliere di escludere i file dall'indice semantico esaminando le considerazioni relative all'esclusione dei dati con Prevenzione della perdita dei dati Microsoft Purview (DLP). Se non è presente una soluzione DLP, gli amministratori possono escludere i siti di SharePoint Online dall'indice a livello di tenant.

Esclusione dei siti di SharePoint Online

In alcuni casi le organizzazioni senza Prevenzione della perdita dei dati Microsoft Purview potrebbero voler escludere un sito di SharePoint Online dall'indicizzazione dei dati da Microsoft Search. Questi passaggi devono essere considerati solo per i dati sensibili, ad esempio le retribuzioni, le risorse umane o le informazioni finanziarie. Per escludere un sito di SharePoint Online, seguire questa procedura:

  1. Passare al sito con le autorizzazioni di amministratore appropriate.
  2. Selezionare Impostazioni e quindi Informazioni sul sito dal menu a discesa.
  3. Selezionare Visualizza tutte le impostazioni del sito per visualizzare la pagina Impostazioni sito.
  4. Selezionare Cerca e disponibilità offline nella categoria Ricerca e selezionare No per Consenti la visualizzazione di questo sito nei risultati della ricerca per escluderlo sia da Microsoft Search che dalla ricerca semantica degli indici. Questa operazione può essere eseguita anche con PowerShell per più siti.

Screenshot che mostra le impostazioni per l'esclusione dei siti di SharePoint online.

Microsoft Search e l'indice semantico supportano l'esclusione del contenuto di SharePoint online solo dall'indice a livello di tenant. Non è possibile escludere solo i risultati da Microsoft Search o dall'indice semantico; le azioni si applicano a entrambe contemporaneamente.

Configurazione di informazioni dettagliate sugli elementi

Nella pagina Ricerca e intelligence nel interfaccia di amministrazione di Microsoft 365, Le informazioni dettagliate sugli elementi sono abilitate per impostazione predefinita. La disattivazione di persone o informazioni dettagliate sugli elementi riduce l'esperienza di Ricerca Microsoft e degli indici semantici, in quanto i risultati non includeranno persone rilevanti che sarebbero state derivate dai gruppi di distribuzione o dal grafico dell'organizzazione.

  • Persone informazioni dettagliate forniscono un elenco di persone rilevanti per un utente in base al lavoro di collaborazione pubblico in Microsoft 365. La collaborazione pubblica include membri di un gruppo di distribuzione pubblico e persone connesse nell'organigramma.

  • Informazioni dettagliate sugli elementi consentono consigli per gli utenti dell'organizzazione in base al lavoro collaborativo in Microsoft 365. Queste raccomandazioni possono includere, a titolo esemplificativo, documenti o altri tipi di contenuto e vengono visualizzate nelle schede persone (contatti), Nelve, Nell'app Microsoft 365, Microsoft Copilot risultati e in altre posizioni.

Le informazioni dettagliate sugli elementi e le informazioni dettagliate Persone non riguardano le funzionalità di personalizzazione basate sui dati di un utente.

Incorporazione di informazioni di terzi

Usando i connettori Copilot, le organizzazioni possono trasferire i dati o il contenuto dell'organizzazione da origini esterne in Microsoft Graph, dove vengono quindi inseriti nell'indice semantico. Microsoft indicizza tutti i dati dei connettori Graph mantenendo i controlli di accesso per il contenuto. Ciò espande i tipi di origini contenuto ricercabili nelle app per la produttività di Microsoft 365 e nel più ampio ecosistema Microsoft e funziona meglio quando il contenuto del connettore è ricco di testo. I dati di terze parti possono essere ospitati in locale o nei cloud pubblici o privati e queste informazioni vengono utilizzate da Microsoft Graph, che può essere inserito nell'indice semantico per fornire all'organizzazione tutto il contesto in Microsoft 365 e il contenuto di terze parti dell'organizzazione. Per altre informazioni sui requisiti di licenza del connettore graph per Microsoft 365 Enterprise e Microsoft 365 Copilot, vedere Requisiti e prezzi delle licenze.

Privacy, conformità e sicurezza

Il modello di autorizzazioni configurato all'interno del tenant di Microsoft 365 consente di garantire che i dati non vengano involontariamente diffusi tra utenti, gruppi e tenant. L'indice semantico presenta solo i dati a cui ogni utente può accedere usando gli stessi controlli sottostanti per l'accesso ai dati usato in altri servizi di Microsoft 365. L'indice semantico rispetta il limite di accesso basato sull'identità dell'utente in modo che il processo di messa a terra accinga solo al contenuto a cui l'utente corrente è autorizzato ad accedere. Per altre informazioni, vedere l'informativa sulla privacy e la documentazione del servizio Microsoft.

Microsoft 365 Copilot è conforme agli impegni esistenti in materia di privacy, sicurezza e conformità per i clienti commerciali di Microsoft 365, tra cui il Regolamento generale sulla protezione dei dati (GDPR) e il Confine dei dati dell'Unione europea (UE). Richieste, le risposte e i dati a cui si accede tramite l'indice semantico non vengono usati per eseguire il training delle VM di base, incluse quelle usate da Microsoft 365 Copilot. Per altre informazioni, vedere Dati, privacy e sicurezza per Microsoft 365 Copilot.

Archiviazione ed elaborazione

I dati generati dall'indice semantico rimangono all'interno del tenant dell'azienda e sono conformi ai criteri e ai processi di sicurezza, conformità, identità e privacy. L'indice semantico funziona solo con contenuto a cui gli utenti hanno già l'autorizzazione e non influisce sulle quote di archiviazione.

Le informazioni sull'indice a livello di utente vengono archiviate nella posizione in cui si trova la cassetta postale dell'utente. Le informazioni sull'indice a livello di tenant, invece, vengono archiviate in un contenitore tenant del cliente isolato e protetto. Questo contenitore si trova nell'area in cui si trova il sito di SharePoint, che può essere l'area Home o un'altra area specificata dall'amministratore del tenant. Per i clienti all'interno dell'EUDB (European Union Data Boundary), l'indice viene archiviato in un data center basato su UE/EFTA. L'elaborazione di altri clienti può avvenire in un'area tenant o nella Stati Uniti. Per le organizzazioni multi-geo, vengono rispettati tutti i limiti geografici. I dati nell'area vengono archiviati ed elaborati in ogni area.

Supporto di Microsoft Purview Customer Key (BYOK)

L'indice semantico offre il supporto BYOK (Bring Your Own Key) per le aziende che hanno abilitato BYOK nel proprio ambiente. Microsoft abilita automaticamente l'indice semantico per i clienti abilitati per BYOK senza alcun coinvolgimento amministrativo.

Protezione delle informazioni

Nel contesto della ricerca non esistono altri modi per escludere i dati dall'indice semantico usando le funzionalità di protezione delle informazioni. L'indice semantico eredita le impostazioni di sicurezza e privacy da Microsoft Search e ai dati provenienti da connettori di terze parti vengono fornite le stesse risorse di archiviazione e protezione degli altri dati di Microsoft 365. Per le organizzazioni che stanno analizzando altre opzioni di protezione delle informazioni, Microsoft 365 offre funzionalità predefinite nelle app di Microsoft 365. Sono disponibili anche prodotti aggiuntivi che consentono agli amministratori di proteggere i dati dell'organizzazione riducendo al minimo i dati e riducendo l'oversharing. Le sezioni seguenti descrivono le opzioni disponibili per le organizzazioni solo per riferimento.

Minimizzazione dei dati

La minimizzazione dei dati riduce la quantità di dati disponibili a cui l'organizzazione potrebbe accedere. La conservazione e l'eliminazione di contenuti sono spesso necessari per la conformità e i requisiti normativi, ma l'eliminazione di contenuti che non hanno più valore aziendale consente anche di gestire i rischi e la responsabilità. Gestione del ciclo di vita dei dati di Microsoft Purview, concesso in licenza separatamente, può essere usato per eliminare il contenuto che non è più necessario con i criteri di conservazione per la gestione su larga scala e le etichette di conservazione per le eccezioni e il controllo granulare.

Ridurre l'oversharing

Le organizzazioni sono state a lungo in grado di intervenire per ridurre la sovrasciezione in Microsoft 365 usando i controlli esistenti nella interfaccia di amministrazione di Microsoft 365 e SharePoint Online. È importante notare che l'indice semantico non modifica le autorizzazioni di accesso al contenuto e non modifica i principi di come gli utenti devono condividere informazioni con i colleghi. Ad esempio, l'indice semantico non rende il contenuto condiviso con un collegamento che funziona con tutti gli utenti dell'organizzazione nell'indice a livello di tenant. Solo gli utenti che selezionano un collegamento a cui hanno accesso avranno le informazioni aggiunte all'indice utente. Quando si esplorano le opzioni di protezione delle informazioni, è consigliabile che le organizzazioni considerino quanto segue:

  • Pianificare la collaborazione sicura con i file : rivedere il piano e distribuire una collaborazione file per comprendere meglio le procedure consigliate per gestire un ambiente di collaborazione file sicuro e produttivo per gli utenti.

  • Ridimensionare correttamente l'accesso degli utenti ai dati per ridurre l'elenco : ridurre la condivisione eccessiva ereditando elenchi di esclusione per i siti di SharePoint Online ed eseguendo controlli di controllo di accesso in tempo reale. Le organizzazioni possono prendere in considerazione l'uso del componente aggiuntivo Syntex SharePoint Advanced Management per gestire e gestire queste autorizzazioni.

  • Usare le etichette di riservatezza: un altro modo per ridurre l'oversharing del contenuto consiste nell'usare Microsoft Purview Information Protection per applicare le etichette di riservatezza, che consentono di classificare i dati in base alla riservatezza e applicare protezioni come la crittografia e il marketing dei contenuti. Le etichette di riservatezza sono incluse anche nel taglio della ricerca, ovvero supportato per il filtro e le regole sul lato applicazione usate per il contrassegno visivo e le restrizioni di accesso.

  • Limitare l'accesso: Prevenzione della perdita dei dati Microsoft Purview è disponibile in Microsoft 365 E5 e può essere usato per limitare in modo retroattivo e temporaneo l'accesso ai documenti segnalati come sovracondivisi. Le organizzazioni che non dispongono di licenze Microsoft 365 E5 possono usare la versione di valutazione delle soluzioni Microsoft Purview di 90 giorni per esplorare in che modo funzionalità aggiuntive di Purview possono aiutare a gestire le esigenze di sicurezza e conformità dei dati.

Per i clienti interessati a esplorare come distribuire soluzioni avanzate di protezione delle informazioni, vedere l'articolo seguente che illustra come distribuire una soluzione di protezione delle informazioni con Microsoft Purview. Per altre informazioni su come Microsoft Purview può aiutare a rafforzare i requisiti di sicurezza e conformità dei dati per Microsoft 365 Copilot, vedere Proteggere e gestire le interazioni Microsoft 365 Copilot con Microsoft Purview.

Risorse aggiuntive

Microsoft 365, Microsoft Graph e l'indice semantico consentono un'espressività senza precedenti per la ricerca, la chat e i copilot che sfruttano i dati di Microsoft 365. Questa espressività consente di visualizzare i dati di base corretti per ottenere il massimo dai dati aziendali con Microsoft 365 e Microsoft 365 Copilot.

Per altre informazioni su Microsoft 365 Copilot, vedere queste risorse: