Freigeben über


Semantischer Index für Copilot

Der semantische Index wird aus Inhalten in Microsoft Graph generiert. Es wird verwendet, um die Erstellung kontextrelevanter Antworten auf Benutzerabfragen zu unterstützen. Es ermöglicht Organisationen, Milliarden von Vektoren (mathematische Darstellungen von Merkmalen oder Attributen) zu durchsuchen und verwandte Ergebnisse zurückzugeben. In Kombination mit Verbesserungen in Microsoft Graph verbindet der semantische Index Sie mit relevanten Informationen in Ihrem organization. Es basiert auf dem umfassenden Ansatz von Microsoft für Sicherheit, Compliance, Datenschutz und berücksichtigt alle Organisationsgrenzen innerhalb Ihres Mandanten.

Was ist ein Index?

Das Konzept der Indizierung von Daten ist in Microsoft 365 gut etabliert. Die Indizierung ist eine der wichtigen Möglichkeiten, wie Microsoft 365-Dienste auf die enorme Datenmenge in Microsoft Graph zugreifen, wo sich Ihr Microsoft 365-Mandant befindet. Mit der Indizierung sehen Benutzer Suchergebnisse von Microsoft Graph, einschließlich Inhalten und Signalen aus den meisten Microsoft 365-Anwendungen in Ihrem Mandanten. Dadurch wird sichergestellt, dass Suchergebnisse basierend auf Ihren Verbindungen zwischen Inhalten und Personen in Ihrem Netzwerk personalisiert und erhöht werden.

Interaktionen mit Daten in Microsoft Graph basieren auf Schlüsselwort (keyword) Abgleich, Personalisierung und Social Matching. Schlüsselwortsuchabfragen für einen Index in Microsoft Graph, der Speicherorten in Dokumenten oder einer Gruppe von Dokumenten zugeordnet ist. Microsoft 365 verwendet Microsoft Graph, um die relevantesten Inhalte basierend auf dem Wissen über zusätzliche Signale für Benutzer und deren enges Netzwerk zu bewerten. Dies wird in Microsoft 365 als Personalisierung und Abgleich sozialer Netzwerke bezeichnet, wodurch die Relevanz für Abfragen für die Inhalte in Ihrem organization bestimmt wird. Der Zugriff auf Mandantendaten in Microsoft Graph erfolgt über die rollenbasierte Zugriffssteuerung. Organisationen haben immer die Kontrolle über die Funktionen von Microsoft Search über das Search and Intelligence-Portal im Microsoft 365 Admin Center.

Wie der semantische Index ihre Daten verwaltet

Der semantische Index erweitert die Features von Microsoft 365, mit denen Sie relevante Inhalte basierend auf Schlüsselwörtern, persönlichen Vorlieben und sozialen Verbindungen finden können. Dazu werden vektorisierte Indizes erstellt. Ein Vektor ist eine numerische Darstellung eines Wortes, eines Bildpunktes oder eines anderen Datenpunktes. Der Vektor wird mit nahe gelegenen Zahlen angeordnet oder zugeordnet, um Ähnlichkeiten darzustellen. Vektoren werden in mehrdimensionalen Räumen gespeichert, in denen semantisch ähnliche Datenpunkte im Vektorraum gruppiert sind, sodass Microsoft 365 eine breitere Gruppe von Suchabfragen verarbeiten kann, die über die "genaue Übereinstimmung" hinausgehen.

In der Praxis bedeutet dies, dass Microsoft 365-Dienste wie Microsoft 365 Copilot:

  • Verstehen von Beziehungen zwischen verschiedenen Formen von Wörtern (z. B. Technologie, Technologie, Technologien; USA, U.S.A, USA, USA von Amerika; Hund, Katze, Haustier).
  • Erfassen Sie Synonyme, um die Menge der durchsuchbaren Informationen zu erweitern, einschließlich der Absicht von Sätzen, Codeausschnitten, Dokumenten und Besprechungen.
  • Identifizieren Sie verwandte Ressourcen für Ihre Abfrage oder Ihren Beispielinhalt.

Die folgende Grafik verwendet Text (anstelle von Zahlen, die von vektorisierten Indizes verwendet werden), um ein Beispiel für die Ähnlichkeit zwischen Datenpunkten zu zeigen:

Grafik, die ein Beispiel dafür zeigt, wie Datenpunkte für den semantischen Index gruppiert werden.

Der semantische Index ermöglicht eine schnelle und genaue Ähnlichkeitssuche und -abruf von Daten basierend auf ihrer Vektorentfernung oder Ähnlichkeit. Dies bedeutet, dass der semantische Index nicht nur herkömmliche lexikalische Methoden für Abfragen basierend auf exakten Übereinstimmungen oder vordefinierten Kriterien verwendet, der semantische Index die ähnlichsten oder relevantesten Daten basierend auf der semantischen oder kontextbezogenen Bedeutung finden kann.

Features

Die folgenden semantischen Indexfeatures bieten mehr als nur die Verbesserung der Suchergebnisse. Sie arbeiten zusammen, um Ihnen zu helfen, Ihre Daten zu verstehen, Informationen schneller zu finden und Ihre Produktivität zu verbessern. Benutzer können zunächst über Microsoft 365 Copilot Integration mit dem semantischen Index interagieren. Wir generieren einen semantischen Index für Benutzer mit einer kostenpflichtigen Microsoft 365 Copilot-Lizenz. Hier finden Sie die Details zur Funktionsweise der einzelnen Features.

Microsoft Copilot mit Graph-basiertem Chat

Der semantische Index hilft beim Anzeigen von Ergebnissen in Microsoft Copilot mit graphbasiertem Chat, indem er die Absicht Ihrer Abfrage versteht und zusätzliche Informationen an Ihre Microsoft Copilot-Eingabeaufforderung anfügen. Relevante Informationen werden im Microsoft Graph- und semantischen Index abgerufen, um dem LLM (Large Language Model) weitere Informationen zur Verfügung zu stellen. Angenommen, Sie möchten Microsoft Copilot eine E-Mail finden, in der ein Kollege die Designarbeit eines Anbieters lobt. Der semantische Index enthält Wörter in der Nähe (z. B. aufgeregt, aufgeregt, erstaunt) in die Suche, um den Suchbereich zu erweitern und das beste Ergebnis zu erzielen. All diese Arbeiten finden im Hintergrund statt, um den Ergebnissen, nach denen Sie mit Microsoft Copilot suchen, Relevanz zu verleihen, ohne die Komplexität zu erhöhen.

Funktionsweise des semantischen Indexes

Der semantische Index verbessert Microsoft Copilot und Suchergebnisse in der Microsoft 365-App, SharePoint Online und Microsoft Teams. Es unterstützt eine verbesserte Sucherfahrung und konzeptionelles Verständnis Ihrer Onlinedaten, die automatisch von Microsoft aktiviert werden.

Heute wird der semantische Index auf Mandantenebene erstellt. Es handelt sich um einen organization-weiten Index, der aus textbasierten SharePoint Online-Dateien generiert wird, auf die mindestens zwei Personen über die Websitevererbung zugreifen können. Die Ergebnisse werden jedoch nur dann einem Benutzer angezeigt, wenn der Benutzer bereits Zugriff auf die inhalte hat, die von der rollenbasierten Zugriffssteuerung gesteuert werden. Darüber hinaus muss die SharePoint Online-Website durchsuchbar bleiben. Mit der Zeit generieren wir auch Indexinhalte auf Benutzerebene. Dadurch wird ein personalisierter Index eines Arbeitssatzes von Daten hinzugefügt, auf den Benutzer zugreifen können, die alltägliche Aufgaben ausführen. Dies schließt alle textbasierten Inhalte ein, die Sie erstellen oder mit denen Sie interagieren, z. B. E-Mails, Dokumente, die Sie Erwähnung oder die Sie kommentieren oder teilen.

Im folgenden Abschnitt wird erläutert, wie jeder Index aktiviert wird, wie der Datenfluss in Microsoft 365 Copilot den semantischen Index verwendet, welche Dateitypen jeder Index verarbeiten kann und wie jeder Index mit Updates umgeht.

Aktivierung

Jeder Microsoft 365 Copilot Kunde verfügt jetzt über einen semantischen Index auf Mandantenebene. Der Indizierungsprozess erfordert keine administrative Beteiligung.

Datenflüsse

Der semantische Index interagiert mit Microsoft Graph, um Benutzern Zugriff auf Informationen im Index zu ermöglichen. Das folgende Diagramm zeigt, wie der Datenfluss für eine Anforderung mit Microsoft 365 Copilot funktioniert.

Screenshot: Beziehung zwischen Microsoft 365 Copilot, Microsoft 365 Apps, Microsoft Graph und großem Sprachmodell

Benutzereingabeaufforderungen von Microsoft 365-Apps werden an Copilot (1) gesendet, und Copilot greift zur Verarbeitung auf den Microsoft Graph- und semantischen Index zu (2). Copilot sendet die geänderte Eingabeaufforderung an das große Sprachmodell (3), empfängt die LLM-Antwort (4) und greift dann auf den Microsoft Graph und den semantischen Index für die Nachbearbeitung zu (5). Copilot sendet dann die Antwort und den App-Befehl zurück an Microsoft 365-Apps. Alle Anforderungen werden per HTTPS verschlüsselt, und Kundendaten bleiben im Ruhezustand verschlüsselt.

Unterstützte Inhaltstypen

Der semantische Index unterstützt die Indizierung von Benutzerpostfächern und Dateitypen, die in der folgenden Tabelle aufgeführt sind, wobei im Laufe der Zeit weitere Dateitypen unterstützt werden. Eine Liste der unterstützten Dateitypen für den Index auf Benutzerebene und den Index auf Mandantenebene ist in der Tabelle enthalten.

Inhalt/Dateityp Benutzerebene Mandantenebene
Benutzerpostfach Unterstützt Nicht zutreffend
Delegiertes Postfach Nicht unterstützt Nicht zutreffend
Freigegebenes Postfach Nicht unterstützt Nicht zutreffend
Archivierte Postfachdaten Nicht unterstützt Nicht zutreffend
Archivierte SharePoint-Daten Nicht unterstützt Nicht unterstützt
Word Dokumente (doc/docx) Unterstützt Unterstützt
PowerPoint (pptx) Unterstützt Unterstützt
PDF-Dateien Unterstützt Unterstützt
Webseiten (aspx) Unterstützt Unterstützt
OneNote-Dateien (1) Unterstützt Unterstützt
Graph-Connectordaten Nicht zutreffend Unterstützt

Indexupdates

Wenn der semantische Index die Indizierung für einen Kunden zum ersten Mal abgeschlossen hat, werden von Benutzern erstellte Dokumente nahezu in Echtzeit im Postfach des Benutzers indiziert. Neue Dokumente, die SharePoint Online-Websites hinzugefügt werden, auf die über die Websitevererbung von mindestens zwei Benutzern zugegriffen werden kann, werden täglich indiziert. Wenn ein indiziertes Dokument auf Benutzer- und Mandantenebene aktualisiert wird, werden die Änderungen sofort indiziert.

Verwaltung

Wir bieten Administratoren optionale Aktivitäten zum Vorbereiten und Verwalten des semantischen Indexes über die Microsoft 365 Admin Center. Es ist keine administrative Beteiligung erforderlich, um den semantischen Index zu aktivieren, da der Dienst automatisch von Microsoft aktiviert wird. Der semantische Index ist eine Verbesserung von Microsoft 365 Search und kann nicht deaktiviert werden.

Administratoren können den semantischen Index vorbereiten und verwalten, indem sie die Überlegungen zum Planen und Bereitstellen einer Dateizusammenarbeit in SharePoint und freigabeberechtigungen in der modernen SharePoint-Benutzeroberfläche überprüfen. Administratoren können Dateien aus dem semantischen Index ausschließen, indem sie die Überlegungen zum Ausschließen von Daten mit Microsoft Purview Data Loss Prevention (DLP) überprüfen. Wenn keine DLP-Lösung vorhanden ist, können Administratoren SharePoint Online-Websites aus dem Index auf Mandantenebene ausschließen.

Ausschließen von SharePoint Online-Websites

Es gibt Situationen, in denen Organisationen ohne Microsoft Purview Data Loss Prevention eine SharePoint Online-Website davon ausschließen möchten, dass ihre Daten von Microsoft Search indiziert werden. Diese Schritte sollten nur für vertrauliche Daten wie Gehaltsabrechnung, Personalwesen oder Finanzinformationen in Betracht gezogen werden. Führen Sie die folgenden Schritte aus, um eine SharePoint Online-Website auszuschließen:

  1. Navigieren Sie zur Website mit den entsprechenden Administratorberechtigungen.
  2. Wählen Sie im Dropdownmenü Einstellungen und dann Websiteinformationen aus.
  3. Wählen Sie Alle Websiteeinstellungen anzeigen aus, um die Seite Websiteeinstellungen aufzurufen.
  4. Wählen Sie unter der Kategorie Suchendie Option Suche und Offlineverfügbarkeit und dann Nein aus, um diese Website in den Suchergebnissen anzuzeigen, um sie sowohl von Microsoft Search als auch von der semantischen Indexsuche auszuschließen. Dies kann auch mit PowerShell für mehrere Websites ausgeführt werden.

Screenshot: Einstellungen zum Ausschließen von SharePoint Online-Websites

Microsoft Search und der semantische Index unterstützen nur den Ausschluss von SharePoint Online-Inhalten aus dem Index auf Mandantenebene. Es gibt keine Möglichkeit, Ergebnisse nur aus Microsoft Search oder nur aus dem semantischen Index auszuschließen. Aktionen gelten für beide gleichzeitig.

Konfigurieren von Elementerkenntnissen

Auf der Seite Suche und Intelligenz im Microsoft 365 Admin Center sind Elementerkenntnisse standardmäßig aktiviert. Das Deaktivieren von Personen oder Elementerkenntnissen verringert die Microsoft Search- und semantische Indexerfahrung, da die Ergebnisse keine relevanten Personen enthalten, die aus Verteilergruppen oder aus dem Organigramm abgeleitet worden wären.

  • Personen Insights stellen einem Benutzer basierend auf seiner öffentlichen Zusammenarbeit in Microsoft 365 eine Liste relevanter Personen bereit. Die öffentliche Zusammenarbeit umfasst Mitglieder einer öffentlichen Verteilergruppe und Einzelpersonen, die im Organigramm verbunden sind.

  • Elementerkenntnisse ermöglichen Empfehlungen für Personen in Ihrem organization basierend auf ihrer gemeinsamen Arbeit in Microsoft 365. Diese Empfehlungen können u. a. Dokumente oder andere Arten von Inhalten umfassen und in Personenkarten (Kontakten), Delve, Die Microsoft 365-App, Microsoft Copilot Ergebnissen und anderen Speicherorten angezeigt werden.

Sowohl Item Insights als auch Personen Insights decken keine Personalisierungsfeatures basierend auf den eigenen Daten eines Benutzers ab.

Einbindung von Informationen Dritter

Mithilfe von Copilot-Connectors können Organisationen Organisationsdaten oder -inhalte aus externen Quellen in Microsoft Graph übertragen, wo sie dann in den semantischen Index gebracht werden. Microsoft indiziert alle Daten Ihrer Graph-Connectors unter Beibehaltung der Zugriffssteuerungen für Inhalte. Dies erweitert die Arten von Inhaltsquellen, die in Ihren Microsoft 365-Produktivitäts-Apps und im breiteren Microsoft-Ökosystem durchsuchbar sind, und funktioniert am besten, wenn Connectorinhalte textreich sind. Die Drittanbieterdaten können lokal oder in den öffentlichen oder privaten Clouds gehostet werden, und diese Informationen werden von Microsoft Graph genutzt, die in den semantischen Index aufgenommen werden können, um Ihren organization den gesamten Kontext in Microsoft 365 und den Inhalten Ihrer organization von Drittanbietern bereitzustellen. Weitere Informationen zu den Lizenzierungsanforderungen für Graph-Connectors für Microsoft 365 Enterprise und Microsoft 365 Copilot finden Sie unter Lizenzanforderungen und Preise.

Datenschutz, Compliance und Sicherheit

Mit dem Berechtigungsmodell in Ihrem Microsoft 365- Mandanten kann sichergestellt werden, dass Daten nicht versehentlich zwischen Benutzern, Gruppen und Mandanten offengelegt werden. Der semantische Index stellt nur Daten dar, auf die jede Person mit den gleichen zugrunde liegenden Steuerelementen für den Datenzugriff zugreifen kann, die in anderen Microsoft 365-Diensten verwendet werden. Der semantische Index berücksichtigt die benutzeridentitätsbasierte Zugriffsgrenze, sodass der Groundingprozess nur auf Inhalte zugreift, für die der aktuelle Benutzer berechtigt ist. Weitere Informationen finden Sie in der Microsoft-Datenschutzrichtlinie und in der Dienstdokumentation.

Microsoft 365 Copilot entspricht unseren bestehenden Datenschutz-, Sicherheits- und Compliance-Verpflichtungen gegenüber kommerziellen Microsoft 365-Kunden, einschließlich der General Data Protection Regulation (GDPR) und der EU-Datenschutzgrundverordnung (European Union (EU) Data Boundary). Prompts, Antworten und Daten, auf die über den semantischen Index zugegriffen wird, werden nicht zum Trainieren von grundlegenden LLMs verwendet, einschließlich derer, die von Microsoft 365 Copilot verwendet werden. Weitere Informationen finden Sie unter Daten, Datenschutz und Sicherheit für Microsoft 365 Copilot.

Speicherung und Verarbeitung

Die vom semantischen Index generierten Daten verbleiben im Mandanten Ihres Unternehmens und entsprechen Ihren Sicherheits-, Compliance-, Identitäts- und Datenschutzrichtlinien und -prozessen. Der semantische Index funktioniert nur mit Inhalten, für die Ihre Benutzer bereits über berechtigungen verfügen, und wirkt sich nicht auf Speicherkontingente aus.

Indexinformationen auf Benutzerebene werden dort gespeichert, wo sich das Postfach des Benutzers befindet. Indexinformationen auf Mandantenebene werden hingegen in einem isolierten und geschützten Mandantencontainer des Kunden gespeichert. Dieser Container befindet sich in der Region, in der sich die SharePoint-Website befindet, wobei es sich um die Startregion oder eine andere vom Mandantenadministrator angegebene Region handeln kann. Für Kunden innerhalb der Datengrenze der Europäischen Union (EUDB) wird der Index in einem EU/EFTA-basierten Rechenzentrum gespeichert. Die Verarbeitung anderer Kunden kann entweder in einer Mandantenregion oder im USA erfolgen. Für Multi-Geo-Organisationen werden alle geografischen Grenzen beachtet. Regionsinterne Daten werden in jeder Region gespeichert und verarbeitet.

Support für Microsoft Purview Customer Key (BYOK)

Der semantische Index bietet BYOK-Unterstützung (Bring Your Own Key) für Unternehmen, die BYOK in ihrer Umgebung aktiviert haben. Microsoft aktiviert automatisch den semantischen Index für BYOK-fähige Kunden ohne administrative Beteiligung.

Information Protection

Im Kontext der Suche gibt es keine anderen Möglichkeiten, Daten mithilfe von Informationsschutzfunktionen aus dem semantischen Index auszuschließen. Der semantische Index erbt Sicherheits- und Datenschutzeinstellungen von Microsoft Search, und daten, die von Connectors von Drittanbietern übermittelt werden, werden mit demselben Speicher und schutz wie andere Microsoft 365-Daten bereitgestellt. Für Organisationen, die zusätzliche Information Protection-Optionen untersuchen, bietet Microsoft 365 integrierte Funktionen in Microsoft 365-Apps. Add-On-Produkte sind auch verfügbar, um Administratoren beim Schutz von Organisationsdaten durch Datenminimierung und Reduzierung der Überteilung zu unterstützen. In den folgenden Abschnitten werden die Optionen beschrieben, die nur für Organisationen als Referenz verfügbar sind.

Datenminimierung

Die Datenminimierung reduziert die Menge der verfügbaren Daten, auf die Ihr organization möglicherweise zugreifen. Das Aufbewahren und Löschen von Inhalten ist häufig für Compliance- und gesetzliche Anforderungen erforderlich, aber das Löschen von Inhalten, die keinen geschäftlichen Nutzen mehr haben, hilft Ihnen auch beim Verwalten von Risiken und Haftung. Microsoft Purview-Datenlebenszyklusverwaltung, das separat lizenziert wird, kann verwendet werden, um Nicht mehr benötigte Inhalte mit Aufbewahrungsrichtlinien für die verwaltung im großen Stil und Aufbewahrungsbezeichnungen für Ausnahmen und präzise Kontrolle zu löschen.

Reduzieren der Überteilung

Organisationen können seit langem Maßnahmen ergreifen, um die Überteilung in Microsoft 365 mithilfe vorhandener Steuerelemente im Microsoft 365 Admin Center und SharePoint Online zu reduzieren. Es ist wichtig zu beachten, dass der semantische Index keine Zugriffsberechtigungen für Inhalte ändert und nicht die Prinzipien ändert, wie Benutzer Informationen für Kollegen freigeben sollten. Der semantische Index macht z. B. keine Inhalte für einen Link freigegeben, der für alle Personen in meinem organization Teil des Index auf Mandantenebene verwendet wird. Nur Benutzer, die einen Link auswählen, auf den sie Zugriff haben, werden die Informationen ihrem Benutzerindex hinzugefügt. Es wird empfohlen, dass Organisationen folgendes berücksichtigen, wenn sie die Optionen zum Schutz von Informationen untersuchen:

  • Planen einer sicheren Dateizusammenarbeit – Lesen Sie Planen und Bereitstellen einer Dateizusammenarbeit , um mehr über empfohlene Methoden zum Betrieb einer sicheren und produktiven Dateizusammenarbeitsumgebung für Ihre Benutzer zu erfahren.

  • Die richtige Größe des Benutzerzugriffs auf Daten, um die Liste zu reduzieren – reduzieren Sie die Überteilung, indem Sie Ausschlusslisten für SharePoint Online-Websites erben und Zugriffssteuerungsprüfungen in Echtzeit durchführen. Organisationen können die Verwendung des Syntex SharePoint Advanced Management-Add-Ons in Betracht ziehen, um diese Berechtigungen zu verwalten und zu steuern.

  • Verwenden von Vertraulichkeitsbezeichnungen: Eine weitere Möglichkeit, die Überteilung von Inhalten zu reduzieren, besteht darin, Microsoft Purview Information Protection zum Anwenden von Vertraulichkeitsbezeichnungen zu verwenden, mit denen Sie Daten basierend auf ihrer Vertraulichkeit klassifizieren und Schutzmechanismen wie Verschlüsselung und Content Marketing anwenden können. Vertraulichkeitsbezeichnungen sind auch in der Suchkürzung enthalten (d. a. unterstützt für Filterung und anwendungsseitige Regeln, die für visuelle Markierungen und Zugriffseinschränkungen verwendet werden).

  • Zugriff einschränkenMicrosoft Purview Data Loss Prevention ist in Microsoft 365 E5 verfügbar und könnte verwendet werden, um den Zugriff auf Dokumente, die als übermäßig freigegeben gemeldet wurden, rückwirkend und vorübergehend einzuschränken. Organisationen, die nicht über Microsoft 365 E5 Lizenzen verfügen, können die 90-tägige Testversion von Microsoft Purview-Lösungen verwenden, um zu erfahren, wie zusätzliche Purview-Funktionen ihnen helfen können, Ihre Anforderungen an Datensicherheit und Compliance zu verwalten.

Kunden, die sich mit der Bereitstellung erweiterter Information Protection-Lösungen beschäftigen möchten, finden Sie im folgenden Artikel, in dem erläutert wird, wie Sie eine Information Protection-Lösung mit Microsoft Purview bereitstellen. Weitere Informationen dazu, wie Microsoft Purview Ihnen helfen kann, Ihre Datensicherheits- und Complianceanforderungen für Microsoft 365 Copilot zu stärken, finden Sie unter Schützen und Verwalten Microsoft 365 Copilot Interaktionen mit Microsoft Purview.

Zusätzliche Ressourcen

Microsoft 365, Microsoft Graph und der semantische Index ermöglichen eine beispiellose Ausdruckskraft für Suche, Chat und Copiloten, die Microsoft 365-Daten nutzen. Diese Ausdruckskraft hilft dabei, die richtigen Erdungsdaten anzuzeigen, um ihre Unternehmensdaten mit Microsoft 365 und Microsoft 365 Copilot optimal zu nutzen.

Weitere Informationen zu Microsoft 365 Copilot finden Sie in den folgenden Ressourcen: