Transparenzhinweis: Azure AI Search

2025-06-27

Von Bedeutung

Nicht englische Übersetzungen werden nur zur Bequemlichkeit bereitgestellt. Bitte wenden Sie sich an die EN-US Version dieses Dokuments für die Bindungsversion.

Was ist ein Transparenzhinweis?

Ein KI-System umfasst nicht nur die Technologie, sondern auch die Personen, die das System verwenden, die davon betroffenen Personen und die Umgebung, in der es bereitgestellt wird. Die Erstellung eines Systems, das für den vorgesehenen Zweck geeignet ist, erfordert ein Verständnis dafür, wie Technologie funktioniert, was ihre Funktionen und Einschränkungen sind und wie Sie die beste Leistung erzielen können. Die Transparenzhinweise von Microsoft sollen Ihnen helfen zu verstehen, wie unsere KI-Technologie funktioniert, welche Entscheidungen Systembesitzer treffen können, die die Systemleistung und das Systemverhalten beeinflussen, und wie wichtig es ist, das gesamte System zu betrachten, einschließlich der Technologie, der Menschen und der Umgebung. Sie können Transparenzhinweise verwenden, wenn Sie Ihr eigenes System entwickeln oder bereitstellen oder mit den Personen teilen, die ihr System verwenden oder davon betroffen sind.

Die Transparenzhinweise von Microsoft sind Teil einer größeren Initiative bei Microsoft, unsere KI-Prinzipien praktisch umzusetzen. Weitere Informationen finden Sie unter Verantwortungsvolle und vertrauenswürdige KI.

Die Grundlagen von Azure AI Search

Einleitung

Azure AI Search bietet Entwicklern Tools, APIs und SDKs zum Erstellen einer umfassenden Sucherfahrung über private, heterogene Inhalte in Web-, Mobilen- und Unternehmensanwendungen. Die Suche ist für jede Anwendung, die Daten für Benutzer anzeigt, von grundlegender Grundlage. Häufige Szenarien sind Katalog- oder Dokumentsuche, Online-Einzelhandelsgeschäfte oder Datensuche über proprietäre Inhalte.

Durchsuchbare Daten können in Form von Text oder Vektoren sein und as-is aus einer Datenquelle aufgenommen oder mithilfe von KI erweitert werden, um die allgemeine Sucherfahrung zu verbessern. Entwickler können Daten int in numerische Darstellungen (als Vektoren bezeichnet) konvertieren, indem Sie ein externes Machine Learning-Modell (sogenannte Einbettungsmodelle) aufrufen. Indexer können optional Fähigkeiten umfassen, die eine leistungsstarke Suite von Datenanreicherung über mehrere Azure AI Language-Funktionen unterstützen, z. B. Named Entity Recognition (NER) und personenbezogene Informationen (PII)-Erkennung sowie Azure AI Vision-Funktionen , einschließlich optischer Zeichenerkennung (OCR) und Bildanalyse.

Weitere Informationen dazu, wie Azure AI Search die Sucherfahrung verbessert, indem Sie Azure AI-Dienste oder andere KI-Systeme verwenden, um die Absicht, Semantik und konkludente Struktur eines Kundeninhalts besser zu verstehen.

Die KI-Bereicherung ist die Anwendung von Machine Learning-Modellen von Azure AI-Diensten über Inhalte, die nicht einfach in ihrer rohen Form durchsuchbar sind. Durch Anreicherung, Analyse und Rückschließen werden durchsuchbare Inhalte und Strukturen geschaffen, wo vorher keine vorhanden waren.

DIE KI-Anreicherung ist eine optionale Erweiterung der Azure AI Search-Indexerpipeline, die eine Verbindung mit Azure AI-Diensten in derselben Region wie der Suchdienst eines Kunden herstellt. Eine Anreicherungspipeline verfügt über die gleichen Kernkomponenten wie ein typischer Indexer (Indexer, Datenquelle, Index), sowie einen Qualifikationssatz, der die Atomanreicherungsschritte angibt. Ein Qualifikationssatz kann mit integrierten Fähigkeiten basierend auf den Azure AI-Dienst-APIs, z. B. Azure AI Vision und Azure AI Language, oder benutzerdefinierten Fähigkeiten erstellt werden, die externen Code ausführen, den Sie bereitstellen.

Die Vektorsuche ist eine Methode zum Abrufen von Informationen, bei denen Dokumente und Abfragen in einem Index anstelle von Nur-Text als Vektoren dargestellt werden. In der Vektorsuche generieren Machine Learning-Modelle, die extern von Azure AI Search gehostet werden, die Vektordarstellungen von Quelleingaben, die Text, Bilder, Audio- oder Videoinhalte sein können. Diese mathematische und normalisierte Darstellung von Inhalten, die als Vektoreinbettungen bezeichnet werden, bietet eine gemeinsame Grundlage für Suchszenarien.

Wenn alles ein Vektor ist, kann eine Abfrage eine Übereinstimmung im Vektorraum finden, auch wenn sich der zugeordnete ursprüngliche Inhalt in einem anderen Medientyp befindet, z. B. Bilder im Vergleich zu Text oder Sprache als die Abfrage. Die Suchmaschine überprüft den Index, der nach Vektorinhalten sucht, die am ehesten dem Vektor in der Abfrage am nächsten sind. Das Abstimmen auf eine mathematische Vektordarstellung anstelle von Schlüsselwörtern macht es viel wahrscheinlicher, Übereinstimmungen zu finden, die semantische Bedeutungen teilen, aber textlich verschieden sind, z. B. "Auto" und "Wagen". Dadurch erhalten Sie eine detailliertere Einführung in Vektoreinbettungen und die Funktionsweise des Ähnlichkeitsalgorithmus.

Schlüsselbegriffe

Begriff	Definition
Vektoreinbettungen	Eine hochoptimierte Methode zum Darstellen von Daten, die Bedeutung und Verständnis widerspiegeln, die von einem maschinellen Lernmodell aus Bildern, Audio, Video oder Text extrahiert werden. Der Inhalt wird sowohl beim Indizieren als auch zur Abfragezeit in Vektoreinbettungen umgewandelt. Die Vektorsuche bezieht sich auf die in einer Abfrage bereitgestellten Einbettungen und sucht nach den ähnlichsten Einbettungen im Index. Die Ergebnisse werden dann in der Regel nach dem Grad der Ähnlichkeit sortiert.
Einbettungsraum	Alle Vektoren im Korpus für ein einzelnes Feld belegen den gleichen Einbettungsraum, in dem sich ähnliche Elemente nahe beieinander befinden, und unterschiedliche Elemente sind weiter auseinander. Eine höhere Dimensionalität des Einbettungsraums kann weitere Informationen in einem einzelnen Vektor enthalten und die Sucherfahrung erheblich verbessern, aber zu erheblichen Kosten für die Indexspeichergröße und höhere Abfragelatenz.

Begriff

Definition

Vektoreinbettungen

Eine hochoptimierte Methode zum Darstellen von Daten, die Bedeutung und Verständnis widerspiegeln, die von einem maschinellen Lernmodell aus Bildern, Audio, Video oder Text extrahiert werden. Der Inhalt wird sowohl beim Indizieren als auch zur Abfragezeit in Vektoreinbettungen umgewandelt. Die Vektorsuche bezieht sich auf die in einer Abfrage bereitgestellten Einbettungen und sucht nach den ähnlichsten Einbettungen im Index. Die Ergebnisse werden dann in der Regel nach dem Grad der Ähnlichkeit sortiert.

Einbettungsraum

Alle Vektoren im Korpus für ein einzelnes Feld belegen den gleichen Einbettungsraum, in dem sich ähnliche Elemente nahe beieinander befinden, und unterschiedliche Elemente sind weiter auseinander. Eine höhere Dimensionalität des Einbettungsraums kann weitere Informationen in einem einzelnen Vektor enthalten und die Sucherfahrung erheblich verbessern, aber zu erheblichen Kosten für die Indexspeichergröße und höhere Abfragelatenz.

Der semantische Rangierer verwendet den Kontext oder die semantische Bedeutung einer Abfrage, um eine neue Relevanzbewertung zu berechnen, die Ergebnisse fördert, die semantisch der Absicht der ursprünglichen Abfrage am Anfang am nächsten stehen. Das anfängliche Resultset kann aus einer Schlüsselwortsuche mit BM25-Rangfolge , Vektorsuche oder einer Hybridsuche stammen, die beide umfasst. Sie erstellt und liefert auch „Beschriftungen“ zurück, indem wortgenauer Inhalt extrahiert wird, der im Ergebnis gefunden wurde, und „Highlights“, um die Aufmerksamkeit auf wichtige Inhalte innerhalb des Ergebnisses zu lenken. Es kann auch eine "Antwort" zurückgeben, wenn die Abfrage die Merkmale einer Frage ("was ist der Gefrierpunkt von Wasser") aufweist, und das Ergebnis enthält Text mit den Merkmalen einer Antwort ("Wasser friert bei 0°C oder 32°F").

Schlüsselbegriffe

Begriff	Definition
Semantischer Sortierer	Verwendet den Kontext und die semantische Bedeutung einer Abfrage, um die Suchrelevanz zu verbessern, indem das Sprachverständnis verwendet wird, um Suchergebnisse neu zu bewerten.
Semantische Titel und Markierungen	Extrahiert Sätze und Ausdrücke aus einem Dokument, die den Inhalt am besten zusammenfassen, mit Hervorhebungen über wichtigen Passagen zum einfachen Scannen. Beschriftungen, die ein Ergebnis zusammenfassen, sind nützlich, wenn einzelne Inhaltsfelder für die Ergebnisseite zu dicht sind. Der markierte Text hebt die relevantesten Begriffe und Ausdrücke hervor, sodass Benutzer schnell ermitteln können, warum eine Entsprechung als relevant eingestuft wurde.
Semantische Antworten	Stellt eine optionale und zusätzliche Unterstruktur bereit, die von einer semantischen Abfrage zurückgegeben wird. Sie bietet eine direkte Antwort auf eine Abfrage, die wie eine Frage aussieht. Ein Dokument muss Text mit den Merkmalen einer Antwort enthalten.

Die GenAI Prompt-Fähigkeit ist Teil des Azure AI Search-Katalogs von Fähigkeiten, sodass Kunden ihre Suchindizes mit KI-generierten Inhalten basierend auf ihren Daten verbessern können. Durch die Verwendung der eigenen Daten und Vorlieben des Kunden hilft diese Fähigkeit dabei, maßgeschneiderte Zusammenfassungen, Antworten oder Erkenntnisse zu erstellen, die ihren spezifischen Anforderungen entsprechen.

Das bedeutet, wenn der Endbenutzer die Inhalte der Kunden über die KI-Suche durchsucht, kann der von KI generierte Inhalt informativere und kontextbezogene Ergebnisse liefern, sodass Benutzer die gesuchten Informationen leichter finden können.

Schlüsselbegriffe

Begriff	Definition
Fähigkeiten	Eine Azure AI Search-Fähigkeit ist eine modulare Verarbeitungskomponente in der Azure AI Search-Anreicherungspipeline. Diese Fähigkeiten wenden KI-gesteuerte Transformationen auf Rohinhalte wie Text, Bilder oder Dokumente während der Indizierung an, wodurch strukturierte, durchsuchbare Informationen aus unstrukturierten Daten extrahiert werden können.
Prompt	Der Text, den Sie im API-Aufruf an den Dienst senden. Dieser Text wird dann in das Modell eingegeben. Beispielsweise kann ein Benutzer die folgende Eingabeaufforderung eingeben: Konvertieren Sie die Fragen in einen Befehl: F: Fragen Sie Konstanz, ob wir etwas Brot A benötigen: send-msg `find constance` Brauchen wir ein Brot? F: Senden Sie eine Nachricht an Greg, um herauszufinden, ob alles für Mittwoch fertig ist. A: Send-msg `find greg` alle bereit für Mittwoch?
Suchindizes	In Azure AI Search ist ein Index die Datenstruktur, die Ihre durchsuchbaren Inhalte enthält, definiert, wie sie gespeichert wird, und steuert, wie der Dienst sie interpretiert, wenn Sie eine Abfrage ausführen.

Agentisches Abrufen ist eine parallele Architektur zur Abfragebearbeitung, die ein konversationelles großes Sprachmodell (LLM) als „Abfrageplaner“ verwendet. Das LLM wandelt nach Bedarf den Unterhaltungsverlauf eines Benutzers in eine oder mehrere fokussierte Unterabfragen um. Diese Unterabfragen werden gleichzeitig in Ihrem Azure AI Search-Index ausgeführt, und der Dienst führt die wichtigsten Ergebnisse zusammen und gibt Folgendes zurück:

Ein einzelnes Inhaltselement, das die relevantesten Passagen (Referenzdaten) enthält.
Ein Referenzarray (optional), das die vollständigen Quelldokumente oder -blöcke verfügbar macht.
Ein Aktivitätsarray, das jede Operation, Tokenanzahl und Latenz auflistet, um die Kostennachverfolgung und das Debuggen zu unterstützen.

Schlüsselbegriffe

Begriff	Definition

Agent-Abruf	Dies bezieht sich auf die Planung und Ausführung einer Abfolge von Schritten zum Abrufen von Informationen aus Groundingdaten. Dies umfasst Aktivitäten wie Abfragen und Verfeinern von Suchvorgängen, um die relevantesten Informationen für die Abfrage abzurufen.
Groundingdaten	Satz von Dokumenten/Informationen, die vom Agentic-Abruf zurückgegeben werden. Dient als sachliche Grundlage, die ein externes LLM zitieren oder in eine natürlichsprachige Antwort umwandeln kann, um die Rückverfolgbarkeit zu gewährleisten und das Halluzinationsrisiko zu reduzieren.
Abfrageplaner	Unterteilt den Unterhaltungsverlauf in Unterabfragen, um die relevantesten Daten als Grundlage für die zugrunde liegende Suchanfrage zu finden.
Unterabfrage	Eine einzelne Abfrage, die von einer LLM generiert wird. Unterabfragen basieren auf Benutzerfragen, Chatverlauf und Parametern auf der Anforderung. Die Unterabfragen zielen auf Ihre indizierten Dokumente (Nur-Text und Vektoren) in Azure AI Search ab.

Fähigkeiten

Systemverhalten

Mehrere integrierte Fähigkeiten zur KI-Anreicherung in Azure AI Search nutzen Azure AI-Dienste. Die Transparenzhinweise für jede integrierte Qualifikation finden Sie unten für Überlegungen bei der Wahl einer Fähigkeit:

Fähigkeiten zur Erkennung von Schlüsselbegriffen: Azure AI Language – Schlüsselworterkennung
Spracherkennung: Azure AI-Sprache – Spracherkennung
Entitätsverknüpfungsfertigkeit: Azure AI-Sprache – Entitätsverknüpfung
Entitätserkennungskompetenz: Azure AI Language – Benannte Entitätserkennung (NER)
PII-Erkennungskompetenz: Azure AI-Sprache – PII-Erkennung
Stimmungskompetenz: Azure AI-Sprache - Stimmungsanalyse
Fähigkeit zur Bildanalyse: Azure AI Vision – Bildanalyse
OCR Skill: Azure AI Vision - OCR

In der Dokumentation zu jeder Fähigkeit erfahren Sie mehr über deren jeweilige Fähigkeiten, Einschränkungen, Leistung, Bewertungen und Methoden für die Integration und verantwortungsvolle Nutzung. Beachten Sie, dass die Verwendung dieser Techniken in Kombination zu kumulierenden Effekten führen kann (z. B. bei der Verwendung von OCR auftretende Fehler setzen sich bei der Schlüsselwortextraktion fort).

Anwendungsfälle

Beispielhafte Anwendungsfälle

Da Azure AI Search eine Volltextsuchlösung ist, besteht der Zweck der KI-Anreicherung darin, die Suchfunktion unstrukturierter Inhalte zu verbessern. Hier sind einige Beispiele für Szenarien zur Inhaltserweiterung, die von den integrierten Fähigkeiten unterstützt werden:

Übersetzung und Spracherkennung ermöglichen die mehrsprachige Suche.
Die Entitätserkennung extrahiert Personen , Orte und andere Entitäten aus großen Textabschnitten.
Die Schlüsselauszugsextraktion identifiziert und gibt dann wichtige Begriffe aus.
OCR erkennt gedruckten und handschriftlichen Text in Binärdateien.
Die Bildanalyse beschreibt Bildinhalte und gibt die Beschreibungen als durchsuchbare Textfelder aus.
Integrierte Vektorisierung ist ein Vorschaufeature, das das Azure OpenAI-Einbettungsmodell aufruft, um Daten zu vektorisieren und Einbettungen in Azure AI Search für Ähnlichkeitssuche zu speichern.

Einschränkungen

Die KI-Anreicherung in Azure AI Search verwendet die Indexer- und Datenquellenfeatures des Diensts, um Azure AI-Dienste aufzurufen, um die Inhaltserweiterung durchzuführen. Einschränkungen der in diesem Prozess verwendeten Indexer und Datenquellen gelten. Lesen Sie die Indexer- und Datenquellendokumentation für weitere Informationen über diese zugehörigen Einschränkungen. Die Einschränkungen der einzelnen Azure AI-Dienste, die von der KI-Anreicherungspipeline in Azure AI Search verwendet werden, gelten ebenfalls. Weitere Informationen zu diesen Einschränkungen finden Sie in den Transparenzhinweisen für jeden Dienst .

Freigeben über

Transparenzhinweis: Azure AI Search

Was ist ein Transparenzhinweis?

Die Grundlagen von Azure AI Search

Einleitung

Fähigkeiten

Systemverhalten

Anwendungsfälle

Beispielhafte Anwendungsfälle

Einschränkungen

Erfahren Sie mehr über verantwortungsvolle KI

Weitere Informationen zu Azure AI Search

Feedback

Zusätzliche Ressourcen