Teilen über


Was ist Azure KI Search?

Azure KI-Suche (ehemals „Azure Cognitive Search“) ist ein unternehmensbereites Such- und Abrufsystem mit umfassenden erweiterten Suchtechnologien, die für hochleistungsfähige Anwendungen in beliebiger Größenordnung entwickelt wurde.

Azure KI-Suche ist das primäre empfohlene Abrufsystem beim Erstellen von RAG-basierten Anwendungen in Azure mit nativen LLM-Integrationen zwischen Azure OpenAI Service und Azure Machine Learning.

Azure KI-Suche kann sowohl in herkömmlichen als auch in GenAI-Szenarien verwendet werden. Zu den gängigen Anwendungsfällen gehören Knowledge Base Insights (Katalog- oder Dokumentsuche), Informationsermittlung (Datenerkundung), Abruferweiterungen (RAG) und Automatisierung.

Zum Erstellen eines Suchdiensts werden folgende Funktionen verwendet:

Aus architektonischer Sicht befindet sich ein Suchdienst zwischen den externen Datenspeichern, die Ihre nicht indizierten Daten enthalten, und Ihrer Client-App, die Abfrageanforderungen an einen Suchindex sendet und die Antwort verarbeitet.

Azure KI-Suche-Architektur

In Ihrer Client-App wird die Suchfunktion mithilfe von APIs aus Azure KI Search definiert und kann Relevanzoptimierung, semantische Rangfolge, automatische Vervollständigung, Synonymabgleich, Fuzzyübereinstimmung, Musterabgleich, Filter und Sortierung umfassen.

Auf der Azure-Plattform kann Azure KI Search mit anderen Azure-Diensten integriert werden. Dies erfolgt über Indexer, die das Erfassen/Abrufen von Daten aus Azure-Datenquellen automatisieren, und Skillsets, mit denen nutzbare KI-Daten aus Azure AI Services (z. B. Verarbeitung von Bildern und natürlicher Sprach) oder benutzerdefinierte KI-Daten, die Sie in Azure Machine Learning erstellen oder in Azure Functions einbinden, einbezogen werden.

In einem Suchdienst

Die beiden primären Workloads des eigentlichen Suchdiensts sind Indizierung und Abfrage.

  • Bei der Indizierung handelt es sich um einen Erfassungsprozess, bei dem Inhalte in Ihren Suchdienst geladen und durchsuchbar gemacht werden. Intern wird eingehender Text in Token verarbeitet und in invertierten Indizes gespeichert, und eingehende Vektoren werden in Vektorindizes gespeichert. Das Dokumentformat, das Azure KI Search indizieren kann, ist JSON. Sie können von Ihnen erstellten JSON-Dokumente hochladen oder einen Indexer verwenden, um Ihre Daten in JSON abzurufen oder zu serialisieren.

    Angewandte KI durch ein Skillset erweitert die Indizierung um Bild- und Sprachmodelle. Wenn das Quelldokument Bilder oder großen unstrukturierten Text enthält, können Sie Skills anfügen, die beispielsweise eine optische Zeichenerkennung durchführen, Bilder analysieren und beschreiben, die Struktur ableiten und/oder Text übersetzen. Die Ausgabe ist Text, der in JSON serialisiert und in einem Suchindex erfasst werden kann.

    Skillsets können auch Datenblockerstellung und Vektorisierung während der Indizierung durchführen. Skills, die an Azure OpenAI angefügt werden, der Modellkatalog in Azure KI Studio oder benutzerdefinierte Skills, die an ein beliebiges externes Segmentierungs- und Einbettungsmodell angefügt werden, können während der Indizierung zum Erstellen von Vektordaten verwendet werden. Die Ausgabe ist segmentierter Vektorinhalt, der in einem Suchindex erfasst werden kann.

  • Abfragen können ausgeführt werden, sobald ein Index mit durchsuchbarem Inhalt aufgefüllt wurde. Ihre Client-App sendet dann Abfrageanforderungen an einen Suchdienst und verarbeitet die Antworten. Die gesamte Abfrageausführung erfolgt über einen von Ihnen gesteuerten Suchindex.

    Die semantische Rangfolge ist eine Erweiterung der Abfrageausführung. Sie fügt eine sekundäre Rangfolge hinzu. Dabei wird Sprachverständnis verwendet, um ein Resultset neu zu bewerten und die semantisch relevantesten Ergebnisse am Anfang zu platzieren.

    Integrierte Vektorisierung ist ebenfalls eine Erweiterung der Abfrageausführung. Wenn Ihr Suchindex Vektorfelder enthält, können Sie unformatierte Vektorabfragen oder Text übermitteln, der zur Abfragezeit vektorisiert wird.

Azure KI Search eignet sich sehr gut für die folgenden Anwendungsszenarios:

  • Verwenden Sie sie für die herkömmliche Volltextsuche und die moderne Vektor-Ähnlichkeitssuche. Unterstützen Sie Ihre generativen KI-Apps mit einer Informationsabfrage, die die Stärken sowohl der Stichwort- als auch der Ähnlichkeitssuche nutzt. Verwenden Sie beide Modalitäten, um die relevantesten Ergebnisse abzurufen.

  • Konsolidieren Sie heterogene Inhalte in einem benutzerdefinierten und aufgefüllten Suchindex, der aus Vektoren und Text besteht. Sie behalten den Besitz und die Kontrolle darüber, was durchsuchbar ist.

  • Integrieren der Datensegmentierung und Vektorisierung für generative KI- und RAG-Apps

  • Anwenden von präziser Zugriffssteuerung auf Dokumentebene.

  • Auslagern von Indizierungs- und Abfrageworkloads in einen dedizierten Suchdienst

  • Einfache Implementierung von suchbezogenen Features: Relevanzoptimierung, Facettennavigation, Filter (z. B. geografisch-räumliche Suche), Synonymzuordnung und AutoVervollständigen.

  • Transformation von großen undifferenzierten Text-/Bild- oder Anwendungsdateien, die in Azure Blob Storage oder Azure Cosmos DB gespeichert sind, in durchsuchbare Blöcke. Dies wird bei der Indizierung mit KI-Fähigkeiten erreicht, die Funktionen für die externe Verarbeitung von Azure KI hinzufügen.

  • Hinzufügung einer linguistischen oder benutzerdefinierten Textanalyse. Bei nicht englischsprachigen Inhalten unterstützt Azure KI Search sowohl Lucene-Analysetools als auch die Microsoft-Prozessoren für die Verarbeitung natürlicher Sprache. Sie können Analysetools auch so konfigurieren, dass Rohdaten einer speziellen Verarbeitung unterzogen werden, um z. B. diakritische Zeichen herauszufiltern oder Muster in Zeichenfolgen zu erkennen und beizubehalten.

Weitere Informationen zu bestimmten Funktionen finden Sie unter Azure KI Search-Features.

Erste Schritte

Die Funktionalität wird über das Azure-Portal, einfache REST-APIs oder Azure-SDKs wie das Azure SDK für .NET bereitgestellt. Das Azure-Portal unterstützt die Dienst- und Inhaltsverwaltung mit Tools für die Prototyperstellung und Abfrage Ihrer Indizes und Skillsets.

Verwenden des Azure-Portals

Mithilfe der folgenden vier Schritte können Sie sich umfassend mit den wichtigsten Suchfunktionen vertraut machen:

  1. Entscheiden Sie sich für eine Ebene und Region. Ein kostenloser Search-Dienst pro Abonnement ist zulässig. Alle Schnellstarts können im Free-Tarif durchgeführt werden. Um mehr Kapazität und Funktionen zu erhalten, benötigen Sie einen abrechenbaren Tarif.

  2. Erstellen eines Suchdiensts über das Azure-Portal.

  3. Beginnen Sie mit dem Datenimport-Assistenten. Wählen Sie ein integriertes Beispiel oder eine unterstützte Datenquelle aus, um einen Index in wenigen Minuten zu erstellen, zu laden und abzufragen.

  4. Schließen Sie den Such-Explorer mithilfe eines Portalclients ab, um den soeben erstellten Suchindex abfragt.

Verwenden von APIs

Alternativ können Sie einen Suchindex in kleinen Schritten erstellen, laden und abfragen:

  1. Erstellen Sie einen Suchindex, indem Sie das Portal, die REST-API, das .NET SDK oder ein anderes SDK verwenden. Das Indexschema definiert die Struktur von durchsuchbarem Inhalt.

  2. Laden Sie Inhalte hoch, indem Sie das Pushmodell verwenden, um JSON-Dokumente aus einer beliebigen Quelle zu pushen. Verwenden Sie alternativ das Pullmodell (Indexer),, falls Ihre Quelldaten einen unterstützten Typ haben.

  3. Fragen Sie einen Index ab. Verwenden Sie dazu den Suchexplorer im Portal, die REST-API, das .NET SDK oder ein anderes SDK.

Verwenden von Beschleunigern

Oder probieren Sie Solution Accelerators aus:

  • Der Solution Accelerator Stellen Sie Fragen zu Ihren Daten hilft Ihnen dabei, eine benutzerdefinierte RAG-Lösung über Ihre Inhalte zu erstellen.

  • Der Solution Accelerator Wissensgewinnung aus Unterhaltungen hilft Ihnen bei der Erstellung einer interaktiven Lösung, um handlungsrelevante Erkenntnisse aus Transkripten nach dem Kontaktcenter zu extrahieren.

  • Knowledge Mining Accelerator für Dokumente hilft Ihnen, Zusammenfassungen, Entitäten und Metadaten aus unstrukturierten, multimodalen Dokumenten zu verarbeiten und zu extrahieren.

  • Der Solution Accelerator zum Erstellen Ihres eigenen Copilots nutzt Azure OpenAI Service, Azure KI-Suche und Microsoft Fabric, um benutzerdefinierte Copilotlösungen zu erstellen.

    • Generic Copilot hilft Ihnen, Ihren eigenen Copilot zu erstellen, relevante Dokumente zu identifizieren, unstrukturierte Informationen zusammenzufassen und Word-Dokumentvorlagen mithilfe Ihrer eigenen Daten zu generieren.

    • Der komplette benutzerdefinierte Client Advisor-Copilot ermöglicht es Client Advisor, die Leistungsfähigkeit von generativer KI sowohl für strukturierte als auch unstrukturierte Daten zu nutzen. Helfen Sie Kunden, tägliche Aufgaben zu optimieren und bessere Interaktionen mit deren Kunden zu fördern.

    • Research Assistant hilft Ihnen dabei, einen eigenen KI-Assistenten zu erstellen, der relevante Dokumente ermittelt, große Mengen unstrukturierter Daten zusammenfasst und kategorisiert und den gesamten Prozess der Dokumentüberprüfung und Inhaltsgenerierung beschleunigt.

Tipp

Wenden Sie sich an einen Partner, der sich sehr gut mit der Azure KI Search-Technologie auskennt, um Hilfe zu komplexen oder benutzerdefinierten Lösungen zu erhalten.

Suchoptionen vergleichen

Kunden interessieren sich häufig für einen Vergleich von Azure KI Search mit anderen Suchlösungen. Die wesentlichen Unterschiede sind in der folgenden Tabelle zusammengefasst.

Im Vergleich zu Wesentliche Unterschiede
Microsoft Search Microsoft Search ist für authentifizierte Microsoft 365-Benutzer bestimmt, die Abfragen für den Inhalt in SharePoint ausführen müssen. Die Azure KI-Suche ruft Inhalte über Azure und alle JSON-Datasets hinweg ab.
Bing Bing-APIs fragen die Indizes für Bing.com nach übereinstimmenden Begriffen ab. Die Azure KI-Suche durchsucht Indizes, die mit Ihren Inhalten gefüllt sind. Sie steuern die Datenerfassung und das Schema.
Datenbanksuche Azure SQL verfügt über Volltextsuche und Vektorsuche. Azure Cosmos DB verfügt auch über Textsuche und Vektorsuche. Azure KI-Suche wird zu einer attraktiven Alternative, wenn Sie Funktionen wie Relevanzabstimmung oder Inhalte aus heterogenen Quellen benötigen. Die Ressourcenverwendung ist ein weiterer Wendepunkt. Die Indizierung und Abfragen sind rechenintensiv. Durch die Auslagerung der Suche aus dem DBMS werden Systemressourcen für die Transaktionsverarbeitung frei.
Dedizierte Suchlösung Wenn Sie sich für eine dedizierte Suche mit voller Funktionalität entschieden haben, erfolgt der endgültige Vergleich letztendlich zwischen Suchtechnologien. Unter den Cloudanbietern eignet sich die Azure KI-Suche am besten für Vektor-, Schlüsselwort- und Hybridarbeitslasten über Inhalte auf Azure, für Apps, die sich in erster Linie auf die Suche sowohl für den Informationsabruf als auch für die Inhaltsnavigation verlassen.

Wichtige Vorteile umfassen:

  • Unterstützung für Vektor- und Nichtvektorindizierung (Text) und Abfragen. Mit der Vektorähnlichkeitssuche finden Sie Informationen, die den Suchanfragen semantisch ähnlich sind, auch wenn die Suchbegriffe nicht exakt übereinstimmen. Verwenden Sie die Hybridsuche, um das Beste aus Stichwort- und Vektorsuche zu erhalten.
  • Rangzuweisung und Relevanzoptimierung durch semantische Priorisierungs- und Bewertungsprofile. Die Abfragesyntax unterstützt Begriffsverstärkung und Feldpriorisierung.
  • Azure-Datenintegration (Crawler) auf Indexebene.
  • Azure KI-Integration für Transformationen, die Inhaltstext und Vektoren durchsuchbar machen.
  • Microsoft Entra-Sicherheit für vertrauenswürdige Verbindungen und Azure Private Link für private Verbindungen in Szenarien ohne Internet.
  • Vollständige Sucherfahrung: Linguistische und benutzerdefinierte Textanalyse in 56 Sprachen. Faceting, AutoVervollständigen-Abfragen und vorgeschlagene Ergebnisse und Synonyme.
  • Azure-Skalierung, Zuverlässigkeit und globale Reichweite.