Schnellstart: Erstellen eines Suchindexes im Azure-Portal

Erstellen Sie in dieser Azure AI Search-Schnellstartanleitung Ihren ersten Suchindex mithilfe des Assistenten zum Importieren von Daten und einer integrierten Beispieldatenquelle, die aus fiktiven Hoteldaten besteht, die von Microsoft gehostet werden. Der Assistent führt Sie durch die Erstellung eines No-Code-Suchindexes, damit Sie innerhalb weniger Minuten interessante Abfragen schreiben können.

Der Assistent erstellt mehrere Objekte in Ihrem Suchdienst – durchsuchbarer Index – aber auch eine Indexer- und Datenquellenverbindung für den automatisierten Datenabruf. Am Ende dieser Schnellstartanleitung überprüfen wir jedes Objekt.

Hinweis

Der Assistent zum Importieren von Daten enthält Optionen für OCR, Textübersetzung und andere KI-Anreicherungen, die in dieser Schnellstartanleitung nicht behandelt werden. Eine ähnliche exemplarische Vorgehensweise, die sich auf die KI-Anreicherung konzentriert, finden Sie in der Schnellstartanleitung: Erstellen eines Skillsets im Azure-Portal.

Voraussetzungen

Überprüfen des Speicherplatzes

Viele Kunden beginnen mit dem kostenlosen Dienst (Free). Der Free-Tarif ist auf drei Indizes, drei Datenquellen und drei Indexer beschränkt. Stellen Sie sicher, dass Sie über ausreichend Platz für zusätzliche Elemente verfügen, bevor Sie beginnen. In diesem Schnellstart wird jeweils eines dieser Objekte erstellt.

Überprüfen Sie die Registerkarte "Übersicht: > Verwendung " für den Dienst, um zu sehen, über wie viele Indizes, Indexer und Datenquellen Sie bereits verfügen.

Screenshot of the Overview page for an Azure AI Search service instance in the Azure portal, showing the number of indexes, indexers, and data sources.

Starten des Assistenten

  1. Melden Sie sich mit Ihrem Azure-Konto beim Azure Portal an und wechseln Sie zu Ihrem Azure AI Search-Dienst.

  2. Wählen Sie auf der Seite "Übersicht" die Option "Daten importieren" aus, um den Assistenten zu starten.

    Screenshot that shows how to open the Import data wizard in the Azure portal.

Erstellen und Laden eines Index

Erstellen und laden Sie in diesem Abschnitt einen Index in vier Schritten.

Mit einer Datenquelle verbinden

Der Assistent erstellt eine Datenquellenverbindung zu Beispieldaten, die von Microsoft in Azure Cosmos DB gehostet werden. Auf diese Beispieldaten wird über eine interne Verbindung zugegriffen. Sie benötigen kein eigenes Azure Cosmos DB-Konto oder Quelldateien, um diese Schnellstartanleitung auszuführen.

  1. Erweitern Sie auf Verbinden Ihren Daten die Dropdownliste "Datenquelle", und wählen Sie "Beispiele" aus.

  2. Wählen Sie in der Liste der integrierten Beispiele hotels-sample aus.

    Screenshot that shows how to select the hotels-sample data source in the Import data wizard.

  3. Wählen Sie Weiter: Kognitive Skills hinzufügen (Optional) aus, um den Vorgang fortzusetzen.

Überspringen der Konfiguration für kognitive Skills

Der Assistent zum Importieren von Daten unterstützt die Erstellung eines Skillsets und einer KI-Anreicherung in die Indizierung .

  1. Ignorieren Sie für diesen Schnellstart die Konfigurationsoptionen für die KI-Anreicherung auf der Registerkarte Kognitive Skills hinzufügen.

  2. Wählen Sie Springen zu: Zielindex anpassen aus, um fortzufahren.

    Screenshot that shows how to Skip to the Customize target index tab in the Import data wizard.

Tipp

Interessieren Sie sich für KI-Anreicherung? Probieren Sie diese Schnellstartanleitung aus: Erstellen eines Skillset in der Azure-Portal

Konfigurieren des Index

Der Assistent leitet ein Schema für den integrierten Hotels-Beispielindex ab. Führen Sie folgende Schritte aus, um den Index zu konfigurieren:

  1. Übernehmen Sie die vom System generierten Werte für die Felder Indexname (hotels-sample-index) und Schlüssel (HotelId).

  2. Übernehmen Sie die vom System generierten Werte für alle Feldattribute.

    Wichtig

    Wenn Sie den Assistenten erneut ausführen und eine vorhandene Datenquelle vom Typ „hotels-sample“ ausführen, wird der Index nicht mit Standardattributen konfiguriert. Sie müssen Attribute für künftige Importe manuell auswählen.

  3. Wählen Sie Weiter: Indexer erstellen aus, um den Vorgang fortzusetzen.

Screenshot that shows the generated index definition for the hotels-sample data source in the Import data wizard.

Der Index erfordert mindestens einen Indexnamen und eine Sammlung von Feldern. Ein Feld muss als Dokumentschlüssel gekennzeichnet sein, um die einzelnen Dokumente eindeutig zu identifizieren. Der Wert ist immer eine Zeichenfolge. Der Assistent sucht nach eindeutigen Zeichenfolgenfeldern und wählt einen für den Schlüssel aus.

Jedes Feld verfügt über einen Namen, einen Datentyp und Attribute, die die Verwendung des Felds im Suchindex steuern. Kontrollkästchen aktivieren oder deaktivieren die folgenden Attribute:

  • Abrufbar: In einer Abfrageantwort zurückgegebene Felder.
  • Filterbar: Felder, die einen Filterausdruck akzeptieren.
  • Sortierbar: Felder, die einen Orderbyausdruck akzeptieren.
  • Facetable: Felder, die in einer faceted Navigationsstruktur verwendet werden.
  • Durchsuchbar: Felder, die in der Volltextsuche verwendet werden. Zeichenfolgen sind durchsuchbar. Numerische Felder und boolesche Felder werden häufig als „Nicht durchsuchbar“ markiert.

Zeichenfolgen werden durch Attribute als Abrufbar und Durchsuchbar gekennzeichnet. Ganze Zahlen werden durch Attribute als Abrufbar, Filterbar, Sortierbar und Facettenreich gekennzeichnet.

Attribute wirken sich auf den Speicher aus. Filterbare Felder verbrauchen zusätzlichen Speicher, aber abrufbar ist nicht. Weitere Informationen finden Sie unter Beispiel zur Veranschaulichung der Auswirkungen von Attributen und Suggestoren auf die Speicherung.

Wenn Sie AutoVervollständigen oder vorgeschlagene Abfragen benötigen, geben Sie Sprachanalyses oder Suggester an.

Konfigurieren und Ausführen des Indexers

Der letzte Schritt konfiguriert und führt den Indexer aus. Mit diesem Objekt wird ein ausführbarer Prozess definiert. Die Datenquelle, der Index und der Indexer werden in diesem Schritt erstellt.

  1. Übernehmen Sie den vom System generierten Wert für Indexername (hotels-sample-indexer).

  2. Verwenden Sie für diese Schnellstartanleitung die Standardoption, um den Indexer einmal sofort auszuführen. Die gehosteten Daten sind statisch, sodass keine Änderungsnachverfolgung aktiviert ist.

  3. Klicken Sie auf Senden, um den Indexer zu erstellen und gleichzeitig auszuführen.

    Screenshot that shows how to configure the indexer for the hotels-sample data source in the Import data wizard.

Überwachen des Indexersstatus

Sie können die Erstellung des Indexers oder indexes im Portal überwachen. Die Übersichtsseite des Diensts enthält Links zu den Ressourcen, die in Ihrem Azure KI Search-Dienst erstellt wurden.

  1. Wählen Sie auf der linken Seite die Option "Indexer" aus.

    Screenshot that shows the creation of the indexer in progress in the Azure portal.

    Es kann einige Minuten dauern, bis die Seitenergebnisse im Azure-Portal aktualisiert werden. Der neu erstellte Indexer sollte in der Liste mit dem Status In Bearbeitung oder Erfolg angezeigt werden. Die Liste zeigt auch die Anzahl der indizierten Dokumente an.

Überprüfen der Suchindexergebnisse

  1. Wählen Sie auf der linken Seite "Indizes" aus.

  2. Wählen Sie den Hotels-Beispielindex aus.

    Warten Sie, bis die Azure-Portalseite aktualisiert wurde. Der Index sollte mit der Dokumentanzahl und der Speichergröße angezeigt werden.

    Screenshot of the Indexes list on the Azure AI Search service dashboard in the Azure portal.

  3. Wählen Sie die Registerkarte "Felder " aus, um das Indexschema anzuzeigen.

    Überprüfen Sie, welche Felder gefiltert oder sortiert werden können, damit Sie wissen, welche Abfragen geschrieben werden sollen.

    Screenshot that shows the schema definition for an index in the Azure AI Search service in the Azure portal.

Hinzufügen oder Ändern von Feldern

Auf der Registerkarte "Felder " können Sie ein neues Feld mithilfe des Felds "Hinzufügen" mit einem Namen, einem unterstützten Datentyp und Zuschreibungen erstellen.

Das Ändern vorhandener Felder ist schwieriger. Vorhandene Felder weisen eine physische Darstellung im Index auf, sodass sie nicht geändert werden können, nicht einmal im Code. Um ein vorhandenes Feld grundlegend zu ändern, müssen Sie ein neues Feld erstellen, das das Original ersetzt. Andere Konstrukte, z. B. Bewertungsprofile und CORS-Optionen, können jederzeit einem Index hinzugefügt werden.

Nehmen Sie sich kurz Zeit, um die Optionen für die Indexdefinition anzuzeigen und sich damit vertraut zu machen, was Sie beim Entwerfen des Index bearbeiten können. Abgeblendete Optionen in der Feldliste geben Werte an, die nicht geändert oder gelöscht werden können.

Abfragen mit Suchexplorer

Sie verfügen jetzt über einen Suchindex, der mit dem Such-Explorer abgefragt werden kann. Der Such-Explorer sendet REST-Aufrufe, die der SEARCH POST REST-API entsprechen. Das Tool unterstützt einfache Abfragesyntax und die vollständige Lucene-Abfragesyntax.

  1. Geben Sie auf der Registerkarte "Such-Explorer " Text ein, nach dem gesucht werden soll.

    Screenshot that shows how to enter and run a query in the Search Explorer tool.

  2. Verwenden Sie die Minikarte , um schnell zu nichtvisiblen Bereichen der Ausgabe zu springen.

    Screenshot that shows long results for a query in the Search Explorer tool and the mini-map.

  3. Um die Syntax anzugeben, wechseln Sie zur JSON-Ansicht.

    Screenshot of the JSON view selector.

Beispielabfragen für Hotelbeispielindex

In den folgenden Beispielen wird die JSON-Ansicht und die REST-API-Version 2023-11-01 vorausgesetzt.

Filterbeispiele

Parkplätze, Tags, Renovierungsdatum, Bewertung und Ort sind filterbar.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

Boolesche Filter gehen standardmäßig von "true" aus.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

Die Geospatialsuche ist filterbasiert. Die geo.distance Funktion filtert alle Ergebnisse nach Positionsdaten basierend auf den angegebenen Location und geography'POINT Koordinaten. Die Abfrage sucht nach Hotels, die sich im Umkreis von 5 Kilometern der Breiten- und Längengradkoordinaten -122.12 47.67 befinden, d. h. „Redmond, Washington, USA“. Die Abfrage zeigt die Gesamtanzahl der Übereinstimmungen &$count=true mit den Hotelnamen und Adressen an.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

Vollständige Lucene-Syntaxbeispiele

Die Standardsyntax ist eine einfache Syntax. Wenn Sie jedoch Fuzzysuch- oder Ausdrucksausdruck oder reguläre Ausdrücke verwenden möchten, geben Sie die vollständige Syntax an.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

Für falsch geschriebene Wörter wie seatle für Seattle werden bei einer herkömmlichen Suche standardmäßig keine Treffer zurückgegeben. Der Parameter queryType=full ruft den vollständigen Lucene-Abfrageparser auf, der den Tildeoperanden (~) unterstützt. Wenn diese Parameter vorhanden sind, führt die Abfrage eine Fuzzysuche für das angegebene Schlüsselwort aus. Die Abfrage sucht nach übereinstimmenden Ergebnissen sowie nach Ergebnissen, die dem Schlüsselwort ähneln, aber nicht genau mit ihm übereinstimmen.

Nehmen Sie sich kurz Zeit, um einige dieser Beispielabfragen für Ihren Index auszuprobieren. Weitere Informationen zu Abfragen finden Sie unter Abfragen in Azure AI Search.

Bereinigen von Ressourcen

Wenn Sie in Ihrem eigenen Abonnement arbeiten, sollten Sie sich am Ende eines Projekts überlegen, ob Sie die erstellten Ressourcen noch benötigen. Ressourcen, die weiterhin ausgeführt werden, können Sie Geld kosten. Sie können einzelne Ressourcen oder die gesamte Ressourcengruppe mit allen darin enthaltenen Ressourcen löschen.

Ressourcen für Ihren Dienst können im Azure-Portal unter Alle Ressourcen oder Ressourcengruppen im linken Bereich gesucht und verwaltet werden.

Denken Sie bei Verwendung eines kostenlosen Diensts an die Beschränkung auf maximal drei Indizes, Indexer und Datenquellen. Sie können einzelne Elemente über das Azure-Portal löschen, um unter dem Grenzwert zu bleiben.

Nächste Schritte

Probieren Sie einen Azure-Portal-Assistenten aus, um eine sofort einsatzbereite Web-App zu erstellen, die in einem Browser ausgeführt wird. Verwenden Sie diesen Assistenten mit dem in diesem Schnellstart erstellten kleinen Index oder eins der integrierten Beispieldatasets für umfassendere Suchfunktionen.