Teilen über


Laden von Daten in einen Suchindex in Azure AI Search

In diesem Artikel wird erläutert, wie Sie Inhalte in einem vordefinierten Suchindex importieren, aktualisieren und verwalten. In Azure AI Search wird zunächst ein Suchindex erstellt, der Datenimport folgt in einem zweiten Schritt. Eine Ausnahme bilden der Assistent für den Datenimport und die Indexer-Pipelines, die einen Index in einem Arbeitsablauf erstellen und laden.

Ein Suchdienst importiert und indiziert Text und Vektoren in JSON, die in Volltextsuche, Vektorsuche, Hybridsuche und Knowledge Mining-Szenarien verwendet werden. Textinhalte können aus alphanumerischen Feldern in der externen Datenquelle, aus Metadaten, die in Suchszenarien nützlich sind, oder aus angereicherten Inhalten, die von einem Skillset erstellt wurden, bezogen werden (Skills können Textbeschreibungen aus Bildern und unstrukturierten Inhalten extrahieren oder ableiten). Vektorinhalte werden mithilfe eines externen Einbettungsmodells oder einer integrierten Vektorisierung (Vorschau)vektorisiert.

Nachdem die Daten indiziert wurden, werden die physischen Datenstrukturen des Indexes gesperrt. Einen Leitfaden dazu, was geändert werden kann und was nicht, finden Sie unter Löschen und Neuerstellen eines Indexes.

Die Indizierung ist kein Hintergrundprozess. Ein Suchdienst gleicht Indizierungs- und Abfrageworkloads aus. Wenn die Abfragewartezeit jedoch zu lang ist, können Sie entweder Kapazität hinzufügen oder Zeiträume mit geringer Abfrageaktivität zum Laden eines Indexes identifizieren.

Laden von Dokumenten

Ein Suchdienst akzeptiert JSON-Dokumente, die dem Indexschema entsprechen.

Sie können diese Dokumente selbst vorbereiten, aber wenn sich der Inhalt in einer unterstützten Datenquelle befindet, können Sie mit einem Indexer oder dem Assistenten für den Datenimport den Abruf der Dokumente, die JSON-Serialisierung und die Indizierung automatisieren.

Verwenden Sie im Azure-Portal die Assistenten zum Importieren von Daten, um Indizes in einem nahtlosen Workflow zu erstellen und zu laden. Wenn Sie einen vorhandenen Index laden möchten, wählen Sie einen alternativen Ansatz aus.

  1. Melden Sie sich mit Ihrem Azure-Konto beim Azure-Portal an.

  2. Suchen Sie Ihren Suchdienst, und klicken Sie auf der Übersichtsseite auf der Befehlsleiste auf Daten importieren oder Daten importieren und vektorisieren, um einen Suchindex zu erstellen und aufzufüllen. Sie können diesen Links folgen, um den Workflow zu überprüfen: Schnellstart: Erstellen eines Azure AI Search-Index und Schnellstart: Integrierte Vektorisierung (Vorschau).

    Screenshot des Befehls „Daten importieren“

Wenn Indexer bereits definiert sind, können Sie einen Indexer aus dem Azure-Portal zurücksetzen und ausführen, was hilfreich ist, wenn Sie Felder inkrementell hinzufügen. Beim Zurücksetzen wird der Indexer dazu gezwungen, neu zu beginnen. Dabei werden alle Felder aus allen Quelldokumenten übernommen.

Löschen verwaister Dokumente

Azure AI Search unterstützt Operationen auf Dokumentenebene, so dass Sie ein bestimmtes Dokument isoliert nachschlagen, aktualisieren und löschen können. Das folgende Beispiel zeigt den Löschvorgang eines Dokuments. In einem Suchdienst stehen Dokumente nicht in Zusammenhang, sodass das Löschen keine Auswirkungen auf den Rest des Indexes hat.

  1. Identifizieren Sie, welches Feld der Dokumentschlüssel ist. Im Portal können Sie die Felder der einzelnen Indizes anzeigen. Dokumentschlüssel sind Zeichenfolgenfelder und mit einem Schlüsselsymbol gekennzeichnet, damit sie leichter zu erkennen sind.

  2. Überprüfen Sie die Werte des Dokumentschlüsselfelds: search=*&$select=HotelId. Eine einfache Zeichenfolge ist unproblematisch, aber wenn der Index ein Base-64-codiertes Feld verwendet oder wenn Suchdokumente über eine parsingMode-Einstellung generiert wurden, arbeiten Sie möglicherweise mit Werten, mit denen Sie nicht vertraut sind.

  3. Suchen Sie das Dokument, um den Wert der Dokument-ID zu verifizieren und seinen Inhalt zu überprüfen, bevor Sie es löschen. Geben Sie den Schlüssel oder die Dokument-ID in der Anforderung an. Die folgenden Beispiele zeigen eine einfache Zeichenfolge für den Beispielindex „Hotels“ und eine Base-64-codierte Zeichenfolge für den Schlüssel „metadata_storage_path“ des Index „cog-search-demo“.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Löschen Sie das Dokument, um es aus dem Suchindex zu entfernen.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Siehe auch