Erstellen eines Azure AI Search-Diensts im Portal
Die Azure KI-Suche ist eine Lösung für die Suche nach Vektor- und Volltextinformationen für Unternehmen und für traditionelle und generative KI-Szenarien.
Wenn Sie ein Azure-Abonnement einschließlich eines Testabonnements haben, können Sie einen Suchdienst kostenlos erstellen. Kostenlose Dienste haben Einschränkungen, aber Sie können alle Schnellstarts und die meisten Lernprogramme abschließen, mit Ausnahme derjenigen mit semantischer Rangfolge (es erfordert einen abrechnenden Dienst).
Die einfachste Möglichkeit zum Erstellen des Suchdiensts ist die Nutzung des Azure-Portals, wie in diesem Artikel beschrieben wird. Sie können aber auch Azure PowerShell, die Azure-Befehlszeilenschnittstelle, die Verwaltungs-REST-API, eine Azure Resource Manager-Dienstvorlage, eine Bicep-Datei oder Terraform verwenden.
Vorbereitung
Die folgenden Diensteigenschaften sind für die Lebensdauer des Diensts festgelegt. Berücksichtigen Sie ihre Nutzungsauswirkungen, während Sie jede Eigenschaft ausfüllen:
- Der Dienstname wird Teil des URL-Endpunkts. (Hilfreiche Informationen zu Dienstnamen finden Sie unter Benennen des Diensts.)
- Die Dienstebene (kostenlos, Basis, Standard usw.) bestimmt die zugrunde liegende physische Hardware und die Abrechnung. Einige Features sind auf eine Dienstebene beschränkt.
- Die Dienstregion kann die Verfügbarkeit bestimmter Szenarien und höherer Speicherbegrenzungen bestimmen. Wenn Sie Verfügbarkeitszonen oder KI-Anreicherung oder mehr Speicher benötigen, erstellen Sie die Ressource in einer Region, die das Feature bietet.
Abonnieren (kostenlos oder kostenpflichtig)
Um kostenlos zu suchen, eröffnen Sie ein kostenloses Azure-Konto, und erstellen Sie dann Ihren Suchdienst, indem Sie die Dienstebene Kostenlos auswählen. Sie können einen kostenlosen Suchdienst pro Azure-Abonnement nutzen. Kostenlose Suchdienste sind für eine kurzfristige Tests des Produkts für Anwendungen vorgesehen, die nicht für die Produktion gedacht sind. Wenn Sie mit einer Produktionsanwendung fortfahren möchten, erstellen Sie einen neuen Suchdienst auf einer abrechnungsfähigen Ebene.
Alternativ können Sie kostenlose Gutschriften verwenden, um kostenpflichtige Azure-Dienste auszuprobieren. Mit diesem Ansatz können Sie Ihren Suchdienst bei Basic oder höher erstellen, um mehr Kapazität zu erhalten. Ihre Kreditkarte wird nur dann belastet, wenn Sie Ihre Einstellungen explizit ändern und mit der Berechnung von Gebühren einverstanden sind. Ein weiterer Ansatz besteht darin, Azure-Guthaben in einem Visual Studio-Abonnement zu aktivieren. Ein Visual Studio-Abonnement beinhaltet ein monatliches Guthaben, das Sie für zahlungspflichtige Azure-Dienste verwenden können.
Die bezahlte (oder abrechenbare) Suche findet statt, wenn Sie beim Erstellen der Ressource einen kostenpflichtigen Tarif (Basic oder höher) in einem abrechenbaren Azure-Abonnement auswählen.
Suchen des Azure AI Search-Angebots
Melden Sie sich beim Azure-Portal an.
Wählen Sie in der linken oberen Ecke Ressource erstellen aus.
Verwenden Sie die Suchleiste, um „Azure KI-Suche“ zu finden.
Wählen Sie ein Abonnement.
Falls Sie über mehrere Abonnements verfügen, wählen Sie eines für Ihren Suchdienst aus. Wenn Sie kundenseitig verwaltete Verschlüsselung implementieren oder andere Features verwenden, die von verwalteten Dienstidentitäten für den externen Datenzugriff abhängen, wählen Sie dasselbe Abonnement aus, das auch für Azure Key Vault oder andere Dienste verwendet wird, für die verwaltete Identitäten genutzt werden.
Festlegen einer Ressourcengruppe
Eine Ressourcengruppe ist ein Container, der verwandte Ressourcen für Ihre Azure-Lösung enthält. Es ist nützlich, Ressourcen mit der gleichen Lösung zu konsolidieren, Kosten zu überwachen und das Erstellungsdatum Ihres Suchdiensts zu überprüfen.
Im weiteren Verlauf können Sie aktuelle und prognostizierte Kosten insgesamt nachverfolgen oder Gebühren für einzelne Ressourcen anzeigen. Im folgenden Screenshot wird die Art der Kosteninformationen dargestellt, die Sie erwarten können, wenn Sie mehrere Ressourcen in einer Gruppe kombinieren.
Tipp
Ressourcengruppen vereinfachen die Bereinigung, da beim Löschen einer Ressourcengruppe alles darin gelöscht wird.
Benennen des Diensts
Geben Sie in den Instanzdetails im Feld URL einen Dienstnamen ein. Der Name ist Teil des URL-Endpunkts, für den API-Aufrufe ausgegeben werden: https://your-service-name.search.windows.net
. Wenn der Endpunkt beispielsweise https://myservice.search.windows.net
sein soll, geben Sie myservice
ein.
Anforderungen an Dienstnamen:
- Er muss innerhalb des Namespaces „search.windows.net“ eindeutig sein
- Länge zwischen 2 und 60 Zeichen
- Bestehen aus Kleinbuchstaben, Ziffern oder Bindestrichen (
-
) - Die ersten beiden Zeichen und das letzte einzelne Zeichen dürfen keine Bindestriche sein
- Verwenden Sie an keiner Stelle aufeinanderfolgende Bindestriche
Tipp
Wenn Sie über mehrere Suchdienste verfügen, ist es hilfreich, die Region (oder den Standort) in den Dienstnamen als Benennungskonvention einzuschließen. Ein Name wie mysearchservice-westus
kann Ihnen eine Reise zur Eigenschaftenseite speichern, wenn Sie entscheiden, wie Ressourcen kombiniert oder angefügt werden sollen.
Wählen Sie eine Region aus.
Wichtig
Aufgrund der hohen Nachfrage ist Azure KI-Suche derzeit für neue Instanzen in Westeuropa nicht verfügbar. Wenn Sie nicht sofort semantische Rangierer oder Skillsets benötigen, wählen Sie Schweden Central aus, da sie die meisten Rechenzentrumskapazitäten hat. Andernfalls ist Nordeuropa eine weitere Option.
Azure AI Search ist in den meisten Regionen verfügbar, wie auf der Seite Verfügbare Produkte nach Region dokumentiert.
Es wird dringend empfohlen, die folgenden Regionen zu verwenden, da sie mehr Speicher pro Partition, drei bis sieben mal mehr je nach Stufe, mit demselben Abrechnungssatz bereitstellen. Zusätzliche Kapazität gilt für Suchdienste, die nach bestimmten Daten erstellt wurden.
Rollout im Mai 2024
Land / Region | Regionen, die zusätzliche Kapazität pro Partition bereitstellen |
---|---|
USA | USA, Osten 2 EUAP/PPE |
Südafrika | Südafrika, Norden |
Deutschland | Deutschland, Norden, Deutschland, Westen-Mitte |
Azure Government | Texas, Arizona, Virginia |
Rollout im April 2024
Land / Region | Regionen, die zusätzliche Kapazität pro Partition bereitstellen |
---|---|
USA | USA, Osten, USA, Osten 2,USA, Mitte, USA, Norden-Mitte, USA, Süden-Mitte, USA, Westen, USA, Westen 2, USA, Westen 3USA, Westen-Mitte |
Vereinigtes Königreich | Vereinigtes Königreich, Süden, Vereinigtes Königreich, Westen |
Vereinigte Arabische Emirate | VAE, Norden |
Schweiz | Schweiz, Westen |
Schweden | Schweden, Mitte |
Südafrika | Südafrika, Norden |
Polen | Polen, Mitte |
Norwegen | Norwegen, Osten |
Korea | Südkorea, Mitte, Südkorea, Süden |
Japan | Japan, Osten, Japan, Westen |
Italien | Italien, Norden |
Indien | Indien, Mitte, Jio Indien, Westen |
Frankreich | Frankreich, Mitte |
Europa | Europa, Norden |
Kanada | Kanada, Mitte, Kanada, Osten |
Brasilien | Brasilien, Süden |
Asien-Pazifik | Asien, Osten, Asien, Südosten |
Australien | Australien, Osten, Australien, Südosten |
Wenn Sie mehrere Azure-Dienste nutzen, können Sie die Gebühren für die Bandbreite minimieren oder ganz abschaffen, indem Sie alle Dienste in dieselbe Region legen. Es gibt keine Gebühren für den Datenaustausch zwischen Diensten derselben Region.
Zwei wichtige Ausnahmen könnten die Bereitstellung von Azure-Diensten in separaten Regionen rechtfertigen:
Ausgehende Verbindungen von AI Search zu Azure Storage. Möglicherweise sollten Sie Suche und Speicher in unterschiedlichen Regionen platzieren, wenn Sie eine Firewall aktivieren.
Zur Erfüllung von BCDR-Anforderungen (Business Continuity & Disaster Recovery) müssen Sie mehrere Suchdienste in Regionspaaren erstellen. Wenn Sie beispielsweise in Nordamerika tätig sind, könnten Sie für jeden Suchdienst „USA Ost“ und „USA West“ oder „USA Zentral Nord“ und „USA Zentral Süd“ auswählen.
Einige Features unterliegen der regionalen Verfügbarkeit:
- Verfügbarkeitszonen
- Azure-Rollen für Vorgänge auf Datenebene (nur in der öffentlichen Azure-Cloud)
- Semantischer Rangfolgergemäß den nach Regionsseite verfügbaren Produkten.
- Die KI-Anreicherung erfordert, dass Sich Azure AI-Dienste in derselben physischen Region befinden wie Azure AI Search. Es gibt nur wenige Regionen, die nicht beides bereitstellen.
Sind beide Funktionen in einer Region verfügbar, sind auf der Seite Verfügbare Produkte nach Region zwei Häkchen angegeben. Ist die Kombination nicht verfügbar, fehlt ein Häkchen. Das Zeitsymbol zeigt eine zukünftige Verfügbarkeit an.
Wählen Sie eine Ebene aus:
Azure AI Search wird derzeit in mehreren Tarifstufen angeboten: Kostenlos, Basis, Standard oder Speicheroptimiert. Jeder Tarif verfügt über eigene Kapazitäten und Grenzwerte. Es gibt auch mehrere Features, die stufenabhängigsind.
Für Produktionsworkloads werden in der Regel die Tarife „Basic“ und „Standard“ ausgewählt. Die meisten Kunden beginnen jedoch mit einem kostenlosen Dienst. Die wichtigsten Unterschiede zwischen den Tarifen sind Partitionsgröße und Geschwindigkeit sowie Grenzwerte bei der Anzahl von Objekten, die Sie erstellen können.
Suchdienste, die nach dem 3. April 2024 erstellt wurden, weisen größere Partitionen und höhere Vektorkontingente auf.
Denken Sie daran, dass ein Tarif nicht mehr geändert werden kann, nachdem der Dienst erstellt wurde. Wenn Sie einen höheren oder niedrigeren Tarif benötigen, müssen Sie den Dienst neu erstellen.
Erstellen des Diensts
Nachdem Sie die erforderlichen Informationen angegeben haben, erstellen Sie den Dienst.
Ihr Dienst wird innerhalb weniger Minuten bereitgestellt. Sie können den Fortschritt über Azure-Benachrichtigungen überwachen. Heften Sie den Dienst ggf. an Ihr Dashboard an, um in Zukunft einfacher darauf zugreifen zu können.
Konfigurieren der Authentifizierung
Falls Sie nicht das Portal verwenden, müssen Sie den URL-Endpunkt und eine authentifizierte Verbindung angeben, um programmgesteuert auf Ihren neuen Dienst zugreifen zu können. Sie können eine oder beide der folgenden Optionen verwenden:
- Herstellen einer Verbindung mit der schlüsselbasierten Authentifizierung
- Herstellen einer Verbindung mittels Azure-Rollen
Beim Einrichten einer programmgesteuerten Verbindung benötigen Sie den Suchdienstendpunkt. Kopieren Sie rechts auf der Seite Übersicht den URL-Endpunkt.
Verwenden Sie die Seite Schlüssel, um Authentifizierungsoptionen festzulegen. Die meisten Schnellstarts und Lernprogramme verwenden API-Schlüssel zur Einfachheit, aber wenn Sie einen Dienst für Produktionsworkloads einrichten, erwägen Sie die Verwendung von Azure-Rollen. Sie können Schlüssel von dieser Seite kopieren.
Endpunkt und Schlüssel sind für portalbasierte Aufgaben nicht erforderlich. Das Portal ist bereits mit Ihrer Azure AI Search-Ressource mit Administratorrechten verknüpft. Für eine exemplarische Vorgehensweise mit einem Portal beginnen Sie mit der Schnellstartanleitung: Erstellen eines Azure AI Search-Index im Portal.
Skalieren des Diensts
Nach der Bereitstellung eines Suchdiensts können Sie ihn Ihren Anforderungen entsprechend skalieren. In einem abrechnungsfähigen Tarif können Sie den Dienst in zwei Dimensionen skalieren: Replikate und Partitionen. Für den kostenlosen Dienst ist die Skalierung nicht verfügbar, und Replikat- und Partitionskonfiguration wird nicht angeboten.
Partitionen ermöglichen Ihrem Dienst das Speichern und Durchsuchen weiterer Dokumente.
Replikate ermöglichen Ihrem Dienst, eine größere Menge von Suchabfragen zu verarbeiten.
Durch das Hinzufügen von Ressourcen wird Ihre monatliche Rechnung höher. Der Preisrechner veranschaulicht, wie das Hinzufügen von Ressourcen sich auf die Abrechnung auswirken kann. Denken Sie daran, dass Sie Ressourcen basierend auf der Last anpassen können. Beispielsweise können Sie Ressourcen erhöhen, um einen vollständigen anfänglichen Index zu erstellen. Später können Sie die Ressourcen auf eine Ebene verringern, die sich besser für die inkrementelle Indizierung eignet.
Wichtig
Ein Dienst benötigt 2 Replikate für schreibgeschützte SLAs und 3 Replikate für SLAs mit Lese-/Schreibzugriff.
- Wechseln Sie im Azure-Portal zur Seite Ihres Suchdiensts.
- Wählen Sie im linken Navigationsbereich die Optionen Einstellungen>Skalierung aus.
- Verwenden Sie den Schieberegler, um Ressourcen jedes Typs hinzuzufügen.
Wann ein zweiter Dienst hinzugefügt werden sollte
Die meisten Kund*innen verwenden nur einen Dienst, der auf einer Ebene bereitgestellt wird, die für die erwartete Last ausreicht. Ein Dienst kann mehrere Indizes hosten, die der Obergrenze der von Ihnen ausgewählten Ebene unterliegt, wobei jeder Index vom anderen isoliert ist. In Azure AI Search können Anforderungen nur an einen Index geleitet werden, was das versehentliche oder vorsätzliche Datenabrufrisiko von anderen Indizes im selben Dienst verringert.
Obwohl die meisten Kunden nur einen Dienst nutzen, kann die Dienstredundanz womöglich nötig sein, wenn die operativen Anforderungen Folgendes enthalten:
Business Continuity und Disaster Recovery (BCDR). Die Azure KI-Suche bietet kein sofortiges Failover bei einem Ausfall.
Mehrinstanzenfähige Architekturen rufen manchmal zwei oder mehr Dienste auf.
Für global bereitgestellte Anwendungen sind möglicherweise Suchdienste in jeder geografischen Region erforderlich, um die Latenz zu minimieren.
Hinweis
In Azure AI Search können Sie Index- und Abfragevorgänge nicht trennen. Deshalb sollten Sie auch nie mehrere Dienste für getrennte Workloads erstellen. Ein Index wird immer auf dem Dienst, in dem er erstellt wurde, abgefragt (Sie können keinen Index in einem Dienst erstellen und ihn in einen anderen kopieren).
Ein zweiter Dienst ist für Hochverfügbarkeit nicht erforderlich. Die Hochverfügbarkeit für Abfragen wird erreicht, wenn Sie zwei oder mehr Replikate im gleichen Dienst verwenden. Replikatupdates sind sequenziell. Das bedeutet, dass mindestens eines betriebsfähig ist, wenn ein Dienstupdate ausgeführt wird. Weitere Informationen zur Verfügbarkeit finden Sie unter Vereinbarungen zum Servicelevel.
Hinzufügen weiterer Dienste zu einem Abonnement
Die Azure KI-Suche schränkt die Anzahl der Suchdienste ein, die Sie anfänglich in einem Abonnement erstellen können. Wenn Sie ihren Höchstwert ausschöpfen, können Sie weitere Kontingente anfordern.
Sie müssen über Berechtigungenen für Besitzer oder Mitwirkende für das Abonnement verfügen, um das Kontingent anzufordern.
Das maximale Kontingent für eine bestimmte Kombination aus Ebene und Region sind zusätzliche 100 Suchdienste über dem Basiskontingent (was 106, 108 oder 116 bedeutet, abhängig von der Ebene). Übermitteln Sie für mehr als 100 ein Supportticket. Sie können das Kontingent für den „Free-Tarif“ nicht erhöhen.
Melden Sie sich beim Azure-Portal an, suchen Sie in Ihrem Dashboard nach „Kontingente“, und wählen Sie dann den Dienst Kontingente aus.
Wählen Sie auf der Übersichtsseite des Kontingents die Option Suchen aus.
Legen Sie Filter fest, damit Sie das vorhandene Kontingent für Suchdienste im aktuellen Abonnement überprüfen können. Es wird empfohlen, nach Verwendung zu filtern.
Suchen Sie die Region und die Ebene, die mehr Kontingent benötigt, und wählen Sie das Bleistiftsymbol Bearbeiten aus, um Ihre Anforderung zu beginnen.
Geben Sie unter Kontingentdetails den Speicherort, die Ebene und ein neues Limit für Ihr Abonnementkontingent an. Keiner der Werte kann leer sein. Der neue Grenzwert muss größer als der aktuelle Grenzwert und gleich oder niedriger als die Zahl in der Spalte für die automatisch genehmigte Kontingenterhöhung sein. Wenn der aktuelle Grenzwert beispielsweise 16 beträgt, kann der neue Grenzwert für „Basic“ in einer bestimmten Region zwischen 17 und 80 liegen.
Tarif Standardlimit Automatisch genehmigte Kontingenterhöhung Gesamtsumme Grundlegend 16 80 96 S1 16 30 46 S2 8 10 18 S3, S3HD 6 10 16 L1, L2 6 10 16 Senden Sie die Anforderung.
Überwachen Sie Benachrichtigungen im Azure-Portal auf Statusupdates für den neuen Grenzwert. Die meisten Anforderungen werden innerhalb von 24 Stunden genehmigt.
Nächste Schritte
Nach dem Bereitstellen eines Diensts können Sie im Portal mit dem Erstellen des ersten Index fortfahren.
Möchten Sie Ihre Cloudausgaben optimieren und somit Geld sparen?
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für