Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Ein Teil der Erstellung eines Suchdiensts ist die Auswahl einer Preisstufe (oder SKU). Im Azure-Portal wird die Stufe auf der Seite Preisstufe auswählen angegeben, wenn Sie den Dienst erstellen. In PowerShell oder Azure CLI wird die Ebene über den -Sku Parameter angegeben.
Die Ebene bestimmt Folgendes:
- Maximale Anzahl von Indizes und anderen Objekten, die für den Dienst zulässig sind.
- Größe und Geschwindigkeit von Partitionen (physischer Speicher).
- Abrechnungsfähiger Satz als fixe monatliche Kosten sowie inkrementelle Kosten, wenn Sie Kapazität hinzufügen.
- Arbeitsauslastungsmerkmale. Einige Ebenen sind für bestimmte Workloads optimiert.
In einigen Fällen bestimmt der von Ihnen gewählte Tarif die Verfügbarkeit von Premium-Features.
Die Abrechnungsraten werden auf der Seite Preisebene auswählen des Azure-Portals angezeigt. Sie können die Preisseite für regionale Tarife überprüfen und Planen und Kosten verwalten, um mehr über das Abrechnungsmodell zu erfahren.
Hinweis
Suchdienste, die nach dem 3. April 2024 erstellt wurden, weisen größere Partitionen und höhere Vektorkontingente auf fast jeder Ebene auf. Weitere Informationen finden Sie unter Diensteinschränkungen.
Tarifbeschreibungen
Folgende Tarife sind verfügbar: Free, Basic, Standard und Speicheroptimiert. „Standard“ und „Speicheroptimiert“ werden mit verschiedenen Konfigurationen und Kapazitäten bereitgestellt. Im folgenden Screenshot aus dem Azure-Portal sind die verfügbaren Tarife ohne Preise aufgeführt (die Preise finden Sie im Azure-Portal und auf der Preisübersichtsseite).
Mit Free wird ein eingeschränkter Suchdienst für kleinere Projekte wie das Ausführen von Tutorials und Codebeispielen erstellt. Intern werden Systemressourcen von mehreren Abonnenten gemeinsam genutzt. Sie können keinen kostenlosen Dienst skalieren, erhebliche Workloads ausführen, und einige Premium-Features sind nicht verfügbar. Sie können nur einen kostenlosen Suchdienst pro Azure-Abonnement nutzen. Wenn der Dienst über einen längeren Zeitraum inaktiv ist, kann er gelöscht werden, um Kapazität freizugeben, insbesondere wenn die Region unter Kapazitätsengpässen leidet.
Zu den am häufigsten verwendeten abrechnungsfähigen Ebenen gehören:
Basic bietet die Möglichkeit, SLA mit seiner Unterstützung für drei Replikate zu erfüllen.
Standard (S1, S2, S3) ist der Standardwert. Er bietet Ihnen mehr Flexibilität bei der Skalierung von Workloads. Sie können sowohl Partitionen als auch Replikate skalieren. Wenn Sie dedizierte Ressourcen nutzen, können Sie größere Projekte bereitstellen, die Leistung optimieren und die Kapazität steigern.
Einige Ebenen sind für bestimmte Arten von Arbeiten konzipiert.
Standard 3 High Density (S3 HD) ist ein Hostingmodus für S3. Die zugrunde liegende Hardware ist für eine große Anzahl kleinerer Indizes optimiert und für Szenarien mit Mehrinstanzenfähigkeit konzipiert. „S3 HD“ hat denselben Preis pro Einheit wie „S3“, aber die Hardware ist für schnelle Datei-Lesevorgänge bei einer großen Anzahl kleinerer Indizes optimiert.
Datenspeicheroptimierte Tarife (L1, L2) bieten eine höhere Speicherkapazität zu einem niedrigeren Preis pro TB als die Standard-Tarife. Diese Tarife sind für große Indizes ausgelegt, die sich nicht sehr oft ändern. Der größte Nachteil ist die höhere Wartezeit. Diese müssen Sie bei Ihren spezifischen Anwendungsanforderungen berücksichtigen.
Weitere Informationen zu den verschiedenen Tarifen finden Sie auf der Preisübersichtsseite im Artikel Dienstgrenzwerte in Azure KI-Suche und auf der Azure-Portalseite beim Bereitstellen eines Diensts.
Regionsverfügbarkeit nach Ebene
Die Regionsliste enthält die Standorte, an denen Azure AI Search angeboten wird. Einige Regionen verfügen möglicherweise über Kapazitätsbeschränkungen für bestimmte Ebenen, wodurch die Erstellung neuer Suchdienste auf diesen Ebenen verhindert wird. In der Liste werden Fußnoten verwendet, um eingeschränkte Bereiche und Ebenen anzugeben.
Wenn Sie einen Suchdienst im Azure-Portal erstellen, werden nicht verfügbare Kombinationen auf Regionsebene automatisch ausgeschlossen.
Funktionsverfügbarkeit pro Tarif
Die meisten Features sind auf allen Ebenen verfügbar, einschließlich der Stufe "Kostenlos". In einigen Fällen bestimmt die Dienstebene die Verfügbarkeit eines Features. In der folgenden Tabelle werden die Einschränkungen beschrieben.
| Merkmal | Überlegungen zur Ebene |
|---|---|
| Indexer | Indexer sind in S3 HD nicht verfügbar. Für Indexer gelten im Free-Tarif mehr Einschränkungen. |
Indexer-KonfigurationsparameterexecutionEnvironment |
Die Möglichkeit, alle Indizierungsverarbeitungen nur an die Suchcluster festzupinnen, die Ihrem Suchdienst zugeordnet sind, erfordert mindestens S2. |
| KI-Anreicherung | Wird im Free-Tarif ausgeführt, aber nicht empfohlen. |
| Verwaltete oder vertrauenswürdige Identitäten für den ausgehenden Zugriff (Indexer) | Im Free-Tarif nicht verfügbar. |
| Von Kunden verwaltete Verschlüsselungsschlüssel | Im Free-Tarif nicht verfügbar. |
| IP-Firewallzugriff | Im Free-Tarif nicht verfügbar. |
| Privater Endpunkt (Integration mit Azure Private Link) | Für eingehende Verbindungen zu einem Suchdienst, nicht im Free-Tarif verfügbar. Für ausgehende Verbindungen von Indexern zu anderen Azure-Ressourcen, nicht verfügbar im Tarif „Free“ oder „S3 HD“. Für Indexer, die Skillsets verwenden: nicht verfügbar im Tarif „Free“, „Basic“, „S1“ oder „S3 HD“. |
| Verfügbarkeitszonen | Im Free-Tarif nicht verfügbar. |
| Semantischer Sortierer | Im Free-Tarif nicht verfügbar. |
Ressourcenintensive Funktionen funktionieren möglicherweise nicht gut, wenn Sie ihnen nicht genügend Kapazität zuweisen. Beispielsweise umfasst die KI-Anreicherung Skills mit langer Laufzeit, die bei einem kostenlosen Dienst zu einem Timeout führen, sofern es sich nicht um ein kleines Dataset handelt.
Obergrenzen
Ebenen bestimmen den maximalen Speicher des Diensts selbst sowie die maximale Anzahl von Indizes, Indexern, Datenquellen, Skillsets und Synonymzuordnungen, die Sie erstellen können. Eine vollständige Aufschlüsselung aller Grenzwerte finden Sie unter Diensteinschränkungen in Azure AI Search.
Partitionsgröße und Geschwindigkeit
Die Preisgestaltung enthält Details über den Speicher pro Partition, der von 15 GB für die Basic-Stufe bis zu 2 TB für die Storage Optimized (L2)-Stufen reicht. Andere Hardwaremerkmale, wie z. B. die Geschwindigkeit von Vorgängen, die Latenz und die Übertragungsraten, werden nicht veröffentlicht, aber die für bestimmte Lösungsarchitekturen vorgesehenen Tarife basieren auf Hardware mit den Features zur Unterstützung dieser Szenarios. Weitere Informationen zu Partitionen finden Sie unter Schätzen und Verwalten von Kapazität und Zuverlässigkeit in Azure AI Search.
Hinweis
Partitionen mit höherer Kapazität wurden in ausgewählten Regionen im April 2024 verfügbar. Im Mai 2024 wurde eine zweite Welle höherer Kapazitätspartitionen veröffentlicht. Wenn Sie über einen älteren Suchdienst verfügen, können Sie Ihren Dienst möglicherweise aktualisieren , um mehr Kapazität mit dem gleichen Abrechnungssatz zu nutzen.
Abrechnungsraten
Stufen haben unterschiedliche Preissätze, wobei höhere Sätze für Stufen gelten, die auf teurerer Hardware ausgeführt werden oder teurere Funktionen anbieten. Die Abrechnungsrate pro Dienstebene finden Sie auf den Seiten zu Azure-Preisen für Azure AI Search.
Nachdem Sie einen Dienst erstellt haben, wird die Abrechnungsrate sowohl zu Fixkosten für die Ausführung des Diensts rund um die Uhr als auch zu inkrementellen Kosten, wenn Sie mehr Kapazität hinzufügen möchten.
Suchdiensten werden Computerressourcen in Form von Partitionen (für Speicher) und Replikaten (Instanzen der Abfrage-Engine) zugeordnet. Anfänglich wird ein Dienst mit jeweils einer der beiden Ressourcen erstellt, und die Abrechnungsrate ist in beiden Ressourcen enthalten. Wenn Sie jedoch die Kapazität skalieren, werden die Kosten in Inkrementen der abrechenbaren Rate erhöht oder gesenkt.
Dies wird im folgenden Beispiel veranschaulicht. Nehmen Sie eine hypothetische Abrechnungsrate von 100 € pro Monat an. Wenn Sie für den Suchdienst seine Anfangskapazität von einer Partition und einem Replikat beibehalten, ist 100 € der Betrag, den Sie am Monatsende erwartungsgemäß bezahlen werden. Wenn Sie aber zwei weitere Replikate hinzufügen, um Hochverfügbarkeit zu erreichen, erhöht sich die monatliche Rechnung auf 300 € (100 € für das erste Paar aus Replikat und Partition, gefolgt von 200 € für die zwei Replikate).
Dieses Abrechnungsmodell basiert auf dem Konzept einer Anwendung der Abrechnungsrate auf die Anzahl der Sucheinheiten (Search Units, SUs), die von einem Suchdienst verwendet werden. Alle Dienste werden zunächst in einer einzigen SU bereitgestellt. Sie können aber die Anzahl der SUs erhöhen, indem Sie entweder Partitionen oder Replikate zur Verarbeitung größerer Workloads hinzufügen. Weitere Informationen finden Sie unter Schätzen der Kosten für einen Suchdienst.
Ebenenänderungen
Hinweis
Vorhandene Suchdienste können zwischen den Ebenen "Basic" und "Standard" (S1, S2 und S3) wechseln. Ihre aktuelle Dienstkonfiguration darf die Grenzwerte der Zielebene nicht überschreiten, und Ihre Region kann keine Kapazitätsbeschränkungen auf der Zielebene aufweisen. Weitere Informationen finden Sie unter Ändern Ihres Preisniveaus.
So wechseln Sie zu einer anderen Ebene als die zuvor aufgeführten:
- Erstellen Sie einen Suchdienst auf der neuen Ebene.
- Stellen Sie Ihre Suchinhalte im neuen Dienst bereit. Befolgen Sie diese Checkliste , um sicherzustellen, dass Sie über alle Inhalte verfügen.
- Löschen Sie den alten Dienst, wenn Sie sicher sind, dass er nicht mehr benötigt wird.
Verwenden Sie für große Indizes, die Sie nicht von Grund auf neu erstellen möchten, eines der folgenden Sicherungs- und Wiederherstellungsbeispiele:
- Beispiel für Sicherung und Wiederherstellung (C#)
- Sicherungs- und Wiederherstellungsbeispiel (Python)
- Beispiel für Sicherung und Wiederherstellung für sehr große Indizes (Python)
Nächste Schritte
Die beste Möglichkeit, eine Preisstufe auszuwählen, besteht darin, mit der niedrigsten Kostenstufe zu beginnen und dann aufgrund von Erfahrungen und Testergebnissen Ihre Entscheidung zu treffen, ob Sie den Dienst beibehalten oder zu einer höheren Stufe wechseln möchten.
Für die nächsten Schritte empfehlen wir, einen Suchdienst auf einer Ebene zu erstellen, der die von Ihnen vorgeschlagene Teststufe erfüllen kann, und dann die folgenden Anleitungen zur Schätzung von Kosten und Kapazität überprüfen: