Delen via


Een servicelaag kiezen voor Azure AI Search

Een onderdeel van het maken van een zoekservice is het kiezen van een prijscategorie (of SKU) die is vastgezet voor de levensduur van de service. In de portal wordt de laag opgegeven op de pagina Prijscategorie selecteren wanneer u de service maakt. In PowerShell of Azure CLI wordt de laag opgegeven via de -Sku parameter.

De laag bepaalt:

  • Maximum aantal indexen en andere objecten dat is toegestaan op de service
  • Grootte en snelheid van partities (fysieke opslag)
  • Factureerbare tarieven als vaste maandelijkse kosten, maar ook incrementele kosten als u capaciteit toevoegt

In enkele gevallen bepaalt de laag die u kiest de beschikbaarheid van Premium-functies.

Factureringstarieven worden weergegeven op de pagina Prijscategorie selecteren in de portal. U kunt de pagina met prijzen voor regionale tarieven controleren en kosten plannen en beheren voor meer informatie over het factureringsmodel.

Notitie

Search-service gemaakt na 3 april 2024 hebben grotere partities en hogere vectorquota op bijna elke laag. Zie servicelimieten voor meer informatie.

Beschrijvingen van lagen

Lagen omvatten Gratis, Basic, Standard en Geoptimaliseerd voor opslag. Standard en Storage Optimized zijn beschikbaar met verschillende configuraties en capaciteiten. In de volgende schermopname van Azure Portal ziet u de beschikbare lagen, minus prijzen (die u kunt vinden in de portal en op de pagina met prijzen).

Grafiek met prijscategorieën

Gratis maakt een beperkte zoekservice voor kleinere projecten, zoals het uitvoeren van zelfstudies en codevoorbeelden. Intern worden systeembronnen gedeeld tussen meerdere abonnees. U kunt een gratis service niet schalen, aanzienlijke workloads uitvoeren en sommige Premium-functies zijn niet beschikbaar. U kunt slechts één gratis zoekservice per Azure-abonnement hebben. Als de service gedurende een langere periode inactief is, kan deze worden verwijderd om capaciteit vrij te maken, met name als de regio onder capaciteitsbeperkingen valt.

De meest gebruikte factureerbare lagen zijn:

  • Basic heeft de mogelijkheid om te voldoen aan de SLA met ondersteuning voor drie replica's.

  • Standard (S1, S2, S3) is de standaardinstelling. Het biedt u meer flexibiliteit bij het schalen voor workloads. U kunt zowel partities als replica's schalen. Met toegewezen resources onder uw beheer kunt u grotere projecten implementeren, prestaties optimaliseren en capaciteit verhogen.

Sommige lagen zijn ontworpen voor bepaalde soorten werk:

  • Standard 3 High Density (S3 HD) is een hostingmodus voor S3, waarbij de onderliggende hardware is geoptimaliseerd voor een groot aantal kleinere indexen en is bedoeld voor multitenancyscenario's. S3 HD heeft dezelfde kosten per eenheid als S3, maar de hardware is geoptimaliseerd voor snelle bestandsleesbewerkingen op een groot aantal kleinere indexen.

  • Voor opslag geoptimaliseerde lagen (L1, L2) bieden grotere opslagcapaciteit tegen een lagere prijs per TB dan de Standard-lagen. Deze lagen zijn ontworpen voor grote indexen die niet vaak veranderen. De primaire afweging is een hogere querylatentie, die u moet valideren voor uw specifieke toepassingsvereisten.

U vindt meer informatie over de verschillende lagen op de pagina met prijzen, in het artikel Servicelimieten in Azure AI Search en op de portalpagina wanneer u een service inricht.

Beschikbaarheid per regio per laag

De lijst met ondersteunde regio's bevat de locaties waar Azure AI Search wordt aangeboden.

Momenteel hebben verschillende regio's capaciteit voor specifieke lagen en kunnen ze niet worden gebruikt voor nieuwe zoekservices. Als u Azure Portal gebruikt om een zoekservice te maken, worden in de portal combinaties van regiolagen uitgesloten die niet beschikbaar zijn.

Regio Uitgeschakelde laag (SKU) vanwege overcapaciteit Voorgesteld alternatief
India - centraal S2, S3, S3HD, L1, L2 India - zuid
VS - oost 2 Basic, S1 Central US
VS - zuid-centraal Alle lagen Central US
VS (overheid) - Virginia Alle lagen US Gov - Arizona
Europa -west Alle lagen Zweden - centraal/Europa - noord
US - west 3 Basic, S1 Central US

Beschikbaarheid van functies per laag

De meeste functies zijn beschikbaar op alle lagen, inclusief de gratis laag. In enkele gevallen bepaalt de laag de beschikbaarheid van een functie. In de volgende tabel worden de beperkingen beschreven.

Functie Overwegingen voor lagen
indexeerfuncties Indexeerfuncties zijn niet beschikbaar in S3 HD. Indexeerfuncties hebben meer beperkingen voor de gratis laag.
configuratieparameter voor indexeerfunctie executionEnvironment Voor de mogelijkheid om alle verwerking van indexeerfuncties vast te maken aan alleen de zoekclusters die aan uw zoekservice zijn toegewezen, is S2 en hoger vereist.
AI-verrijking Wordt uitgevoerd op de gratis laag, maar niet aanbevolen.
Beheerde of vertrouwde identiteiten voor uitgaande toegang (indexeerfunctie) Niet beschikbaar in de gratis laag.
Door de klant beheerde versleutelingssleutels Niet beschikbaar in de gratis laag.
IP-firewalltoegang Niet beschikbaar in de gratis laag.
Privé-eindpunt (integratie met Azure Private Link) Voor binnenkomende verbindingen met een zoekservice, niet beschikbaar in de gratis laag.
Voor uitgaande verbindingen door indexeerfuncties naar andere Azure-resources, niet beschikbaar op gratis of S3 HD.
Voor indexeerfuncties die gebruikmaken van vaardighedensets die niet beschikbaar zijn op Free, Basic, S1 of S3 HD.
Beschikbaarheidszones Niet beschikbaar in de laag Gratis of Basic.
Semantische rangschikking Niet beschikbaar in de gratis laag.

Resource-intensieve functies werken mogelijk niet goed, tenzij u deze voldoende capaciteit geeft. Ai-verrijking heeft bijvoorbeeld langlopende vaardigheden die een time-out hebben op een gratis service, tenzij de gegevensset klein is.

Bovengrens

Lagen bepalen de maximale opslag van de service zelf, plus het maximum aantal indexen, indexeerfuncties, gegevensbronnen, vaardighedensets en synoniemenkaarten die u kunt maken. Zie Servicelimieten in Azure AI Search voor een volledige onderbreking van alle limieten.

Partitiegrootte en snelheid

Prijscategorie omvat details over opslag per partitie die varieert van 15 GB voor Basic, tot 2 TB voor opslag geoptimaliseerde lagen (L2). Andere hardwarekenmerken, zoals de snelheid van bewerkingen, latentie en overdrachtssnelheden, worden niet gepubliceerd, maar lagen die zijn ontworpen voor specifieke oplossingsarchitecturen zijn gebouwd op hardware die de functies bevat om deze scenario's te ondersteunen. Zie Capaciteit en betrouwbaarheid schatten en beheren in Azure AI Search voor meer informatie over partities.

Notitie

Vanaf april 2024 werden hogere capaciteitspartities beschikbaar in geselecteerde regio's. Een tweede golf van hogere capaciteitspartities die zijn uitgebracht in mei 2024. Als u een oudere zoekservice gebruikt, kunt u overwegen om een nieuwe zoekservice te maken om te profiteren van meer capaciteit met hetzelfde factureringstarief. Zie Servicelimieten voor meer informatie. Zie De aanmaakdatum van de service controleren om de leeftijd van uw zoekservice te controleren.

Factureringstarieven

Lagen hebben verschillende factureringstarieven, met hogere tarieven voor lagen die worden uitgevoerd op duurdere hardware of duurdere functies bieden. Het factureringstarief voor lagen vindt u op de Pagina's met Prijzen van Azure voor Azure AI Search.

Zodra u een service hebt gemaakt, wordt het factureringstarief zowel vaste kosten voor het uitvoeren van de service rond de klok als u ervoor kiest om meer capaciteit toe te voegen.

Search-service worden rekenresources toegewezen in de vorm van partities (voor opslag) en replica's (exemplaren van de query-engine). In eerste instantie wordt er een service gemaakt met een van beide, en het factureringstarief is inclusief beide resources. Als u echter capaciteit schaalt, gaan de kosten omhoog of omlaag in stappen van het factureerbare tarief.

In het volgende voorbeeld ziet u een afbeelding. Stel dat u een hypothetisch factureringstarief van $ 100 per maand hebt. Als u de zoekservice op de oorspronkelijke capaciteit van één partitie en één replica houdt, is $ 100 wat u kunt verwachten aan het einde van de maand te betalen. Als u echter nog twee replica's toevoegt om hoge beschikbaarheid te bereiken, wordt de maandelijkse factuur verhoogd tot $ 300 ($ 100 voor het eerste replicapartitiepaar, gevolgd door $ 200 voor de twee replica's).

Dit factureringsmodel is gebaseerd op het concept van het toepassen van het factureringstarief op het aantal zoekeenheden (SU) dat wordt gebruikt door een zoekservice. Alle services worden in eerste instantie ingericht bij één SU, maar u kunt de SU's verhogen door partities of replica's toe te voegen om grotere workloads te verwerken. Zie Kosten van een zoekservice schatten voor meer informatie.

Laagupgrade of downgrade

Er is geen ingebouwde ondersteuning voor het upgraden of downgraden van lagen. Als u wilt overschakelen naar een andere laag, is de methode:

  • Maak een nieuwe zoekservice op de nieuwe laag.

  • Implementeer uw zoekinhoud in de nieuwe service. Volg deze controlelijst om ervoor te zorgen dat u alle inhoud hebt.

  • Verwijder de oude zoekservice zodra u zeker weet dat deze niet meer nodig is.

Voor grote indexen die u niet helemaal opnieuw wilt bouwen, kunt u overwegen om het back-up- en herstelvoorbeeld te gebruiken om ze te verplaatsen.

Volgende stappen

De beste manier om een prijscategorie te kiezen, is door te beginnen met een laag met de laagste kosten en vervolgens ervaring en testen te laten weten dat u de service wilt behouden of een nieuwe laag wilt maken in een hogere laag. Voor de volgende stappen raden we u aan een zoekservice te maken op een laag die geschikt is voor het testniveau dat u wilt uitvoeren. Bekijk vervolgens de volgende richtlijnen voor aanbevelingen voor het schatten van kosten en capaciteit.