Delen via


Quota voor resources beheren en verhogen met Azure AI Studio

Belangrijk

Sommige van de functies die in dit artikel worden beschreven, zijn mogelijk alleen beschikbaar in de preview-versie. Deze preview wordt aangeboden zonder een service level agreement en we raden deze niet aan voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.

Quota biedt de flexibiliteit om de toewijzing van frequentielimieten actief te beheren voor de implementaties binnen uw abonnement. In dit artikel wordt het proces voor het beheren van quota voor uw virtuele Azure AI Studio-machines en Azure OpenAI-modellen beschreven.

In Azure wordt gebruikgemaakt van limieten en quota om budgetoverschrijdingen als gevolg van fraude te voorkomen, en om binnen de beperkingen van de Azure-capaciteit te blijven. Het is ook een goede manier om de kosten voor beheerders te beheren. Houd rekening met deze limieten wanneer u de schaal aanpast aan de vereisten die door productieworkloads worden gesteld.

In dit artikel krijgt u meer informatie over:

  • Standaardlimieten voor Azure-resources
  • Quota op azure AI Studio-hubniveau maken.
  • Uw quota en limieten weergeven
  • Quotum- en limietverhogingen aanvragen

Speciale overwegingen

Quota worden toegepast op elk abonnement in uw account. Als u meerdere abonnementen hebt, moet u een quotumverhoging aanvragen voor elk abonnement.

Een quotum is een tegoedlimiet voor Azure-resources, geen capaciteitsgarantie. Als u behoefte hebt aan grootschalige capaciteit, kunt u contact opnemen met Azure-ondersteuning om uw quotum te verhogen.

Notitie

Azure AI Studio Compute heeft een afzonderlijk quotum van het kernrekenquotum.

Standaardlimieten zijn afhankelijk van het type categorie van de aanbieding, zoals gratis proefversies, betalen per gebruik en per VM-serie, zoals Dv2, F, G, enz.

Azure AI Studio-quotum

De volgende acties in Azure AI Studio verbruiken quotum:

  • Een rekenproces maken.
  • Een vectorindex bouwen.
  • Open modellen implementeren vanuit de modelcatalogus.

Azure AI Studio Compute

Azure AI Studio Compute heeft een standaardquotumlimiet voor zowel het aantal kernen als het aantal unieke rekenresources dat per regio in een abonnement is toegestaan.

  • Het quotum voor het aantal kernen wordt gesplitst door elke VM-serie en cumulatieve totale kernen.
  • Het quotum voor het aantal unieke rekenresources per regio is gescheiden van het VM-kernquotum, omdat dit alleen van toepassing is op de beheerde rekenresources

Als u de limieten voor rekenkracht wilt verhogen, kunt u een quotumverhoging aanvragen in Azure AI Studio.

Beschikbare resources zijn onder andere:

  • Toegewezen kernen per regio hebben een standaardlimiet van 24 tot 300, afhankelijk van het type abonnementsaanbieding. U kunt het aantal toegewezen kernen per abonnement voor elke VM-familie verhogen. Gespecialiseerde VM-families, zoals NCv2, NCv3 of ND-serie, beginnen met een standaardwaarde van nul kernen. GPU's zijn ook standaard ingesteld op nul kernen.
  • De totale rekenlimiet per regio heeft een standaardlimiet van 500 per regio binnen een bepaald abonnement en kan worden verhoogd tot een maximumwaarde van 2500 per regio. Deze limiet wordt gedeeld tussen rekeninstanties en beheerde online-eindpuntimplementaties. Een rekenproces wordt beschouwd als een cluster met één knooppunt voor quotumdoeleinden. Als u de totale rekenlimiet wilt verhogen, opent u een onlineaanvraag voor klantenondersteuning.

Wanneer u de ondersteuningsaanvraag opent om de totale rekenlimiet te verhogen, geeft u de volgende informatie op:

  1. Selecteer Technisch voor het probleemtype.

  2. Selecteer het abonnement waarvoor u het quotum wilt verhogen.

  3. Selecteer Machine Learning als het servicetype.

  4. Selecteer de resource waarvoor u het quotum wilt verhogen.

  5. Voer in het veld Samenvatting 'Totale rekenlimieten verhogen' in

  6. Selecteer Rekenproces het probleemtype en quotum als het subtype van het probleem.

    Schermopname van de pagina voor het verzenden van rekenquotumaanvragen in Azure Portal.

  7. Selecteer Volgende.

  8. Geef op de pagina Aanvullende details de abonnements-id, regio, nieuwe limiet op (tussen 500 en 2500) en zakelijke redenen om de totale rekenlimieten voor de regio te verhogen.

  9. Selecteer Maken om het ticket voor de ondersteuningsaanvraag in te dienen.

Gedeeld quotum voor Azure AI Studio

Azure AI Studio biedt een groep gedeelde quota die beschikbaar is voor verschillende gebruikers in verschillende regio's om gelijktijdig te gebruiken. Afhankelijk van de beschikbaarheid hebben gebruikers tijdelijk toegang tot het quotum van de gedeelde pool en kunnen ze het quotum gebruiken om gedurende een beperkte periode tests uit te voeren. De specifieke tijdsduur is afhankelijk van de use-case. Door tijdelijk quotum uit de quotumgroep te gebruiken, hoeft u geen ondersteuningsticket meer in te dienen voor een verhoging van het quotum op korte termijn of te wachten totdat uw quotumaanvraag is goedgekeurd voordat u verder kunt gaan met uw workload.

Het gebruik van de gedeelde quotumgroep is beschikbaar voor het testen van deductie voor Llama-2, Phi, Nemotron, Mistral, Dolly en Deci-DeciLM-modellen uit de modelcatalogus. U moet het gedeelde quotum alleen gebruiken voor het maken van tijdelijke testeindpunten, niet voor productie-eindpunten. Voor eindpunten in productie moet u een toegewezen quotum aanvragen. Facturering voor gedeeld quotum is gebaseerd op gebruik, net zoals facturering voor toegewezen virtuele-machinefamilies.

Container Instances

Zie Container Instances-limieten voor meer informatie.

Storage

Azure Storage heeft een limiet van 250 opslagaccounts per regio, per abonnement. Deze limiet omvat zowel Standard- als Premium-opslagaccounts.

Quota weergeven en aanvragen in Azure AI Studio

Gebruik quota voor het beheren van de toewijzing van rekendoelen tussen meerdere Azure AI Studio-hubs in hetzelfde abonnement.

Standaard delen alle hubs hetzelfde quotum als het quotum op abonnementsniveau voor VM-families. U kunt echter een maximumquotum instellen voor afzonderlijke VM-families voor gedetailleerdere kostenbeheer en -governance op hubs in een abonnement. Met quota voor afzonderlijke VM-families kunt u capaciteit delen en problemen met resourceconflicten voorkomen.

  1. Ga in Azure AI Studio naar de startpagina en selecteer Quota.

  2. Selecteer het tabblad Azure ML om het quotum voor de VM-families weer te geven. Het quotum wordt weergegeven op abonnementsniveau in de geselecteerde Azure-regio. Als u meer quotum wilt aanvragen, selecteert u de VM-familie en selecteert u vervolgens Quotum aanvragen.

    Schermopname van de pagina voor het weergeven en aanvragen van quota voor VM-families in Azure AI Studio.

Volgende stappen