Vanliga frågor om AI för nystartade företag

Vanliga frågor och svar om hur du använder Azure AI services för nystartade företag.

Komma igång

Vilket är det bästa sättet att komma igång med Azure OpenAI Service för min start?

Kolla in Generativ AI för nybörjare kurs på GitHub. Det är en instruktionsuppsättning på 18 lektioner som introducerar alla de viktigaste Azure OpenAI-funktioner och visar hur du skapar program med dem.

Hur kan jag testa Azure AI-funktioner snabbt med en metod med låg/ingen kod?

Använd Azure AI Foundry-portalen för att testa en mängd olika AI-funktioner, inklusive distribution Azure OpenAI-modeller och tillämpa innehåll modereringstjänster.

Regional tillgänglighet och datahemvist

I vilka Azure regioner är OpenAI-tjänsten tillgänglig?

Olika Azure OpenAI-modeller är begränsade till olika regioner. En fullständig lista finns i modelltillgänglighetstabellen .

Hur påverkar valet av region svarstid och prestanda för Azure OpenAI-tjänster?

Effekten är minimal, såvida du inte använder strömningsfunktionen. Svarstiden för modellens eget svar har en mycket större effekt på svarstiden än regionskillnader.

Valet att använda en dedikerad Azure OpenAI-server jämfört med betala per användning-plan har också en större inverkan på performance.

Hastighetsbegränsningar och resurshantering

Hur kan jag se till att mitt program kan skala sin Azure OpenAI-kvot?

Se Hantera Azure OpenAI Service kvot för att förstå hur kvotgränser fungerar och hur du hanterar dem.

Vilka är hastighetsgränserna för Azure OpenAI Service och hur kan jag hantera dem?

För kunder som använder modellen betala per användning (vanligast) kan du läsa sidan Hantera Azure OpenAI Service kvot. För kunder som använder en dedikerad Azure OpenAI-server kan du läsa avsnittet quota i den relaterade guiden.

Hur hanterar jag begränsningar för token per minut i Azure OpenAI Service?

Överväg att kombinera flera Azure OpenAI-distributioner i en avancerad arkitektur för att skapa ett system som levererar fler token per minut till fler användare.

När ska jag använda en dedikerad Azure OpenAI-server (PTU) i stället för modellen betala per användning?

Du bör överväga att byta från betala per användning till förutbestämd kapacitet när du har klart definierade, förutsägbara dataflödeskrav. Detta är vanligtvis fallet när programmet är redo för produktion eller redan har distribuerats i produktion och det finns en förståelse för den förväntade trafiken. Detta gör det möjligt för användare att korrekt prognostisera den kapacitet som krävs och undvika oväntad fakturering.

Lastbalansering och skalning

Hur hanterar jag hög trafik och ser till att mitt Azure OpenAI-program förblir responsivt?

Skapa en lastbalanserare för ditt program.

Titta på exemplet på lastbalansering, om du använder betalningsmodellen betala per användning. Om du använder en dedikerad Azure OpenAI-server kan du läsa guiden PTU för information om belastningsutjämning.

Utveckling och testning

Hur konfigurerar jag en utvecklingsmiljö för att testa Azure OpenAI-program?

Skapa en onlinedistribution med hjälp av prompt flow i Azure AI Foundry-portalen. Testa det sedan genom att ange värden i formulärredigeraren eller JSON-redigeraren.

Övervakning och mått

Hur kan jag spåra och utvärdera användningsstatistik för mitt AI-program?

Se guiden för utvärderings- och övervakningsmått för information om spårning av risk- och säkerhetsmått samt ett antal mått för svarskvalitet.

Vilka verktyg kan jag använda för att övervaka prestanda för mina Azure OpenAI-slutpunkter?

Använd funktionen monitoring i Azure OpenAI Studio. Det ger en instrumentpanel som spårar prestandamåtten för dina modeller över tid.

Produktionsimplementering och bästa praxis

Vilka är några metodtips för att distribuera AI-program för produktion på Azure?

Se referensarkitekturen för Baseline Microsoft Foundry-chat för bästa praxis för att implementera en chattapplikation.

Kan du ge exempel eller fallstudier av lyckade implementeringar av Azure OpenAI Service?

Mer information finns i Microsoft för nystartade företag.