Číst v angličtině Upravit

Sdílet prostřednictvím


Nejčastější dotazy k umělé inteligenci pro startupy

Nejčastější dotazy k používání služeb Azure AI pro startupy

Začínáme

Jaký je nejlepší způsob, jak začít používat službu Azure OpenAI pro spuštění?

Podívejte se na kurz Generative AI pro začátečníky na GitHubu. Jedná se o sadu instrukcí 18 lekcí, která představuje všechny hlavní funkce Azure OpenAI a ukazuje, jak s nimi vytvářet aplikace.

Jak můžu rychle otestovat funkce Azure AI pomocí přístupu s nízkým nebo bez kódu?

Regionální dostupnost a rezidence dat

Ve kterých oblastech Azure je dostupná služba OpenAI?

Různé modely Azure OpenAI jsou omezené na různé oblasti. Úplný seznam najdete v tabulce dostupnosti modelu.

Jaký vliv má výběr oblasti na latenci a výkon služeb Azure OpenAI?

Dopad je minimální, pokud nepoužíváte funkci streamování. Latence vlastní odpovědi modelu má mnohem větší vliv na latenci než rozdíly v oblastech.

Volba použití vyhrazeného serveru Azure OpenAI vs. plánu průběžných plateb má také větší dopad na výkon.

Omezení rychlosti a správa prostředků

Jak zajistím, aby moje aplikace škálovala kvótu Azure OpenAI?

Informace o tom, jak fungují limity kvót a jak je spravovat, najdete v tématu Správa kvóty služby Azure OpenAI.

Jaké jsou limity sazeb pro službu Azure OpenAI a jak je můžu spravovat?

Pro zákazníky, kteří používají model s průběžným platbami (nejběžnější), najdete na stránce s kvótou služby Azure OpenAI. Zákazníci, kteří používají vyhrazený server Azure OpenAI, najdete v části kvót související příručky.

Návody zpracování omezení tokenů za minutu ve službě Azure OpenAI?

Zvažte kombinování několika nasazení Azure OpenAI v pokročilé architektuře, abyste vytvořili systém, který poskytuje více tokenů za minutu více uživatelům.

Kdy použít vyhrazený server Azure OpenAI (PTU) místo modelu průběžných plateb?

Pokud máte dobře definované a předvídatelné požadavky na propustnost, měli byste zvážit přechod z průběžných plateb na zřízenou propustnost. Obvykle se jedná o případ, kdy je aplikace připravená pro produkční prostředí nebo je už nasazená v produkčním prostředí a rozumí očekávanému provozu. To umožňuje uživatelům přesně předpovídat požadovanou kapacitu a vyhnout se neočekávané fakturaci.

Vyrovnávání zatížení a škálování

Návody spravovat vysoký provoz a zajistit, aby aplikace Azure OpenAI zůstala responzivní?

Vytvořte nástroj pro vyrovnávání zatížení pro vaši aplikaci.

Pokud používáte model průběžných plateb, podívejte se na ukázku vyrovnávání zatížení. Pokud používáte vyhrazený server Azure OpenAI, informace o vyrovnávání zatížení najdete v průvodci PTU.

Vývoj a testování

Návody nastavit vývojové prostředí pro testování aplikací Azure OpenAI?

Vytvořte online nasazení pomocí toku výzvy v Azure AI Studiu. Pak ho otestujte zadáním hodnot v editoru formulářů nebo editoru JSON.

Monitorování a metriky

Jak můžu sledovat a vyhodnocovat metriky využití aplikace AI?

Jaké nástroje můžu použít ke sledování výkonu koncových bodů Azure OpenAI?

Použijte funkci monitorování nástroje Azure OpenAI Studio. Poskytuje řídicí panely, které sledují metriky výkonu vašich modelů v průběhu času.

Produkční implementace a osvědčené postupy

Jaké jsou některé osvědčené postupy pro nasazení aplikací OpenAI v Azure do produkčního prostředí?

Můžete uvést příklady nebo případové studie úspěšných implementací služby Azure OpenAI?

Další informace najdete v microsoftu pro startupy.