Giriş
Microsoft Azure OpenAI hizmetleri, yapay zeka dağıtımınızda ihtiyacınız olan aktarım hızı miktarını belirtmenize olanak tanıyan sağlanan aktarım hızı birimleri (PTU) olarak da bilinen sağlanan dağıtımları içerir. Gereksinimlerinize göre herhangi bir Azure AI modelini dağıtmak için PTU'ları kullanabilirsiniz.
Örnek senaryo
Orta ölçekli bir perakende şirketi olan Contoso Retail, yaygın müşteri sorgularını yönetebilen, ürün önerileri sağlayabilen ve sipariş takibine yardımcı olan yapay zeka destekli bir sohbet botu uygulayarak müşteri desteğini geliştirmek istiyor. Contoso Retail, sohbet botunu yüksek oranda kullanılabilir olacak, düşük gecikme süresine sahip olacak ve maliyetleri etkili bir şekilde yönetirken öngörülebilir performans sağlayacak şekilde tasarlamak istiyor. Bu nedenlerden dolayı sohbet botları için temel altyapı olarak Azure OpenAI kullanmaya karar verdiler. Contoso Retail için Azure yöneticisi olarak çalışıyorsunuz. Azure OpenAI'de sohbet botu dağıtımı için kaynakları ayırmak için uygun bir çözüm önermek üzere görevlendirildiniz.
Ne yapacağız?
Bu modülde, Azure OpenAI Hizmeti dağıtımı için gereken kaynakları verimli bir şekilde ayırmayı ve kullanmayı öğreneceksiniz. Çeşitli Azure OpenAI dağıtım modellerini gözden geçirecek ve PTU'ların nasıl istenip dağıtılacağı hakkında bilgi edineceksiniz. Ayrıca kuruluşunuzun gereksinimlerine göre sağlanan uygun Azure OpenAI Hizmeti rezervasyonu seçmeyi ve satın almayı da öğreneceksiniz. Son olarak, sağlanan rezervasyonların nasıl yönetileceğini ve izleneceğini inceleyeceksiniz.
Ana hedef nedir?
Bu modülün sonunda Azure OpenAI Hizmetini PTU'larla tasarlayabilecek ve kullanabileceksiniz. Kuruluşunuz için uygun Azure OpenAI Tarafından Sağlanan rezervasyonu tanımlayabilecek ve sağlanan rezervasyonları dağıtma, izleme ve yönetme yordamlarını anlayabileceksiniz.