Aracılığıyla paylaş


Genel bakış: Azure AI Studio ile modelleri, akışları ve web uygulamalarını dağıtma

Önemli

Bu makalede açıklanan özelliklerden bazıları yalnızca önizleme aşamasında kullanılabilir. Bu önizleme, hizmet düzeyi sözleşmesi olmadan sağlanır ve üretim iş yükleri için önerilmez. Bazı özellikler desteklenmiyor olabileceği gibi özellikleri sınırlandırılmış da olabilir. Daha fazla bilgi için bkz. Microsoft Azure Önizlemeleri Ek Kullanım Koşulları.

Azure Yapay Zeka Stüdyosu, büyük dil modelleri (LLM'ler), akışlar ve web uygulamalarını dağıtmayı destekler. LLM veya akış dağıtmak, bir web sitesinde, uygulamada veya diğer üretim ortamlarında kullanılabilmesini sağlar. Bu genellikle modeli bir sunucuda veya bulutta barındırmayı ve kullanıcıların modelle etkileşim kuracağı bir API ya da başka bir arabirim oluşturmayı içerir.

Bu etkileşimi genellikle "çıkarım" olarak adlandırılan bir modelle duyarsınız. Çıkarım, çıkış oluşturmak için modele yeni giriş verileri uygulama işlemidir. Çıkarım, çeşitli uygulamalarda kullanılabilir. Örneğin, bir kişinin gerçek zamanlı olarak yazacağı sözcükleri veya tümcecikleri otomatik olarak tamamlayan bir sohbet tamamlama modeli kullanılabilir. Sohbet modeli, "Seattle'da tek günlük bir ziyaret için bir seyahat rehberi oluşturabilir misiniz?" yanıtı oluşturmak için kullanılabilir. Olasılıklar sonsuzdur.

Modelleri dağıtma

İlk olarak şunu sorabilirsiniz:

  • "Hangi modelleri dağıtabilirim?" Azure AI Studio; Microsoft, Hugging Face ve Meta tarafından seçilen en popüler büyük dil ve görüntü işleme temeli modellerinden bazılarını dağıtmayı destekler.
  • "Nasıl yaparım? doğru modeli seçin?" Azure AI Studio, kullanım örneğinize göre modelleri aramanıza ve filtrelemenize olanak tanıyan bir model kataloğu sağlar. Modeli projenize dağıtmadan önce örnek bir oyun alanında da test edebilirsiniz.
  • "Azure AI Studio'yu nereden dağıtabilirim?" Modeli model kataloğundan veya projenizin dağıtım sayfasından dağıtabilirsiniz.

Azure AI Studio dağıtımları basitleştirir. Basit bir seçim veya kod satırı bir model dağıtır ve uygulamalarınızın kullanacağı bir API uç noktası oluşturur.

Azure OpenAI modelleri

Azure OpenAI, Azure'ın kurumsal özellikleriyle en son OpenAI modellerine erişmenizi sağlar. AI Studio'da OpenAI modellerini dağıtma hakkında daha fazla bilgi edinin.

Açık modeller

Model kataloğu, farklı modaliteler arasında çok çeşitli modellere erişim sağlar. Model kataloğundaki bazı modeller, kullandıkça öde ile bir hizmet olarak dağıtılabilir ve bu sayede bunları aboneliğinizde barındırmadan API olarak kullanmanın bir yolunu sağlarken kurumsal güvenlik ve uyumluluk kuruluşlarının ihtiyacı da devam eder.

Hizmet Olarak Model (Maas) ile model dağıtma

Bu dağıtım seçeneği aboneliğinizden kota gerektirmez. Sunucusuz API dağıtımı olarak dağıtılır ve belirteç başına kullandıkça öde yöntemiyle faturalandırılırsınız. Hizmet olarak modelle Llama 2 model ailesini dağıtmayı ve kullanmayı öğrenin.

Barındırılan yönetilen altyapı ile modelleri dağıtma

Ayrıca yönetilen altyapı, sanal makineler ve kapasite yönetimi için örnek sayısıyla açık modelleri kendi aboneliğinizde barındırabilirsiniz. Şu anda Azure AI, HuggingFace ve Nvidia'dan çok çeşitli modeller sunulmaktadır. Açık modelleri gerçek zamanlı uç noktalara dağıtma hakkında daha fazla bilgi edinin.

Azure AI Studio'da LLM'leri dağıtma ve çıkarıma yönelik faturalama

Aşağıdaki tabloda, Azure AI Studio'da LLM'leri dağıtma ve çıkarım için nasıl faturalandırıldığınız açıklanmaktadır. Maliyetleri izleme hakkında daha fazla bilgi edinmek için bkz. Azure Market boyunca sunulan modellerin maliyetlerini izleme.

Kullanım örneği Azure OpenAI modelleri Sunucusuz API'ler olarak dağıtılan modeller (kullandıkça öde) Yönetilen işlemle dağıtılan modeller
Model kataloğundan projenize model dağıtma Hayır, projenize Azure OpenAI modeli dağıttığınız için faturalandırılamazsınız. Evet, uç nokta1'in altyapısı başına faturalandırılırsınız Evet, model2'yi barındıran altyapı için faturalandırılırsınız
Projenize model dağıtıldıktan sonra Oyun Alanında sohbet modunu test etme Evet, belirteç kullanımınıza göre faturalandırılırsınız Evet, belirteç kullanımınıza göre faturalandırılırsınız Yok.
Model kataloğundaki örnek bir oyun alanında bir modeli test etme (varsa) Uygulanamaz Yok. Yok.
Bir modeli projenizin altındaki oyun alanında (varsa) veya projenizin altındaki dağıtım ayrıntıları sayfasındaki test sekmesinde test edin. Evet, belirteç kullanımınıza göre faturalandırılırsınız Evet, belirteç kullanımınıza göre faturalandırılırsınız Yok.

1 Dakika başına minimum uç nokta altyapısı faturalandırılır. Modelin kendisini kullandıkça öde'de barındıran altyapı için faturalandırmazsınız. Uç nokta silindikten sonra başka ücret alınmaz.

2 Faturalama, SKU'ya ve oluşturma anından bu yana dağıtımda kullanılan örnek sayısına bağlı olarak dakika bazında gerçekleştirilir. Uç nokta silindikten sonra başka ücret alınmaz.

Akışları dağıtma

Akış nedir ve neden dağıtmak istersiniz? Akış, üretken bir yapay zeka uygulaması oluşturmak için kullanılabilecek bir araç dizisidir. Akışı dağıtmak, kendi verilerinizle ve eklemeler, vektör DB araması gibi diğer bileşenlerle akışı özelleştirebilmeniz için içinde bir model dağıtmaktan farklıdır. ve özel bağlantılar. Nasıl yapılır kılavuzu için bkz . Azure AI Studio ile akış dağıtma.

Örneğin, kullanıcı sorgularına bilinçli ve temelli yanıtlar oluşturmak için verilerinizi kullanan bir sohbet botu oluşturabilirsiniz. Oyun alanında verilerinizi eklediğinizde, sizin için otomatik olarak bir istem akışı oluşturulur. Akışı olduğu gibi dağıtabilir veya kendi verileriniz ve diğer bileşenlerle daha fazla özelleştirebilirsiniz. Azure AI Studio'da sıfırdan kendi akışınızı da oluşturabilirsiniz.

Azure AI Studio'da hangi şekilde akış oluşturmayı seçerseniz seçin, akışı hızla dağıtabilir ve uygulamalarınızın kullanabileceği bir API uç noktası oluşturabilirsiniz.

Web uygulamalarını dağıtma

Dağıttığınız model veya akış, Azure'da barındırılan bir web uygulamasında kullanılabilir. Azure AI Studio, web uygulaması dağıtmak için hızlı bir yol sağlar. Daha fazla bilgi için Bkz . Azure AI Enterprise Chat öğreticisi.

Dağıtılan model için yapay zeka güvenliğini planlama

GPT-4 gibi Azure OpenAI modelleri için Azure AI Studio, yapay zekanın sorumlu bir şekilde kullanılmasını sağlamak için dağıtım sırasında yapay zeka güvenlik filtresi sağlar. Yapay zeka içerik güvenliği filtresi, yapay zeka ile geliştirilmiş uygulamaların güvenliğini artırmak için zararlı ve hassas içeriklerin denetlenmesini sağlar. Azure AI Studio, yapay zeka güvenlik filtresine ek olarak dağıtılan modeller için model izleme özelliği de sunar. LLM'ler için model izleme, modelin çıkışlarının belirlenen nesil güvenliği ve kalite eşiklerine göre kötü performans göstermesini izlemek ve uyarmak için en son GPT dil modellerini kullanır. Örneğin, modelin oluşturduğu yanıtların giriş kaynağındaki bilgilerle ("temellik") ne kadar uyumlu olduğunu ve bir temel doğruluk cümlesiyle veya belgeyle ("benzerlik") ne kadar yakın olduğunu değerlendirmek için bir monitör yapılandırabilirsiniz.

Dağıtılan modelin performansını iyileştirme

LLM'leri iyileştirmek için operasyonel ölçümler (örn. gecikme süresi), kalite ölçümleri (örn. doğruluk) ve maliyet gibi çeşitli faktörlerin dikkatli bir şekilde dikkate alınması gerekir. Modelinizin özel kullanım örneğine göre iyileştirildiğinden emin olmak için deneyimli veri bilimciler ve mühendislerle çalışmak önemlidir.

Sonraki adımlar