Aracılığıyla paylaş


Modelleri sunucusuz API'ler olarak dağıtma

Önemli

Bu makalede açıklanan özelliklerden bazıları yalnızca önizleme aşamasında kullanılabilir. Bu önizleme, hizmet düzeyi sözleşmesi olmadan sağlanır ve üretim iş yükleri için önerilmez. Bazı özellikler desteklenmiyor olabileceği gibi özellikleri sınırlandırılmış da olabilir. Daha fazla bilgi için bkz. Microsoft Azure Önizlemeleri Ek Kullanım Koşulları.

Bu makalede, model kataloğundan bir modeli kullandıkça öde belirteci tabanlı faturalama ile sunucusuz API olarak dağıtmayı öğreneceksiniz.

Model kataloğundaki bazı modeller kullandıkça öde faturalaması ile sunucusuz API olarak dağıtılabilir. Bu tür bir dağıtım, modelleri aboneliğinizde barındırmadan API olarak kullanmanın yanı sıra kuruluşların ihtiyaç duyduğu kurumsal güvenlik ve uyumluluğu korumanın bir yolunu sağlar. Bu dağıtım seçeneği aboneliğinizden kota gerektirmez.

Önkoşullar

  • Geçerli bir ödeme yöntemine sahip bir Azure aboneliği. Ücretsiz veya deneme Azure abonelikleri çalışmaz. Azure aboneliğiniz yoksa başlamak için ücretli bir Azure hesabı oluşturun.

  • Azure AI Studio hub'ı.

  • Azure AI Studio projesi.

  • Azure rol tabanlı erişim denetimleri (Azure RBAC), Azure AI Studio'daki işlemlere erişim vermek için kullanılır. Bu makaledeki adımları gerçekleştirmek için kullanıcı hesabınıza kaynak grubunda Azure AI Geliştirici rolü atanmalıdır. İzinler hakkında daha fazla bilgi için bkz . Azure AI Studio'da rol tabanlı erişim denetimi.

  • Azure AI Studio ile çalışmak için aşağıdaki yazılımı yüklemeniz gerekir:

    Azure AI Studio'da gezinmek için uyumlu herhangi bir web tarayıcısını kullanabilirsiniz.

Projenizi model teklifine abone olma

Azure Market aracılığıyla sunulan modeller için, tahminlerini kullanmak üzere bunları sunucusuz API uç noktalarına dağıtabilirsiniz. Modeli projede ilk kez dağıtıyorsanız, projenizi Azure Market belirli bir model teklifi için abone olmanız gerekir. Her projenin, harcamaları denetlemenize ve izlemenize olanak tanıyan modelin belirli Azure Market teklifine kendi aboneliği vardır.

Not

Azure Market aracılığıyla sunulan modeller, belirli bölgelerdeki sunucusuz API uç noktalarına dağıtılabilir. Hangi modellerin ve bölgelerin kullanılabilir olduğunu doğrulamak için Sunucusuz API dağıtımları için Model ve bölge kullanılabilirliğini denetleyin. İhtiyacınız olan listede yoksa, desteklenen bir bölgedeki bir çalışma alanına dağıtabilir ve ardından farklı bir çalışma alanından sunucusuz API uç noktalarını kullanabilirsiniz.

  1. Azure AI Studio'da oturum açın.

  2. Hesabınızın kaynak grubunda Azure AI Geliştirici rolü izinlerine sahip olduğundan veya model tekliflerine abone olmak için gereken izinleri karşıladığınızdan emin olun.

  3. Sol kenar çubuğundan Model kataloğu'nu seçin ve dağıtmak istediğiniz modelin model kartını bulun. Bu makalede bir Meta-Llama-3-8B-Instruct modeli seçersiniz.

    1. Modeli Azure CLI, Python veya ARM kullanarak dağıtıyorsanız Model Kimliğini kopyalayın.

      Önemli

      Model Kimliğini kopyalarken sürümü eklemeyin. Sunucusuz API uç noktaları her zaman modelin kullanılabilir en son sürümünü dağıtır. Örneğin, model kimliği azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3için değerini kopyalayın azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct.

    Modelin ayrıntılar sayfasını gösteren ekran görüntüsü.

  4. Modelin market aboneliğini oluşturun. Abonelik oluşturduğunuzda, model teklifiyle ilişkili hüküm ve koşulları kabul edersiniz.

    1. Modelin Ayrıntılar sayfasında Dağıt'ı ve ardından Sunucusuz API'yi seçerek dağıtım sihirbazını açın.

    2. Modellerinizi dağıtmak istediğiniz projeyi seçin. Tüm bölgelerin desteklenmediğini unutmayın.

      Sunucusuz API seçeneğiyle bir modelin nasıl dağıtılacağı gösteren ekran görüntüsü.

    3. Bu proje için zaten bir Azure Market aboneliğiniz var notunu görüyorsanız, zaten bir aboneliğiniz olduğundan aboneliği oluşturmanız gerekmez. Modeli sunucusuz api uç noktasına dağıtma işlemine geçebilirsiniz.

    4. Kullanım koşulları hakkında daha fazla bilgi edinmek için dağıtım sihirbazında Azure Market Koşulları bağlantısını seçin. Seçilen modelin fiyatlandırması hakkında bilgi edinmek için Fiyatlandırma ve koşullar sekmesini de seçebilirsiniz.

    5. Abone Ol ve Dağıt'ı seçin.

  5. Belirli bir Azure Market teklifi için projeye kaydolduktan sonra, aynı teklifin aynı projedeki sonraki dağıtımları yeniden abone olmayı gerektirmez.

  6. Herhangi bir noktada, projenizin şu anda abone olduğu model tekliflerini görebilirsiniz:

    1. Azure portalına gidin.

    2. Projenin ait olduğu kaynak grubuna gidin.

    3. Tür filtresinde SaaS'yi seçin.

    4. Şu anda abone olduğunuz tüm teklifleri görürsünüz.

    5. Ayrıntıları görmek için herhangi bir kaynağı seçin.

Modeli sunucusuz API uç noktasına dağıtma

Modelin aboneliğini oluşturduktan sonra, ilişkili modeli sunucusuz api uç noktasına dağıtabilirsiniz. Sunucusuz API uç noktası, modelleri aboneliğinizde barındırmadan API olarak kullanmanın bir yolunu sağlarken kuruluşların ihtiyaç duyduğu kurumsal güvenlik ve uyumluluk özelliklerini de korumanızı sağlar. Bu dağıtım seçeneği aboneliğinizden kota gerektirmez.

Bu makalede meta-llama3-8b-qwerty adlı bir uç nokta oluşturacaksınız.

  1. Sunucusuz uç nokta oluşturma

    1. Önceki sihirbazdan Dağıt'ı seçin (projeyi önceki bölümdeki model teklifine abone yaptıysanız) veya Dağıtıma devam et'i seçin (dağıtım sihirbazınızda bu proje için zaten bir Azure Market aboneliğiniz varsa).

      Teklife zaten abone olan bir projeyi gösteren ekran görüntüsü.

    2. Dağıtıma bir ad verin. Bu ad, dağıtım API'si URL'sinin bir parçası olur. Bu URL her Azure bölgesinde benzersiz olmalıdır.

      Oluşturmak istediğiniz dağıtımın adını belirtmeyi gösteren ekran görüntüsü.

    3. Dağıt'ı seçin. Dağıtım hazır olana ve Dağıtımlar sayfasına yönlendirilene kadar bekleyin.

  2. Herhangi bir noktada projenize dağıtılan uç noktaları görebilirsiniz:

    1. Projenize gidin.

    2. Dağıtımlar bölümünü seçin

    3. Sunucusuz API uç noktaları görüntülenir.

  3. Oluşturulan uç nokta yetkilendirme için anahtar kimlik doğrulamasını kullanır. Belirli bir uç noktayla ilişkili anahtarları almak için aşağıdaki adımları kullanın.

    Dağıtımlar sayfasına dönebilir, dağıtımı seçebilir ve uç noktanın Hedef URI'sini ve Anahtarını not edebilirsiniz. Dağıtımı çağırmak ve tahminler oluşturmak için bunları kullanın.

    Not

    Azure portalını kullanırken sunucusuz API uç noktaları varsayılan olarak kaynak grubunda görüntülenmez. Gizli türleri göster seçeneğini kullanarak bunları kaynak grubunda görüntüleyin.

  4. Bu noktada uç noktanız kullanılmaya hazırdır.

  5. Bu dağıtımı farklı bir projeden veya hub'dan kullanmanız gerekiyorsa veya akıllı uygulamalar oluşturmak için istem akışını kullanmayı planlıyorsanız sunucusuz API dağıtımına bir bağlantı oluşturmanız gerekir. Yeni bir projede veya hub'da mevcut sunucusuz API uç noktasını yapılandırmayı öğrenmek için bkz . Farklı bir projeden veya prompt akışından dağıtılan sunucusuz API uç noktalarını kullanma.

    İpucu

    Dağıtımın dağıtıldığı projede veya hub'da istem akışı kullanıyorsanız, bağlantıyı yine de oluşturmanız gerekir.

Sunucusuz API uç noktasını kullanma

Sunucusuz API uç noktalarındaki Azure Machine Learning ve Azure AI studio'da dağıtılan modeller, temel modeller için ortak bir özellik kümesini kullanıma sunan ve geliştiriciler tarafından çeşitli modellerden gelen tahminleri tekdüzen ve tutarlı bir şekilde kullanmak için kullanılabilen Azure Yapay Zeka Modeli Çıkarım API'sini destekler.

Bu API'nin özellikleri ve uygulama oluştururken bu API'den nasıl yararlanabileceğiniz hakkında daha fazla bilgi edinin.

Uç noktaları ve abonelikleri silme

Model aboneliklerini ve uç noktaları silebilirsiniz. Model aboneliğini silmek, ilişkili uç noktaların iyi durumda olmadığını ve kullanılamaz hale gelmesini sağlar.

Sunucusuz API uç noktasını silmek için:

  1. Azure AI Studio'ya gidin.

  2. Bileşenler Dağıtımları'na >gidin.

  3. Silmek istediğiniz dağıtımı açın.

  4. Sil'i seçin.

İlişkili model aboneliğini silmek için:

  1. Azure portal'a gidin

  2. Projenin ait olduğu kaynak grubuna gidin.

  3. Tür filtresinde SaaS'yi seçin.

  4. Silmek istediğiniz aboneliği seçin.

  5. Sil'i seçin.

Sunucusuz API uç noktaları olarak dağıtılan modeller için maliyet ve kota konuları

Sunucusuz API uç noktaları olarak dağıtılan modeller Azure Market aracılığıyla sunulur ve kullanım için Azure AI Studio ile tümleştirilir. Modelleri dağıtırken veya hassas ayarlar yaparken Azure Market fiyatlandırmasını bulabilirsiniz.

Proje Azure Market belirli bir teklife her abone olduğunda, tüketimiyle ilişkili maliyetleri izlemek için yeni bir kaynak oluşturulur. Aynı kaynak çıkarım ve ince ayarlama ile ilişkili maliyetleri izlemek için kullanılır; ancak, her senaryo bağımsız olarak izlemek için birden çok metre kullanılabilir.

Maliyetleri izleme hakkında daha fazla bilgi için bkz. Azure Market aracılığıyla sunulan modeller için maliyetleri izleme.

Farklı model tekliflerine ve bunların ilişkili ölçümlerine karşılık gelen farklı kaynakları gösteren ekran görüntüsü.

Kota dağıtım başına yönetilir. Her dağıtımın dakikada 200.000 belirteç ve dakikada 1.000 API isteği hız sınırı vardır. Ancak şu anda proje başına model başına bir dağıtımı sınırlandırıyoruz. Geçerli hız sınırları senaryolarınız için yeterli değilse Microsoft Azure Desteği'ne başvurun.

Model tekliflerine abone olmak için gereken izinler

Azure rol tabanlı erişim denetimleri (Azure RBAC), Azure AI Studio'daki işlemlere erişim vermek için kullanılır. Bu makaledeki adımları gerçekleştirmek için kullanıcı hesabınıza Azure aboneliği için Sahip, Katkıda Bulunan veya Azure AI Geliştirici rolü atanmalıdır. Alternatif olarak, hesabınıza aşağıdaki izinlere sahip bir özel rol de atanabilir:

  • Azure aboneliğinde - Çalışma alanının her çalışma alanı ve teklif başına bir kez Azure Market teklifine abone olması için:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • Kaynak grubunda - SaaS kaynağını oluşturmak ve kullanmak için:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • Çalışma alanında - Uç noktaları dağıtmak için (Azure Machine Learning veri bilimci rolü bu izinleri zaten içerir):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

İzinler hakkında daha fazla bilgi için bkz . Azure AI Studio'da rol tabanlı erişim denetimi.

Sonraki adım