Azure Container Apps'te sunucusuz GPU'ları kullanma

Azure Container Apps, temel alınan altyapıyı yönetmek zorunda kalmadan isteğe bağlı OLARAK GPU'lara erişim sağlar. Sunucusuz bir özellik olarak yalnızca kullanımdaki GPU'lar için ödeme alırsınız. Etkinleştirildiğinde, uygulamanız için kullanılan GPU sayısı artar ve uygulamanızın yük taleplerini karşılamak için düşer. Sunucusuz GPU'lar otomatik ölçeklendirme, iyileştirilmiş soğuk başlangıç, kullanımda olmadığında ölçeği sıfıra indirerek saniye başına faturalama ve daha az işlem yükü ile iş yüklerinizi sorunsuz bir şekilde çalıştırmanızı sağlar.

Sunucusuz GPU'lar yalnızca Tüketim iş yükü profilleri için desteklenir. Özellik yalnızca tüketim ortamları için desteklenmez.

Not

GPU'lara erişmek için GPU kotaları istemeniz gerekir. GPU kota isteğinizi bir müşteri destek talebi aracılığıyla gönderebilirsiniz.

Sosyal haklar

Sunucusuz GPU'lar, çekirdek yapay zeka kodunuz üzerinde odaklanmanıza ve GPU'ları kullanırken altyapıyı yönetmeye daha az odaklanmanıza olanak tanıyarak yapay zeka geliştirmeyi hızlandırır. Bu özellik, Foundry model kataloğunun sunucusuz API'leri ile yönetilen işlem üzerinde çalışan barındırma modelleri arasında bir ara katman seçeneği sunar.

Container Apps sunucusuz GPU desteği, verileriniz kapsayıcınızın sınırlarını asla terk etmediği için tam veri idaresi sağlarken, yine de uygulamalarınızı oluşturmak için yönetilen, sunucusuz bir platform sağlar.

Container Apps'te sunucusuz GPU'ları kullandığınızda, uygulamalarınız şunları alır:

Sıfıra ölçeklendirilen GPU'lar: NVIDIA A100 ve NVIDIA T4 GPU'larının otomatik sunucusuz ölçeklendirme desteği.
Saniye başına faturalama: Yalnızca kullandığınız GPU işlem için ödeme yapın.
Yerleşik veri idaresi: Verileriniz hiçbir zaman kapsayıcı sınırından ayrılmaz.
Esnek işlem seçenekleri: NVIDIA A100 veya T4 GPU türleri arasında seçim yapabilirsiniz.
Yapay zeka geliştirme için orta katman: Yönetilen, sunucusuz bir işlem platformunda kendi modelinizi getirin.

Genel senaryolar

Aşağıdaki senaryolarda sunucusuz GPU'lar için yaygın kullanım örnekleri açıklanmaktadır.

Gerçek zamanlı ve toplu çıkarım: Hızlı başlangıç süreleri, otomatik ölçeklendirme ve saniye başına faturalama modeli ile özel açık kaynak modelleri kullanın. Sunucusuz GPU'lar dinamik uygulamalar için idealdir. Yalnızca kullandığınız bilgi işlem kapasitesi için ödeme yapılır ve uygulamalarınız talebi karşılamak için otomatik olarak ölçeklendirilir.
Makine öğrenmesi senaryoları: hassas ayarlı özel yapay zeka modelleri, derin öğrenme, sinir ağları veya büyük ölçekli veri analizi uygulayan uygulamaları önemli ölçüde hızlandırabilirsiniz.
High-Performance Bilgi İşlem (HPC):Bilimsel bilgi işlem, finansal modelleme veya hava durumu tahmini gibi karmaşık hesaplamalar ve simülasyonlar gerektiren uygulamalarda yüksek hesaplama talepleri için GPU'ları kaynak olarak kullanın.
İşleme ve Görselleştirme: 3B işleme, görüntü işleme veya video kodlama içeren uygulamalarda işleme sürecini hızlandırmak ve gerçek zamanlı görselleştirmeyi etkinleştirmek için GPU'ları kullanın.
Büyük Veri Analizi: GPU'lar büyük veri kümeleri arasında veri işleme ve analiz işlemlerini hızlandırabilir.

Dikkat edilmesi gereken noktalar

Sunucusuz GPU'ları kullanırken aşağıdaki öğeleri göz önünde bulundurun:

CUDA sürümü: Sunucusuz GPU'lar en son CUDA sürümünü destekler. Geçerli sürücü ve çalışma zamanı sürümleri hakkında ayrıntılı bilgi için bkz. GPU yazılım yığını.
Destek sınırlamaları:
- Bir uygulamadaki yalnızca bir kapsayıcı GPU'ları aynı anda kullanabilir. Bir uygulamada birden çok kapsayıcınız varsa, ilk kapsayıcı GPU'ya erişim elde eder.
- Birden çok uygulama aynı GPU iş yükü profilini paylaşabilir ancak her biri kendi kopyasını gerektirir.
- Birden fazla ve kısmi GPU kopyaları desteklenmez.
- Uygulamanızdaki ilk kapsayıcı GPU'ya erişim kazanır.
IP adresleri: Tüketim GPU'ları, kendi sanal ağınızla tümleştirmeyi ayarlarken çoğaltma başına bir IP adresi kullanır.

GPU yazılım yığını

Azure Container Apps güvenlik yamalarını, performans iyileştirmelerini ve yeni özellikleri dahil etmek için NVIDIA GPU yazılım yığınını düzenli aralıklarla güncelleştirir.

Aşağıdaki tabloda, platform tarafından sağlanan geçerli ve yaklaşan GPU yazılım sürümleri gösterilmektedir:

Bileşen	Güncel sürüm	Yaklaşan sürüm
NVIDIA sürücüsü	570	580
Platform tarafından sağlanan CUDA çalışma zamanı	12.x	13.x

Important

Platform, bu tabloda listelenen gelecek sürümlere geçiş yapmakta. Dağıtım 23 Mayıs 2026'dan önce başlar ve güncelleştirmeler bölgeye göre uygulandığından birkaç gün içinde tamamlar. Güncelleştirme yürürlüğe girmeden önce uygulamanızı yaklaşan sürümlerle karşılaştırarak doğrulayın. Yönergeler için bkz. Uygulamanızı doğrulama.

Uygulamanızı doğrulama

Platform GPU yazılım yığınını güncelleştirdiğinde uygulamanızın uyumlu kaldığını doğrulamanız gerekir. Uygulayabileceğiniz adımlar kapsayıcı görüntünüzün CUDA'yi nasıl tükettiğine bağlıdır.

Uygulamanız kendi CUDA çalışma zamanını ( örneğin, sabitlenmiş CUDA temel görüntüsü kullanarak) gönderirse:

Uygulamanızın geçerli NVIDIA sürücü sürümüyle çalıştığını doğrulayın.
Kapsayıcı görüntüsü değişikliği gerekmez.

Uygulamanız platform tarafından sağlanan CUDA çalışma zamanını kullanıyorsa:

Uygulamanızın hem geçerli NVIDIA sürücüsü hem de CUDA çalışma zamanı sürümleriyle çalıştığını doğrulayın.
Uygulamanız henüz en son CUDA sürümüyle uyumlu değilse, önceki davranışı korumak için kapsayıcı görüntünüzde önceki bir CUDA sürümünü sabitleyin.

Sürüm ilkesi

Azure Container Apps sunucusuz ortamlarda GPU yazılım sürümleri şu ilkeleri izler:

GPU yazılım sürümleri ana veya ikincil aile düzeyinde belgelenmiştir (örneğin CUDA 12.x veya CUDA 13.x).
Yama sürümleri platform tarafından yönetilir ve bildirimde bulunmadan değişebilir.
Önemli GPU yazılım sürümü geçişleri planlandığında veya sunulduğunda bu belgeler güncelleştirilir.

Not

Bu bölümdeki GPU yazılım yığını bilgileri yalnızca sunucusuz GPU iş yükleri için geçerlidir. Ayrılmış GPU iş yükleri için sürücü ve CUDA çalışma zamanı dahil olmak üzere işletim sistemi platform tarafından otomatik olarak güncelleştirilir.

Desteklenen bölgeler

Sunucusuz GPU'lar aşağıdaki bölgelerde kullanılabilir:

Bölge	A100	T4
Doğu Avustralya	Evet	Evet
Güney Brezilya	Evet	Evet
Orta Hindistan	Hayı	Evet
Orta Kanada	Evet	Evet
East US	Evet	Evet
Orta Fransa	Hayı	Evet
Italy North	Evet	Evet
Japonya Doğu	Hayı	Evet
ABD'nin Kuzey Orta Bölgesi	Hayı	Evet
ABD'nin Güney Merkez Bölgesi	Hayı	Evet
Güneydoğu Asya	Hayı	Evet
South India	Hayı	Evet
Orta İsveç	Evet	Evet
Batı Avrupa¹	Hayı	Evet
Batı ABD	Evet	Evet
Batı ABD 2	Hayı	Evet
Batı ABD 3	Evet	Evet

¹ Batı Avrupa'da T4 sunucusuz GPU iş yükü profili eklemek için bölgede yeni bir iş yükü profili ortamı oluşturmanız gerekir.

Sunucusuz GPU'ları kullanma

Azure portalı üzerinden bir kapsayıcı uygulaması oluşturduğunuzda, kapsayıcınızı GPU kaynaklarını kullanacak şekilde ayarlayabilirsiniz.

Oluşturma işleminin Kapsayıcı sekmesinde aşağıdaki ayarları yapın:

Kapsayıcı kaynağı ayırma bölümünün altında GPU onay kutusunu seçin.
GPU Türü için NVIDIA A100 veya NVIDIA T4 seçeneğini belirleyin.

Sunucusuz GPU iş yükü profilini yönetme

Sunucusuz GPU'lar tüketim GPU iş yükü profillerinde çalışır. Tüketim GPU iş yükü profilini diğer iş yükü profilleriyle aynı şekilde yönetirsiniz. CLI veya Azure portal kullanarak iş yükü profilinizi yönetebilirsiniz.

Sunucusuz GPU kotası isteme

Not

Kurumsal anlaşmaları olan müşteriler ve kullandıkça öde müşterilerinin A100 ve T4 kotası varsayılan olarak etkinleştirilmiştir.

Bu özelliğe erişmek için sunucusuz GPU kotanız olmalıdır. GPU kota isteğinizi bir müşteri destek talebi aracılığıyla gönderebilirsiniz. GPU kota isteği için bir destek talebi açtığınızda, aşağıdaki seçenekleri belirleyin:

Azure portalında Yeni destek isteği formunu açın.
Forma aşağıdaki değerleri girin:

Mülkiyet Değer

Sorun türü Hizmet ve abonelik sınırlarını (kotalar) seçin

Subscription Aboneliğinizi seçin.

Kota türü Container Apps'i seçin.
sonrakiseçin.
Ek ayrıntılar penceresinde Ayrıntıları girin'i seçerek istek ayrıntıları penceresini açın.
Kota türü içinYönetilen Ortamda Tüketim NCA100 GPU'lar veya Yönetilen Ortamda Tüketim T4 GPU'lar seçin. Diğer değerlerinizi girin.
Kaydet ve devam et’i seçin.
İlgili ayrıntıların geri kalanını Ek ayrıntılar penceresinde doldurun.
sonrakiseçin.
Oluştur'i seçin.

Mülkiyet	Değer
Sorun türü	Hizmet ve abonelik sınırlarını (kotalar) seçin
Subscription	Aboneliğinizi seçin.
Kota türü	Container Apps'i seçin.

GPU soğuk başlatmayı geliştirme

Depolama bağlamasında yapıt akışını etkinleştirerek ve büyük dil modelleri gibi büyük dosyaları bularak soğuk başlangıç sürelerini önemli ölçüde geliştirebilirsiniz.

Artifact akışı: Azure Container Registry, görüntü başlatma sürelerini önemli ölçüde hızlandırabilen görüntü akışı sunar. Yapıt akışını kullanmak için kapsayıcı görüntülerinizi Azure Container Registry'nin premium sürümünde barındırıyor olmanız gerekir.
Depolama bağlamaları: Büyük dosyaları kapsayıcı uygulamanızla ilişkili bir Azure depolama hesabında depolayarak ağ gecikme süresinin etkilerini azaltın.

Foundry modellerini sunucusuz GPU'lara dağıtma (önizleme)

Azure Container Apps sunucusuz GPU'lar artık genel önizlemede Microsoft Foundry modellerini destekliyor. Dökümhane Modellerinin iki dağıtım seçeneği vardır:

En popüler modellerden bazıları için kullandıkça öde faturalaması sağlayan sunucusuz API'ler.
GPU başına ödeme ile Foundry modellerinin tamamını dağıtmanıza olanak sağlayan yönetilen işlem.

Azure Container Apps sunucusuz GPU, Foundry modellerini dağıtmanız için sunucusuz API'ler ve yönetilen işlem arasında dengeli bir dağıtım seçeneği sunar. Bu seçenek, sunucusuz ölçeklendirme ile ihtiyaç üzerine çalışır, kullanılmadığında sıfıra kadar ölçeklenir ve veri yerleşimi gereksinimlerinize uyar. Sunucusuz GPU'larda, Dökümhane modellerini kullanmak, otomatik ölçeklendirme, saniye başına ödeme fiyatlandırması, tam veri idaresi, kurumsal ağ ve güvenlik desteği ile desteklenen tüm modelleri çalıştırma esnekliği sağlar.

Türdeki MLFLOW dil modelleri desteklenir. Modellerin MLFLOW listesini görmek için azureml kayıt defterinde kullanılabilen modellerin listesine gidin. Modelleri bulmak için aşağıdaki adımları kullanarak modeller için MLFLOW bir filtre ekleyin:

Filtre'yi seç.
Filtre Ekle'yi seçin.
Filtre kuralı için Tür = MLFLOW girin.

Azure Container Apps deposunda listelenen modeller için aşağıdaki CLI komutunu kullanarak kendi görüntünüzü oluşturmanıza gerek kalmadan bunları doğrudan sunucusuz GPU'lara dağıtabilirsiniz:

az containerapp up \
  --name <CONTAINER_APP_NAME> \
  --location <LOCATION> \
  --resource-group <RESOURCE_GROUP_NAME> \
  --model-registry <MODEL_REGISTRY_NAME> \
  --model-name <MODEL_NAME> \
  --model-version <MODEL_VERSION>

Bu listede olmayan herhangi bir model için şunları yapmanız gerekir:

model görüntüsü için GitHub şablonunu Azure Container Apps deposundan indirin.
score.py dosyasını model türünüzle eşleşecek şekilde değiştirin. Puanlama betiği ( score.py olarak adlandırılır), modelle nasıl etkileşim kurabileceğinizi tanımlar. Aşağıdaki örnekte özel bir score.py dosyasının nasıl kullanılacağı gösterilmektedir.
Görüntüyü oluşturun ve bir kapsayıcı kayıt defterine yükleyin.
Modeli sunucusuz GPU'lara dağıtmak için önceki CLI komutunu kullanın, ancak değerini --imagebelirtin. --model-registry, --model-name ve --model-version parametrelerini kullandığınızda, temel çevresel değişkenler, uygulamanızın soğuk başlangıç performansını optimize etmeniz için ayarlanır.

Geri bildirim gönderin

sorunları Azure Container Apps GitHub deposuna gönderin.

Sonraki adımlar

Sunucusuz GPU'ları kullanarak görüntü oluşturma

Geri Bildirim

Bu sayfayı yararlı buldunuz mu?

Last updated on 2026-05-02