Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu makalede, Azure Kubernetes Service (AKS) kullanımınızı ve maliyetlerinizi iyileştirme hakkında yönergeler sağlanır. Aşağıdaki konularla ilgili yönergeleri kapsar:
- Otomatik ölçeklendirme
- Küme doğru boyutlandırma
- GPU iyileştirmeleri
- Çoklu Kullanıcı
- Azure indirimleri
Otomatik ölçeklendirme
Yatay pod otomatik ölçeklendirme
Yatay Pod Otomatik Ölçeklendiricisi (HPA) kaynak talebini izler ve pod sayısını talebi karşılayacak şekilde otomatik olarak ölçeklendirmek için bir iş yükü kaynağını otomatik olarak güncelleştirir. Artan yüke verilen yanıt, daha fazla pod dağıtmaktır. Yük azalırsa ve pod sayısı yapılandırılan minimumun üzerindeyse, otomatik ölçeklendirici iş yükü kaynağına ölçeği azaltmasını söyler.
Ölçümler API'si kubelet'ten her 60 saniyede bir veri alır ve HPA varsayılan olarak gerekli değişiklikler için ÖlçümLER API'sini her 15 saniyede bir denetler. Bu, HPA'nın 60 saniyede bir güncelleştirildiğini gösterir. HPA'yı bir dağıtım için yapılandırdığınızda, çalışabilecek en düşük ve en fazla çoğaltma sayısını ve HPA'nın ne zaman ölçeklendirileceğini belirlemek için kullandığı ölçümleri tanımlarsınız.
Daha fazla bilgi için bkz. AKS'de Yatay Pod Otomatik Ölçeklendirme ve Otomatik Ölçeklendirme podları.
Kubernetes olay temelli otomatik ölçeklendirme
Kubernetes Event-driven Autoscaler (KEDA), iş yüklerinize olay temelli otomatik ölçeklendirme uygular. KEDA, HPA ile çalışır ve üzerine yazmadan veya yinelemeden işlevselliği genişletebilir.
Aks için KEDA eklentisini kullanarak uygulamalarınızı ölçeklendirebilir ve zengin bir Azure KEDA ölçeklendirici kataloğundan yararlanabilirsiniz. Daha fazla bilgi için bkz. KEDA eklentisiyle uygulama otomatik ölçeklendirme ve AKS için KEDA eklentisini yükleme.
Dikey pod otomatik ölçeklendirme
Dikey Pod Otomatik Ölçeklendiricisi (VPA), geçmiş kullanıma göre iş yükü başına kapsayıcılara yönelik kaynak isteklerini ve sınırlarını otomatik olarak ayarlar. VPA, AKS kümelerinizin etkili bir şekilde kullanımını sağlamak için podlar için CPU ve Belleği serbest bırakır. VpA, zaman içinde kaynak kullanımına yönelik öneriler sağlar.
Daha fazla bilgi için bkz. Azure Kubernetes Service'te (AKS) dikey pod otomatik ölçeklendirme ve Azure Kubernetes Service'te (AKS) Dikey Pod Otomatik Ölçeklendiricisi'ni (VPA) kullanma.
Küme boyutunu uygun hale getirme
Kümenizi doğru boyutlandırma
Maliyetleri ve performansı iyileştirmek için kümelerinizi doğru boyutlandırmanız önemlidir. Uygulamalarınızın gereksinimlerini karşılamak için düğümleri ekleyerek veya kaldırarak bir kümeyi el ile yeniden boyutlandırabilirsiniz. Ayrıca değişen taleplere yanıt olarak düğüm sayısını otomatik olarak ayarlamak için kümenizi otomatik olarak ölçekleyebilirsiniz.
Daha fazla bilgi için bkz. Azure Kubernetes Service (AKS) kümelerini yeniden boyutlandırma.
Küme otomatik ölçeklendirme
Küme otomatik ölçeklendiricisi ile düğüm havuzlarını kaynak kullanımına ve kısıtlamalarına göre otomatik olarak ölçeklendirebilirsiniz; örneğin bekleyen podları zamanlamak için ölçeği artırabilir veya kullanılmayan düğümlerin maliyetlerini azaltmak için ölçeği azaltabilirsiniz. Küme otomatik ölçeklendiricisi profili, küme otomatik ölçeklendiricisinin davranışını denetlemek için ince ayar yapabileceğiniz bir parametre kümesidir.
Daha fazla bilgi için bkz. Azure Kubernetes Service'te (AKS) küme otomatik ölçeklendirmesine genel bakış ve Azure Kubernetes Service'te (AKS) küme otomatik ölçeklendiricisini kullanma.
Düğüm otomatik hazırlama (önizleme)
Açık kaynak Karpenter projesine dayalı düğüm otomatik sağlama (NAP) (önizleme), iş yüklerinizin bekleyen pod kaynağı gereksinimlerine göre doğru altyapıyı sağlamanıza yardımcı olur. Verimli bölme paketleme sayesinde, işletim maliyetlerini azaltmak için iş yüklerinizi doğru boyuttaki altyapıda birleştirebilirsiniz.
Daha fazla bilgi için bkz. Azure Kubernetes Service'te (AKS) düğüm otomatik sağlama (önizleme).
GPU iyileştirmeleri
GPU bölümleme ve paylaşma
GPU bölümleme, GPU'ları birden çok iş yükü arasında bölerek veya paylaşarak az kullanımla mücadeleye yardımcı olur. Aşağıdaki bölümlerde AKS'de GPU'ları bölümlemenin ve paylaşmanın farklı yolları ele alınıyor.
Zaman dilimleme
NVIDIA GPU Operatörü, Kubernetes kümelerindeki GPU'ların zaman dilimlenmesine olanak tanır. Zaman dilimleme ile bir sistem yöneticisi, bir GPU için bir dizi kopya tanımlayabilir ve her biri iş yüklerini çalıştırmak üzere bağımsız olarak bir podyuma verilebilir. Küme genelinde varsayılan zaman dilimleme yapılandırmalarını ve düğüme özgü yapılandırmaları uygulayabilirsiniz.
Daha fazla bilgi için bkz. Kubernetes'te zaman dilimleme GPU'ları.
Çoklu işleme hizmeti (MPS)
Tek bir işlem, GPU'da kullanılabilen tüm bellek ve işlem bant genişliği kapasitesini kullanmayabilir. Çok İşlemli Hizmet (MPS), iş yükleri arasında bellek ve işlem kaynaklarının mantıksal bölümlenmesine olanak tanır ve farklı işlemlerden gelen çekirdek ve memcopy işlemlerinin GPU'da çakışmasına olanak tanır. MPS, daha yüksek GPU kullanımına ve daha kısa çalışma sürelerine ulaşmanıza yardımcı olur.
Daha fazla bilgi için bkz . Çoklu İşlem Hizmeti (MPS).
Çok örnekli GPU'lar (MIG'ler)
Çok örnekli GPU'lar (MIG'ler), NVIDIA Ampere ve sonraki mimarileri temel alan GPU'ları CUDA uygulamaları için ayrı ve güvenli GPU örneklerine bölmenizi sağlar.
Daha fazla bilgi için bkz. MIG ile GPU Operatörü ve Azure Kubernetes Service'te (AKS) çok örnekli GPU düğüm havuzu oluşturma.
Çoklu Kiracılık
Çok kiracılılık, kiracılar, ekipler ve iş birimleri arasında altyapı paylaşımını ifade eder. Aşağıdaki tabloda AKS'de çok kiracılılık uygulamanın farklı yolları özetlenmiştir:
| Çok kiracılı tür | Çok kiracılı sistem seviyesi | Küme kapsül yoğunluğu | Maliyet tahsisatı | İdeal kullanım örneği | Olası riskler |
|---|---|---|---|---|---|
| Ayrılmış küme | Sabit çok kiracılı | Düşür | Kolay | Tam güvenlik izolasyonu sınırları ve kolay maliyet tahsisi | • Büyük ölçekte küme yayılması yönetim ek yükü maliyetlerine ekliyor • Daha düşük pod yoğunluğu ve daha fazla aşırı tahsis edilmiş kaynak |
| Ayrılmış düğüm havuzu | Esnek çok kiracılık | Orta | Orta | Orta pod yoğunluğu | • Kiracılar arasında güven gerektirir • Ağ ilkeleri, kota yönetimi, rol tabanlı erişim denetimi (RBAC) gibi ek küme yapılandırmaları gerektirir. |
| Ayrılmış ad alanı | Esnek çok kiracılık | Daha yüksek | Daha zor | Kaynak kullanımını en üst düzeye çıkarmak için altyapıyı paylaşma | • Varsayılan olarak düşman ortamlar için güvenli değildir • Ağ ilkeleri, kota yönetimi, rol tabanlı erişim denetimi (RBAC) gibi ek küme yapılandırmaları gerektirir. |
Özel küme
Ayrılmış küme çok kullanıcılığı ile kümeler tek bir iş yüküne veya takıma ayrılmıştır.
Aşağıdaki tabloda, ayrılmış küme kullanmanın avantajları ve dezavantajları özetlenmiştir:
| Avantajlar | Dezavantajlar |
|---|---|
| • Daha kolay yalıtım yöntemi • Basit maliyet ayırma ve geri ödeme • Kiracıların birbirine güvenmediği durumlar için harikadır (genellikle güvenlik ve kaynak paylaşımı açısından) |
• Yüksek yönetim ve finansal ek yük • Genellikle düşük pod yoğunluğu ve aşırı tahsis edilmiş kaynaklar |
Özel düğüm havuzu
Ayrılmış düğüm havuzunun çok kiracılı yapısı nedeniyle, kümeler birçok kiracı tarafından paylaşılır.
Aşağıdaki tabloda ayrılmış düğüm havuzu kullanmanın avantajları ve dezavantajları özetlenmiştir:
| Avantajlar | Dezavantajlar |
|---|---|
| • Orta pod yoğunluğu • Bazı paylaşılan altyapı • Azure etiketlerini tek bir kiracıya ayrılmış düğüm havuzlarına uygulama (etiketler düğümlere yayılır ve yükseltmeler aracılığıyla kalıcı olur) |
• Kiracılar arasında güven gerektirir • Ağ ilkeleri, kota yönetimi, rol tabanlı erişim denetimi (RBAC) gibi ek küme yapılandırmaları gerektirir. |
Ayrılmış ad alanı
Ayrılmış ad alanı çok kiracılı kümeler, yalıtım sınırı olarak hizmet veren ad alanları ile birçok kiracı tarafından paylaşılır.
Aşağıdaki tabloda, ayrılmış ad alanı kullanmanın avantajları ve dezavantajları özetlenmiştir:
| Avantajlar | Dezavantajlar |
|---|---|
| • Daha yüksek pod yoğunluğu • En iyi kutulama • Kaynak kullanımını en üst düzeye çıkarmak için altyapıyı paylaşma |
• Varsayılan olarak düşman ortamlar için güvenli değildir • Tüm kiracılara güvenilemiyorsa ek güvenlik önlemleri gerektirir |
Azure indirimleri
Tasarrufları bir adım daha ileri götürmek için Azure Tasarruf Planları, Ayrılmış Örnekler ve Azure Hibrit Avantajları gibi Azure indirimlerinden yararlanın.
| Azure indirim türü | Ayrıntılar |
|---|---|
| Azure Tasarruf Planları | • 1-3 yıllık ön taahhüt • Kullandıkça öde ile karşılaştırıldığında 65% kadar tasarruf edin • Esnek, SKU ailesi veya bölge kısıtlamaları olmadan • Çeşitli SKU'lar ve bölgelerdeki kaynaklarla tutarlı maliyetlere sahip iş yükleri için en iyi yöntem |
| Rezerve Edilmiş Örnekler | • 1-3 yıllık ön taahhüt • Kullandıkça öde yöntemine kıyasla 72%'ya kadar tasarruf edin • Belirli SKU aileleri ve bölgeleriyle sınırlı • Sürekli çalışan kararlı iş yükleri için en iyi yöntemdir (beklenmeyen SKU veya bölge değişiklikleri olmadan) |
| Azure Hibrit Avantajları | • Azure'a kendi şirket içi Windows Server ve SQL Server lisanslarınızı getirin • Etkin bir Yazılım Güvencesi (SA) veya uygun aboneliğe sahip uygun şirket içi lisansları kullanın |
Sonraki adımlar
AKS'deki maliyet hakkında daha fazla bilgi edinmek için aşağıdaki makalelere bakın: