Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
AI araç zinciri operatörü (KAITO), AKS kümenizde açık kaynak ve özel yapay zeka modellerini çalıştırma deneyimini basitleştiren yönetilen bir eklentidir. KAITO, altyapı yönetimi yerine daha hızlı yapay zeka modeli prototip oluşturma ve geliştirme olanağı sağlayarak modelleri ekleme ve kaynak sağlama süresini kısaltır.
Bu makale, AI araçlar zinciri işleticisi eklentisini nasıl etkinleştireceğinizi ve AKS'de bir yapay zeka modelini çıkarım amaçlı dağıtacağınızı göstermektedir.
Önemli
AKS önizleme özellikleri self servis ve kabul temelinde kullanılabilir. Önizlemeler "olduğu gibi" ve "kullanılabilir" olarak sağlanır ve hizmet düzeyi sözleşmelerinin ve sınırlı garantinin dışında tutulur. AKS önizlemeleri, müşteri desteği tarafından kısmen en iyi gayretle desteklenmektedir. Bu nedenle, bu özellikler üretim kullanımı için tasarlanmamıştır. Daha fazla bilgi için aşağıdaki destek makalelerine bakın:
Başlamadan önce
- Kubernetes kavramlarına temel düzeyde hakim olunan bir makale olduğu varsayılmaktadır. Daha fazla bilgi için bkz . AKS için Kubernetes temel kavramları.
- Tüm barındırılan model önayar görüntüleri ve varsayılan kaynak yapılandırması için bkz. KAITO GitHub deposu.
- AI araç zinciri işleci eklentisi şu anda KAITO sürüm 0.4.4'i desteklemektedir. Lütfen KAITO model deposundan model seçiminizi göz önünde bulundurarak bunu not edin.
Önkoşullar
Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.
Birden çok Azure aboneliğiniz varsa az account set komutunu kullanarak kaynakların oluşturulacağı ve ücretlendirileceği doğru aboneliği seçtiğinizden emin olun.
Not
Azure aboneliğinizin, AKS kaynaklarınız ile aynı Azure bölgesinde model dağıtımınız için önerilen GPU VM kotası olmalıdır.
Azure CLI sürüm 2.47.0 veya üzeri yüklü ve yapılandırılmış. Sürümü bulmak için
az --version
komutunu çalıştırın. Yüklemeniz veya yükseltmeniz gerekirse, bkz. Azure CLI yükleme.Kubernetes komut satırı istemcisi kubectl yüklenir ve yapılandırılır. Daha fazla bilgi için bkz . Kubectl yükleme.
Azure CLI AKS önizleme uzantısını yükleyin.
Yapay zeka araç zinciri işleci eklenti özellik bayrağını kaydedin.
Azure CLI önizleme uzantısını yükleme
az extension add komutunu kullanarak Azure CLI önizleme uzantısını yükleyin.
az extension add --name aks-preview
az extension update komutunu kullanarak en son sürüme sahip olduğunuzdan emin olmak için uzantıyı güncelleştirin.
az extension update --name aks-preview
Yapay zeka araç zinciri operatörü eklentisinin özellik bayrağını kaydet
az feature register komutunu kullanarak AIToolchainOperatorPreview özellik bayrağını kaydedin .
az feature register --namespace "Microsoft.ContainerService" --name "AIToolchainOperatorPreview"
Kaydın tamamlanması birkaç dakika sürer.
az feature show komutunu kullanarak kaydı doğrulayın.
az feature show --namespace "Microsoft.ContainerService" --name "AIToolchainOperatorPreview"
Ortam değişkenlerini dışarı aktarma
Bu makaledeki yapılandırma adımlarını basitleştirmek için aşağıdaki komutları kullanarak ortam değişkenlerini tanımlayabilirsiniz. Yer tutucu değerleri kendi değerlerinizle değiştirin.
export AZURE_SUBSCRIPTION_ID="mySubscriptionID" export AZURE_RESOURCE_GROUP="myResourceGroup" export AZURE_LOCATION="myLocation" export CLUSTER_NAME="myClusterName"
AKS kümesinde yapay zeka araç zinciri işleci eklentisini etkinleştirme
Aşağıdaki bölümlerde, AI araç zinciri işleci eklentisi etkinleştirilmiş bir AKS kümesinin nasıl oluşturulacağı ve varsayılan barındırılan yapay zeka modelinin nasıl dağıtılacağı açıklanmaktadır.
AI araç zinciri işleci eklentisi etkinken bir AKS kümesi oluşturun
az group create komutunu kullanarak bir Azure kaynak grubu oluşturun .
az group create --name $AZURE_RESOURCE_GROUP --location $AZURE_LOCATION
AI araç zinciri operatörü eklentisinin etkinleştirildiği bir AKS kümesi oluşturmak için, az aks create komutunu
--enable-ai-toolchain-operator
bayrağı ile kullanın.az aks create --location $AZURE_LOCATION \ --resource-group $AZURE_RESOURCE_GROUP \ --name $CLUSTER_NAME \ --enable-ai-toolchain-operator \ --generate-ssh-keys
Mevcut bir AKS kümesinde, az aks update komutunu kullanarak AI araç zinciri operatörü eklentisini etkinleştirebilirsiniz.
az aks update --name $CLUSTER_NAME \ --resource-group $AZURE_RESOURCE_GROUP \ --enable-ai-toolchain-operator
Kümenize bağlanma
kubectl
az aks get-credentials komutunu kullanarak kümenize bağlanacak şekilde yapılandırın.az aks get-credentials --resource-group $AZURE_RESOURCE_GROUP --name $CLUSTER_NAME
komutunu kullanarak
kubectl get
kümenize bağlantıyı doğrulayın.kubectl get nodes
Varsayılan barındırılan yapay zeka modelini dağıtma
Komutunu
kubectl apply
kullanarak KAITO model deposundan Falcon 7B yönergeli modeli dağıtın.kubectl apply -f https://raw.githubusercontent.com/Azure/kaito/main/examples/inference/kaito_workspace_falcon_7b-instruct.yaml
komutunu kullanarak çalışma alanınızdaki canlı kaynak değişikliklerini
kubectl get
izleyin.kubectl get workspace workspace-falcon-7b-instruct -w
Not
KAITO çalışma alanı dağıtımını izlediğinizde, makine hazırlığının 10 dakika, çalışma alanının hazır olma durumunun ise modelinizin boyutuna bağlı olarak 20 dakikaya kadar sürebileceğini unutmayın.
Çıkarım hizmetinizi denetleyin ve komutunu kullanarak
kubectl get svc
hizmet IP adresini alın.export SERVICE_IP=$(kubectl get svc workspace-falcon-7b-instruct -o jsonpath='{.spec.clusterIP}')
Falcon 7B-instruct çıkarım hizmetini OpenAI sohbet tamamlama api'si biçimini kullanarak seçtiğiniz bir örnek girişle test edin:
kubectl run -it --rm --restart=Never curl --image=curlimages/curl -- curl -X POST http://$SERVICE_IP/v1/completions -H "Content-Type: application/json" \ -d '{ "model": "falcon-7b-instruct", "prompt": "What is Kubernetes?", "max_tokens": 10 }'
Kaynakları temizleme
Bu kaynaklara artık ihtiyacınız yoksa, ek Azure işlem ücretlerinden kaçınmak için bunları silebilirsiniz.
komutunu kullanarak KAITO çalışma alanını
kubectl delete workspace
silin.kubectl delete workspace workspace-falcon-7b-instruct
KAITO dağıtımı tarafından sağlanan GPU düğümü havuzlarını el ile silmeniz gerekir. Falcon-7b instruct çalışma alanı tarafından oluşturulan düğüm etiketini kullanarak
az aks nodepool list
komutunu çalıştırıp düğüm havuzu adını alın. Bu örnekte düğüm etiketi "kaito.sh/workspace": "workspace-falcon-7b-instruct".az aks nodepool list --resource-group $AZURE_RESOURCE_GROUP --cluster-name $CLUSTER_NAME
AKS kümenizden bu ada sahip düğüm havuzunu silin ve kaldırılacak her KAITO çalışma alanı için bu bölümdeki adımları tekrar uygulayın.
Yaygın sorun giderme senaryoları
KAITO model çıkarım alanını uyguladıktan sonra, kaynak hazırlığınız ile çalışma alanı koşullarınız aşağıdaki nedenlerden dolayı True
olarak güncellenmeyebilir:
- Azure aboneliğinizin KAITO çalışma alanınızda belirtilen en düşük GPU örneği türü için kotası yoktur. Azure aboneliğinizdeki GPU VM ailesi için kota artışı istemeniz gerekir.
- GPU örneği türü AKS bölgenizde kullanılamaz. Belirli bölgenizdeki GPU örneği kullanılabilirliğini onaylayın ve GPU VM aileniz kullanılamıyorsa Azure bölgesini değiştirin.
Sonraki adımlar
KAITO modeli dağıtım seçenekleri hakkında daha fazla bilgiyi aşağıda bulabilirsiniz:
- AKS'de yapay zeka araç zinciri işleci eklentisiyle modelde ince ayarlamalar yapın.
- AKS'de yapay zeka işlem hatlarınız için en iyi MLOps uygulamaları hakkında bilgi edinin
- AKS'de KAITO çıkarımı için özel bir modeli entegre edin.
Azure Kubernetes Service