مرجع لتكوين مجموعة Kubernetes للتعلم الآلي من Azure
تحتوي هذه المقالة على معلومات مرجعية لتكوين Kubernetes باستخدام Azure التعلم الآلي.
إصدار Kubernetes المدعوم والمنطقة
تحتوي مجموعات Kubernetes التي تقوم بتثبيت ملحق Azure التعلم الآلي على نافذة دعم إصدار من "N-2"، تتم محاذاتها مع نهج دعم إصدار Azure Kubernetes Service (AKS)، حيث "N" هو أحدث إصدار ثانوي GA من خدمة Azure Kubernetes.
على سبيل المثال، إذا كانت AKS تقدم 1.20.a اليوم، يتم دعم الإصدارات 1.20.a و1.20.b و1.19.c و1.19.d و1.18.e و1.18.f.
إذا كان العملاء يشغلون إصدار Kubernetes غير مدعوم، يطلب منهم الترقية عند طلب دعم نظام المجموعة. لا تغطي نهج دعم ملحق Azure التعلم الآلي أنظمة المجموعات التي تعمل بإصدارات Kubernetes غير المدعومة.
توفر منطقة ملحق Azure التعلم الآلي:
- يمكن نشر ملحق Azure التعلم الآلي إلى AKS أو Kubernetes الممكن ل Azure Arc في المناطق المدعومة المدرجة في دعم منطقة Kubernetes الممكنة في Azure Arc.
تخطيط الموارد الموصى به
عند نشر ملحق Azure التعلم الآلي، يتم نشر بعض الخدمات ذات الصلة إلى مجموعة Kubernetes الخاصة بك ل Azure التعلم الآلي. يسرد الجدول التالي الخدمات ذات الصلة واستخدام الموارد الخاصة بها في نظام المجموعة:
توزيع/Daemonset | النسخه المتماثله # | التدريب | الاستدلال | طلب وحدة المعالجة المركزية (m) | حد وحدة المعالجة المركزية (m) | طلب الذاكرة (Mi) | حد الذاكرة (Mi) |
---|---|---|---|---|---|---|---|
metrics-controller-manager | 1 | √ | √ | 10 | 100 | 20 | 300 |
عامل تشغيل prometheus | 1 | √ | √ | 100 | 400 | 128 | 512 |
بروميثيوس | 1 | √ | √ | 100 | 1000 | 512 | 4096 |
kube-state-metrics | 1 | √ | √ | 10 | 100 | 32 | 256 |
بوابة | 1 | √ | √ | 50 | 500 | 256 | 2048 |
fluent-bit | 1 لكل عقدة | √ | √ | 10 | 200 | 100 | 300 |
inference-operator-controller-manager | 1 | √ | غير متوفر | 100 | 1000 | 128 | 1024 |
amlarc-identity-controller | 1 | √ | غير متوفر | 200 | 1000 | 200 | 1024 |
amlarc-identity-proxy | 1 | √ | غير متوفر | 200 | 1000 | 200 | 1024 |
azureml-ingress-nginx-controller | 1 | √ | غير متوفر | 100 | 1000 | 64 | 512 |
azureml-fe-v2 | 1 (لغرض الاختبار) أو 3 (لغرض الإنتاج) |
√ | غير متوفر | 900 | 2000 | 800 | 1200 |
النشر عبر الإنترنت | 1 لكل نشر | تم إنشاء المستخدم | غير متوفر | <تعريف المستخدم> | <تعريف المستخدم> | <تعريف المستخدم> | <تعريف المستخدم> |
التوزيع عبر الإنترنت/الهوية الجانبية | 1 لكل نشر | √ | غير متوفر | 10 | 50 | 100 | 100 |
aml-operator | 1 | غير متوفر | √ | 20 | 1020 | 124 | 2168 |
volcano-admission | 1 | غير متوفر | √ | 10 | 100 | 64 | 256 |
وحدة التحكم في البركان | 1 | غير متوفر | √ | 50 | 500 | 128 | 512 |
مخطط بركاني | 1 | غير متوفر | √ | 50 | 500 | 128 | 512 |
باستثناء عمليات النشر/القرون الخاصة بك، فإن الحد الأدنى الإجمالي لمتطلبات موارد النظام كما يلي:
السيناريو | الاستدلال الممكن | التدريب الممكن | طلب وحدة المعالجة المركزية (m) | حد وحدة المعالجة المركزية (m) | طلب الذاكرة (Mi) | حد الذاكرة (Mi) | حساب العقدة | الحد الأدنى الموصى به لحجم الجهاز الظاهري | وحدة حفظ المخزون المقابلة لجهاز AKS الظاهري |
---|---|---|---|---|---|---|---|---|---|
للاختبار | √ | غير متوفر | 1780 | 8300 | 2440 | 12296 | عقدة واحدة | 2 وحدة معالجة مركزية افتراضية، ذاكرة 7 غيغابايت، 6400 IOPS، 1500 ميغابت في الثانية BW | DS2v2 |
للاختبار | غير متوفر | √ | 410 | 4420 | 1492 | 10960 | عقدة واحدة | 2 وحدة معالجة مركزية افتراضية، ذاكرة 7 غيغابايت، 6400 IOPS، 1500 ميغابت في الثانية BW | DS2v2 |
للاختبار | √ | √ | 1910 | 10420 | 2884 | 15744 | عقدة واحدة | 4 وحدات معالجة مركزية افتراضية، ذاكرة 14 غيغابايت، 12800 IOPS، 1500 ميجابت في الثانية BW | DS3v2 |
للإنتاج | √ | غير متوفر | 3600 | 12700 | 4240 | 15296 | 3 عقدة (عقد) | 4 وحدات معالجة مركزية افتراضية، ذاكرة 14 غيغابايت، 12800 IOPS، 1500 ميجابت في الثانية BW | DS3v2 |
للإنتاج | غير متوفر | √ | 410 | 4420 | 1492 | 10960 | عقدة (عقد) واحدة | 8 وحدات معالجة مركزية افتراضية، 28 غيغابايت Memroy، 25600 IOPs، 6000 ميجابت في الثانية BW | DS4v2 |
للإنتاج | √ | √ | 3730 | 14820 | 4684 | 18744 | 3 عقدة (عقد) | 4 وحدات معالجة مركزية افتراضية، ذاكرة 14 غيغابايت، 12800 IOPS، 1500 ميجابت في الثانية BW | DS4v2 |
إشعار
- لغرض الاختبار، يجب عليك الرجوع إلى طلب المورد tp.
- لغرض الإنتاج، يجب الرجوع إلى حد الموارد.
هام
فيما يلي بعض الاعتبارات الأخرى للرجوع إليها:
- للحصول على عرض نطاق ترددي أعلى للشبكة وتحسين أداء إدخال/إخراج القرص، نوصي ب SKU أكبر.
- إذا كنت تستخدم نظام مجموعة AKS، فقد تحتاج إلى التفكير في حد الحجم على صورة حاوية في AKS، والمزيد من المعلومات التي يمكنك العثور عليها في حد حجم صورة حاوية AKS.
المتطلبات الأساسية لمجموعات ARO أو OCP
تعطيل Security Enhanced Linux (SELinux)
مجموعة بيانات Azure التعلم الآلي (ميزة SDK v1 المستخدمة في مهام تدريب Azure التعلم الآلي) غير مدعومة على الأجهزة مع تمكين SELinux. لذلك، تحتاج إلى تعطيل selinux
على جميع العمال من أجل استخدام مجموعة بيانات Azure التعلم الآلي.
الإعداد المتميز لـ ARO وOCP
بالنسبة إلى نشر ملحق Azure التعلم الآلي على مجموعة ARO أو OCP، امنح حق الوصول المتميز إلى حسابات خدمة Azure التعلم الآلي، وقم بتشغيل oc edit scc privileged
الأمر، وأضف حسابات الخدمة التالية ضمن "users:":
system:serviceaccount:azure-arc:azure-arc-kube-aad-proxy-sa
system:serviceaccount:azureml:{EXTENSION-NAME}-kube-state-metrics
system:serviceaccount:azureml:prom-admission
system:serviceaccount:azureml:default
system:serviceaccount:azureml:prom-operator
system:serviceaccount:azureml:load-amlarc-selinux-policy-sa
system:serviceaccount:azureml:azureml-fe-v2
system:serviceaccount:azureml:prom-prometheus
system:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default
system:serviceaccount:azureml:azureml-ingress-nginx
system:serviceaccount:azureml:azureml-ingress-nginx-admission
إشعار
{EXTENSION-NAME}
: هو اسم الملحق المحدد بأمر CLIaz k8s-extension create --name
.{KUBERNETES-COMPUTE-NAMESPACE}
: هي مساحة اسم حساب Kubernetes المحدد عند إرفاق الحساب بمساحة عمل التعلم الآلي من Azure. تخطي التكوينsystem:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default
إذا كانKUBERNETES-COMPUTE-NAMESPACE
هوdefault
.
تفاصيل السجل المجمعة
سيتم جمع بعض السجلات حول أحمال عمل Azure التعلم الآلي في نظام المجموعة من خلال مكونات الامتداد، مثل الحالة والمقاييس ودورة الحياة وما إلى ذلك. تعرض القائمة التالية جميع تفاصيل السجل التي تم جمعها، بما في ذلك نوع السجلات التي تم جمعها ومكان إرسالها أو تخزينها.
وحدة | Resource description | معلومات تسجيل التفاصيل |
---|---|---|
amlarc-identity-controller | طلب وتجديد الرمز المميز Azure Blob/Azure Container Registry من خلال الهوية المُدارة. | يستخدم فقط عند enableInference=true تعيين عند تثبيت الملحق. يحتوي على سجلات تتبع للحالة على الحصول على هوية لنقاط النهاية للمصادقة مع خدمة Azure التعلم الآلي. |
amlarc-identity-proxy | طلب وتجديد الرمز المميز Azure Blob/Azure Container Registry من خلال الهوية المُدارة. | يستخدم فقط عند enableInference=true تعيين عند تثبيت الملحق. يحتوي على سجلات تتبع للحالة على الحصول على هوية لنظام المجموعة للمصادقة مع خدمة Azure التعلم الآلي. |
aml-operator | إدارة دورة حياة وظائف التدريب. | تحتوي السجلات على Azure التعلم الآلي حالة جراب مهمة التدريب في نظام المجموعة. |
azureml-fe-v2 | مكون الواجهة الأمامية الذي يوجه طلبات الاستدلال الواردة إلى الخدمات المنشورة. | الوصول إلى السجلات على مستوى الطلب، بما في ذلك معرف الطلب ووقت البدء ورمز الاستجابة وتفاصيل الخطأ ومدد زمن انتقال الطلب. تتبع السجلات لتغييرات بيانات تعريف الخدمة، والخدمة التي تعمل بالحالة الصحية، وما إلى ذلك لغرض تصحيح الأخطاء. |
بوابة | تستخدم البوابة للتواصل وإرسال البيانات ذهاباً وإياباً. | تتبع سجلات الطلبات من خدمات Azure التعلم الآلي إلى المجموعات. |
التحقق من الصحة | -- | تحتوي السجلات على azureml حالة مورد مساحة الاسم (ملحق Azure التعلم الآلي) لتشخيص ما يجعل الملحق غير وظيفي. |
inference-operator-controller-manager | إدارة دورة حياة نقاط نهاية الاستدلال. | تحتوي السجلات على Azure التعلم الآلي نقطة نهاية الاستدلال وحالة جراب النشر في نظام المجموعة. |
metrics-controller-manager | إدارة التكوين ل Prometheus. | تتبع السجلات لحالة تحميل مهمة التدريب ومقاييس توزيع الاستدلال على استخدام وحدة المعالجة المركزية واستخدام الذاكرة. |
خادم الترحيل | خادم الترحيل مطلوب فقط في نظام المجموعة المتصل ب arc ولن يتم تثبيته في نظام مجموعة AKS. | يعمل خادم الترحيل مع Azure Relay للتواصل مع الخدمات السحابية. تحتوي السجلات على معلومات مستوى الطلب من Azure relay. |
تتصل وظائف Azure التعلم الآلي بتخزين البيانات المخصص
وحدة التخزين الثابتة (PV) ومطالبة وحدة التخزين الدائمة (PVC) هما أحد مفاهيم Kubernetes، ما يسمح للمستخدم بتوفير موارد تخزين مختلفة واستهلاكها.
- لإنشاء PV، خذ NFS على سبيل المثال،
apiVersion: v1
kind: PersistentVolume
metadata:
name: nfs-pv
spec:
capacity:
storage: 1Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
storageClassName: ""
nfs:
path: /share/nfs
server: 20.98.110.84
readOnly: false
- إنشاء PVC في نفس مساحة اسم Kubernetes مع أحمال عمل التعلم الآلي. في
metadata
، يجب إضافة تسميةml.azure.com/pvc: "true"
ليتم التعرف عليها بواسطة Azure التعلم الآلي، وإضافة تعليق توضيحيml.azure.com/mountpath: <mount path>
لتعيين مسار التحميل.
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: nfs-pvc
namespace: default
labels:
ml.azure.com/pvc: "true"
annotations:
ml.azure.com/mountpath: "/mnt/nfs"
spec:
storageClassName: ""
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi
هام
- تدعم مهمة/مكون الأمر ومهمة/مكون محرك الأقراص الفائق ونشر الدفعات تخزين البيانات المخصصة من PVC(s). > * لا تدعم نقطة النهاية عبر الإنترنت في الوقت الحقيقي ومهمة AutoML ووظيفة PRS تخزين البيانات المخصصة من PVC(s).
- بالإضافة إلى ذلك، سيتم تحميل وحدة التخزين فقط في نفس مساحة اسم Kubernetes مع PVC(s). لعالم البيانات الحق في الوصول إلى
mount path
المحدد في التعليق التوضيحي PVC في الوظيفة. لن يكون لوظيفة AutoML ووظيفة Prs حق الوصول إلى PVC (PVC).
العيوب والتفاوتات المدعومة في Azure التعلم الآلي
Taint وتسامح هي مفاهيم Kubernetes التي تعمل معا لضمان عدم جدولة القرون على العقد غير المناسبة.
تدعم مجموعات Kubernetes المتكاملة مع Azure التعلم الآلي (بما في ذلك مجموعات AKS وArc Kubernetes) الآن تلطخات وتفاوتات Azure التعلم الآلي محددة، مما يسمح للمستخدمين بإضافة صبغات Azure التعلم الآلي معينة على العقد المخصصة التعلم الآلي Azure، لمنع غير Azure التعلم الآلي جدولة أحمال العمل على هذه العقد المخصصة.
نحن ندعم فقط وضع العيوب الخاصة بال amlarc على العقد الخاصة بك، والتي يتم تعريفها على النحو التالي:
العيب | مفتاح | القيمة | التأثير | الوصف |
---|---|---|---|---|
amlarc بشكل عام | ml.azure.com/amlarc | صحيح | NoSchedule ، NoExecute أو PreferNoSchedule |
ستتسامح جميع أحمال عمل Azure التعلم الآلي، بما في ذلك جرابات خدمة نظام الملحقات ووحدات أحمال عمل التعلم الآلي مع هذا amlarc overall التلوث. |
نظام amlarc | ml.azure.com/amlarc-system | صحيح | NoSchedule ، NoExecute أو PreferNoSchedule |
فقط Azure التعلم الآلي خدمات نظام ملحق pods ستتسامح مع هذا amlarc system الصبغة. |
حمل عمل amlarc | ml.azure.com/amlarc-workload | صحيح | NoSchedule ، NoExecute أو PreferNoSchedule |
يمكن أن تتحمل وحدات حمل عمل التعلم الآلي فقط هذه amlarc workload الصبغة. |
مجموعة موارد amlarc | ml.azure.com/resource-group | <اسم مجموعة الموارد> | NoSchedule ، NoExecute أو PreferNoSchedule |
لن تتحمل هذه amlarc resource group الصبغة سوى وحدات أحمال عمل التعلم الآلي التي تم إنشاؤها من مجموعة الموارد المحددة. |
مساحة عمل amlarc | ml.azure.com/workspace | <اسم مساحة العمل> | NoSchedule ، NoExecute أو PreferNoSchedule |
لن تتحمل هذه amlarc workspace الصبغة سوى وحدات أحمال عمل التعلم الآلي التي تم إنشاؤها من مساحة العمل المحددة. |
حساب amlarc | ml.azure.com/compute | <اسم الحساب> | NoSchedule ، NoExecute أو PreferNoSchedule |
لن تتحمل هذه amlarc compute الصبغة سوى وحدات أحمال عمل التعلم الآلي التي تم إنشاؤها باستخدام هدف الحوسبة المحدد. |
تلميح
- بالنسبة إلى Azure Kubernetes Service (AKS)، يمكنك اتباع المثال في أفضل الممارسات لميزات المجدول المتقدمة في خدمة Azure Kubernetes (AKS) لتطبيق الصبغات على تجمعات العقد.
- بالنسبة لمجموعات Arc Kubernetes، مثل مجموعات Kubernetes المحلية، يمكنك استخدام
kubectl taint
الأمر لإضافة العيوب إلى العقد. لمزيد من الأمثلة، راجع وثائق Kubernetes.
أفضل الممارسات
وفقا لمتطلبات الجدولة للعقد المخصصة التعلم الآلي Azure، يمكنك إضافة العديد من العيوب الخاصة بال amlarc لتقييد ما يمكن أن تعمل عليه أحمال عمل Azure التعلم الآلي على العقد. ندرج أفضل الممارسات لاستخدام الصبغات الأملرية:
- لمنع أحمال العمل غير التابعة ل Azure التعلم الآلي من العمل على العقد/تجمعات العقد المخصصة التعلم الآلي Azure، يمكنك فقط إضافة الصبغة
aml overall
إلى هذه العقد. - لمنع تشغيل القرون غير النظامية على العقد/تجمعات العقد المخصصة التعلم الآلي Azure، يجب إضافة العيوب التالية:
amlarc overall
العيبamlarc system
العيب
- لمنع أحمال العمل غير ml من العمل على العقد/تجمعات العقد المخصصة التعلم الآلي Azure، يجب عليك إضافة العيوب التالية:
amlarc overall
العيبamlarc workloads
العيب
- لمنع أحمال العمل التي لم يتم إنشاؤها من مساحة العمل X من العمل على العقد/تجمعات العقد المخصصة ل Azure التعلم الآلي، يجب إضافة العيوب التالية:
amlarc overall
العيبamlarc resource group (has this <workspace X>)
العيبamlarc <workspace X>
العيب
- لمنع أحمال العمل التي لم يتم إنشاؤها بواسطة حساب الهدف X من العمل على العقد/تجمعات العقد المخصصة التعلم الآلي Azure، يجب عليك إضافة العيوب التالية:
amlarc overall
العيبamlarc resource group (has this <workspace X>)
العيبamlarc workspace (has this <compute X>)
العيبamlarc <compute X>
العيب
دمج وحدة تحكم الدخول الأخرى مع ملحق Azure التعلم الآلي عبر HTTP أو HTTPS
بالإضافة إلى موازن تحميل الاستدلال الافتراضي Azure التعلم الآلي azureml-fe، يمكنك أيضا دمج موازنات التحميل الأخرى مع ملحق Azure التعلم الآلي عبر HTTP أو HTTPS.
يساعد هذا البرنامج التعليمي على توضيح كيفية دمج وحدة تحكم دخول Nginx أو بوابة تطبيق Azure.
المتطلبات الأساسية
- انشر ملحق Azure التعلم الآلي مع
inferenceRouterServiceType=ClusterIP
وallowInsecureConnections=True
، بحيث يمكن لوحدة تحكم الدخول Nginx معالجة إنهاء TLS بنفسها بدلا من تسليمها إلى azureml-fe عند عرض الخدمة عبر HTTPS. - للتكامل مع وحدة تحكم دخول Nginx، تحتاج إلى إعداد مجموعة Kubernetes مع وحدة تحكم دخول Nginx.
- إنشاء وحدة تحكم أساسية: إذا كنت تبدأ من الصفر، فراجع هذه الإرشادات.
- للتكامل مع Azure Application Gateway، تحتاج إلى إعداد مجموعة Kubernetes مع وحدة تحكم دخول بوابة تطبيق Azure.
- Greenfield Deployment: إذا كنت تبدأ من الصفر، فراجع هذه الإرشادات.
- Brownfield Deployment: إذا كان لديك مجموعة AKS موجودة وبوابة التطبيق، فراجع هذه الإرشادات.
- إذا كنت ترغب في استخدام HTTPS على هذا التطبيق، فأنت بحاجة إلى شهادة x509 ومفتاحها الخاص.
كشف الخدمات عبر HTTP
من أجل كشف azureml-fe، سنستخدم مورد الدخول التالي:
# Nginx Ingress Controller example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
name: azureml-fe
namespace: azureml
spec:
ingressClassName: nginx
rules:
- http:
paths:
- path: /
backend:
service:
name: azureml-fe
port:
number: 80
pathType: Prefix
يعرض azureml-fe
هذا الدخول الخدمة والنشر المحدد كواجهة خلفية افتراضية لوحدة تحكم دخول Nginx.
# Azure Application Gateway example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
name: azureml-fe
namespace: azureml
spec:
ingressClassName: azure-application-gateway
rules:
- http:
paths:
- path: /
backend:
service:
name: azureml-fe
port:
number: 80
pathType: Prefix
يعرض azureml-fe
هذا الدخول الخدمة والنشر المحدد كواجهة خلفية افتراضية لبوابة التطبيق.
حفظ مورد الدخول أعلاه كـ ing-azureml-fe.yaml
.
نشر
ing-azureml-fe.yaml
بتشغيل:kubectl apply -f ing-azureml-fe.yaml
تحقق من سجل وحدة تحكم الدخول للوصول لحالة النشر.
الآن يجب أن يكون التطبيق
azureml-fe
متاحًا. يمكنك التحقق من خلال زيارة:- وحدة تحكم دخول Nginx: عنوان LoadBalancer العام لوحدة تحكم دخول Nginx
- بوابة تطبيق Azure: العنوان العام لبوابة التطبيق.
-
إشعار
استبدل ip في scoring_uri بعنوان LoadBalancer العام لوحدة تحكم دخول Nginx قبل الاستدعاء.
كشف الخدمات عبر HTTPS
قبل نشر الدخول، تحتاج إلى إنشاء بيانات سرية لـ kubernetes لاستضافة الشهادة والمفتاح الخاص. يمكنك إنشاء بيانات سرية لـ kubernetes عن طريق تشغيل
kubectl create secret tls <ingress-secret-name> -n azureml --key <path-to-key> --cert <path-to-cert>
تحديد القيم التالية. في الدخول، حدد اسم البيانات السرية في المقطع
secretName
.# Nginx Ingress Controller example apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: azureml-fe namespace: azureml spec: ingressClassName: nginx tls: - hosts: - <domain> secretName: <ingress-secret-name> rules: - host: <domain> http: paths: - path: / backend: service: name: azureml-fe port: number: 80 pathType: Prefix
# Azure Application Gateway example apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: azureml-fe namespace: azureml spec: ingressClassName: azure-application-gateway tls: - hosts: - <domain> secretName: <ingress-secret-name> rules: - host: <domain> http: paths: - path: / backend: service: name: azureml-fe port: number: 80 pathType: Prefix
إشعار
استبدل
<domain>
و<ingress-secret-name>
في مورد الدخول أعلاه بالمجال الذي يشير إلى LoadBalancer لوحدة تحكم دخول Nginx/Application Gateway واسم سرك. تخزين مورد الدخول أعلاه في اسم ملفing-azureml-fe-tls.yaml
.نشر ing-azureml-fe-tls.yaml عن طريق تشغيل
kubectl apply -f ing-azureml-fe-tls.yaml
تحقق من سجل وحدة تحكم الدخول للوصول لحالة النشر.
azureml-fe
الآن التطبيق متاح على HTTPS. يمكنك التحقق من ذلك عن طريق زيارة عنوان LoadBalancer العام لوحدة تحكم دخول Nginx.-
إشعار
استبدل البروتوكول وعنوان IP في scoring_uri ب https والمجال الذي يشير إلى LoadBalancer لوحدة تحكم دخول Nginx أو بوابة التطبيق قبل الاستدعاء.
استخدام قالب ARM لنشر الملحق
يمكن نشر الملحق على نظام المجموعة المدارة باستخدام قالب ARM. يمكن العثور على نموذج قالب من deployextension.json، مع ملف معلمة تجريبي deployextension.parameters.json
لاستخدام نموذج قالب التوزيع، قم بتحرير ملف المعلمة بالقيمة الصحيحة، ثم قم بتشغيل الأمر التالي:
az deployment group create --name <ARM deployment name> --resource-group <resource group name> --template-file deployextension.json --parameters deployextension.parameters.json
يمكن العثور على مزيد من المعلومات حول كيفية استخدام قالب ARM من مستند قالب ARM
ملاحظة إصدار ملحق AzuremML
إشعار
يتم إصدار ميزات جديدة في تقويم نصف أسبوعي.
التاريخ | إصدار | وصف الإصدار |
---|---|---|
21 نوفمبر 2023 | 1.1.39 | الثغرات الأمنية الثابتة. رسالة خطأ محسنة. زيادة الاستقرار لواجهة برمجة تطبيقات خادم الترحيل. |
1 نوفمبر 2023 | 1.1.37 | تحديث إصدار envoy لمستوى البيانات. |
11 أكتوبر 2023 | 1.1.35 | إصلاح الصورة الضعيفة. إصلاحات الأخطاء. |
25 أغسطس 2023 | 1.1.34 | إصلاح الصورة الضعيفة. إرجاع خطأ هوية أكثر تفصيلا. إصلاحات الأخطاء. |
18 يوليو 2023 | 1.1.29 | إضافة أخطاء عامل تشغيل هوية جديدة. إصلاحات الأخطاء. |
4 يونيو 2023 | 1.1.28 | تحسين التحجيم التلقائي للتعامل مع تجمع عقدة متعددة. إصلاحات الأخطاء. |
18 أبريل 2023 | 1.1.26 | إصلاح الأخطاء وإصلاح الثغرات الأمنية. |
27 مارس 2023 | 1.1.25 | إضافة تقييد وظيفة Azure التعلم الآلي. فشل سريع لمهمة التدريب عند فشل إعداد SSH. تقليل الفاصل الزمني لاستخراج Prometheus إلى 30s. تحسين رسائل الخطأ للاستدلال. إصلاح الصورة الضعيفة. |
7 مارس 2023 | 1.1.23 | تغيير نوع المثيل الافتراضي لاستخدام ذاكرة 2Gi. تحديث تكوينات المقاييس لتسجيل النقاط fe التي تضيف 15s scrape_interval. إضافة مواصفات المورد ل mdc sidecar. إصلاح الصورة الضعيفة. إصلاحات الأخطاء. |
14 فبراير 2023 | 1.1.21 | إصلاحات الأخطاء. |
7 فبراير 2023 | 1.1.19 | تحسين رسالة إرجاع الخطأ للاستدلال. تحديث نوع المثيل الافتراضي لاستخدام حد ذاكرة 2Gi. إجراء فحص صحة نظام المجموعة ل pod healthiness وحصة الموارد وإصدار Kubernetes وإصدار الملحق. إصلاح الأخطاء |
27 ديسمبر 2022 | 1.1.17 | انقل Fluent-bit من DaemonSet إلى sidecars. إضافة دعم MDC. تحسين رسائل الخطأ. دعم وظائف وضع نظام المجموعة (windows، linux). إصلاح الأخطاء |
29 نوفمبر 2022 | 1.1.16 | إضافة التحقق من صحة نوع المثيل بواسطة CRD جديد. دعم التسامح. تقصير اسم SVC. ساعة حمل العمل الأساسية. إصلاحات وتحسينات متعددة للأخطاء. |
13 سبتمبر 2022 | 1.1.10 | إصلاحات الأخطاء. |
29 أغسطس 2022 | 1.1.9 | تحسين منطق التحقق من الصحة. إصلاحات الأخطاء. |
23 يونيو 2022 | 1.1.6 | إصلاحات الأخطاء. |
15 يونيو 2022 | 1.1.5 | تدريب محدث لاستخدام وقت تشغيل شائع جديد لتشغيل المهام. تمت إزالة استخدام Azure Relay لملحق AKS. تمت إزالة استخدام ناقل الخدمة من الملحق. استخدام سياق الأمان المحدث. الاستدلال المحدث azureml-fe إلى v2. تم تحديثه لاستخدام بركان كمجدول وظيفة تدريبية. إصلاحات الأخطاء. |
14 أكتوبر 2021 | 1.0.37 | دعم تحميل وحدة تخزين PV/PVC في مهمة تدريب AMLArc. |
16 سبتمبر 2021 | 1.0.29 | مناطق جديدة متاحة، WestUS، CentralUS، NorthCentralUS، KoreaCentral. إمكانية توسيع قائمة انتظار المهام. راجع تفاصيل قائمة انتظار المهمة في Azure التعلم الآلي Workspace Studio. سياسة القتل التلقائي. دعم max_run_duration_seconds في ScriptRunConfig. يحاول النظام إلغاء التشغيل تلقائيا إذا استغرق وقتا أطول من قيمة الإعداد. تحسين الأداء على دعم التحجيم التلقائي لنظام المجموعة. عامل Arc ونشر ملحق التعلم الآلي من سجل الحاوية المحلي. |
24 أغسطس 2021 | 1.0.28 | نوع مثيل الحساب مدعوم في وظيفة YAML. تعيين الهوية المدارة لحساب AMLArc. |
10 أغسطس 2021 | 1.0.20 | دعم توزيع Kubernetes جديد، K3S - Kubernetes خفيف الوزن. انشر ملحق Azure التعلم الآلي إلى نظام مجموعة AKS دون الاتصال عبر Azure Arc. التعلم الآلي التلقائي (AutoML) عبر Python SDK. استخدم 2.0 CLI لإرفاق مجموعة Kubernetes إلى مساحة عمل Azure التعلم الآلي. تحسين استخدام موارد وحدة المعالجة المركزية/الذاكرة لمكونات ملحق Azure التعلم الآلي. |
2 يوليو 2021 | 1.0.13 | دعم توزيعات Kubernetes الجديدة، OpenShift Kubernetes وGKE (محرك Google Kubernetes). دعم التحجيم التلقائي. إذا كان نظام مجموعة Kubernetes المدار من قبل المستخدم يتيح التحجيم التلقائي، يتم توسيع نطاق نظام المجموعة تلقائيا أو توسيع نطاقها وفقا لحجم عمليات التشغيل والنشر النشطة. تحسين الأداء على مشغل الوظيفة، ما يقلل من وقت تنفيذ الوظيفة إلى حد كبير. |