مرجع لتكوين مجموعة Kubernetes للتعلم الآلي من Azure

تحتوي هذه المقالة على معلومات مرجعية لتكوين Kubernetes باستخدام Azure التعلم الآلي.

إصدار Kubernetes المدعوم والمنطقة

  • تحتوي مجموعات Kubernetes التي تقوم بتثبيت ملحق Azure التعلم الآلي على نافذة دعم إصدار من "N-2"، تتم محاذاتها مع نهج دعم إصدار Azure Kubernetes Service (AKS)، حيث "N" هو أحدث إصدار ثانوي GA من خدمة Azure Kubernetes.

    • على سبيل المثال، إذا كانت AKS تقدم 1.20.a اليوم، يتم دعم الإصدارات 1.20.a و1.20.b و1.19.c و1.19.d و1.18.e و1.18.f.

    • إذا كان العملاء يشغلون إصدار Kubernetes غير مدعوم، يطلب منهم الترقية عند طلب دعم نظام المجموعة. لا تغطي نهج دعم ملحق Azure التعلم الآلي أنظمة المجموعات التي تعمل بإصدارات Kubernetes غير المدعومة.

  • توفر منطقة ملحق Azure التعلم الآلي:

    • يمكن نشر ملحق Azure التعلم الآلي إلى AKS أو Kubernetes الممكن ل Azure Arc في المناطق المدعومة المدرجة في دعم منطقة Kubernetes الممكنة في Azure Arc.

عند نشر ملحق Azure التعلم الآلي، يتم نشر بعض الخدمات ذات الصلة إلى مجموعة Kubernetes الخاصة بك ل Azure التعلم الآلي. يسرد الجدول التالي الخدمات ذات الصلة واستخدام الموارد الخاصة بها في نظام المجموعة:

توزيع/Daemonset النسخه المتماثله # التدريب الاستدلال طلب وحدة المعالجة المركزية (m) حد وحدة المعالجة المركزية (m) طلب الذاكرة (Mi) حد الذاكرة (Mi)
metrics-controller-manager 1 10 100 20 300
عامل تشغيل prometheus 1 100 400 128 512
بروميثيوس 1 100 1000 512 4096
kube-state-metrics 1 10 100 32 256
بوابة 1 50 500 256 2048
fluent-bit 1 لكل عقدة 10 200 100 300
inference-operator-controller-manager 1 ‏‫غير متوفر‬ 100 1000 128 1024
amlarc-identity-controller 1 ‏‫غير متوفر‬ 200 1000 200 1024
amlarc-identity-proxy 1 ‏‫غير متوفر‬ 200 1000 200 1024
azureml-ingress-nginx-controller 1 ‏‫غير متوفر‬ 100 1000 64 512
azureml-fe-v2 1 (لغرض الاختبار)
أو
3 (لغرض الإنتاج)
‏‫غير متوفر‬ 900 2000 800 1200
النشر عبر الإنترنت 1 لكل نشر تم إنشاء المستخدم ‏‫غير متوفر‬ <تعريف المستخدم> <تعريف المستخدم> <تعريف المستخدم> <تعريف المستخدم>
التوزيع عبر الإنترنت/الهوية الجانبية 1 لكل نشر ‏‫غير متوفر‬ 10 50 100 100
aml-operator 1 ‏‫غير متوفر‬ 20 1020 124 2168
volcano-admission 1 ‏‫غير متوفر‬ 10 100 64 256
وحدة التحكم في البركان 1 ‏‫غير متوفر‬ 50 500 128 512
مخطط بركاني 1 ‏‫غير متوفر‬ 50 500 128 512

باستثناء عمليات النشر/القرون الخاصة بك، فإن الحد الأدنى الإجمالي لمتطلبات موارد النظام كما يلي:

السيناريو الاستدلال الممكن التدريب الممكن طلب وحدة المعالجة المركزية (m) حد وحدة المعالجة المركزية (m) طلب الذاكرة (Mi) حد الذاكرة (Mi) حساب العقدة الحد الأدنى الموصى به لحجم الجهاز الظاهري وحدة حفظ المخزون المقابلة لجهاز AKS الظاهري
للاختبار ‏‫غير متوفر‬ 1780 8300 2440 12296 عقدة واحدة 2 وحدة معالجة مركزية افتراضية، ذاكرة 7 غيغابايت، 6400 IOPS، 1500 ميغابت في الثانية BW DS2v2
للاختبار ‏‫غير متوفر‬ 410 4420 1492 10960 عقدة واحدة 2 وحدة معالجة مركزية افتراضية، ذاكرة 7 غيغابايت، 6400 IOPS، 1500 ميغابت في الثانية BW DS2v2
للاختبار 1910 10420 2884 15744 عقدة واحدة 4 وحدات معالجة مركزية افتراضية، ذاكرة 14 غيغابايت، 12800 IOPS، 1500 ميجابت في الثانية BW DS3v2
للإنتاج ‏‫غير متوفر‬ 3600 12700 4240 15296 3 عقدة (عقد) 4 وحدات معالجة مركزية افتراضية، ذاكرة 14 غيغابايت، 12800 IOPS، 1500 ميجابت في الثانية BW DS3v2
للإنتاج ‏‫غير متوفر‬ 410 4420 1492 10960 عقدة (عقد) واحدة 8 وحدات معالجة مركزية افتراضية، 28 غيغابايت Memroy، 25600 IOPs، 6000 ميجابت في الثانية BW DS4v2
للإنتاج 3730 14820 4684 18744 3 عقدة (عقد) 4 وحدات معالجة مركزية افتراضية، ذاكرة 14 غيغابايت، 12800 IOPS، 1500 ميجابت في الثانية BW DS4v2

إشعار

  • لغرض الاختبار، يجب عليك الرجوع إلى طلب المورد tp.
  • لغرض الإنتاج، يجب الرجوع إلى حد الموارد.

هام

فيما يلي بعض الاعتبارات الأخرى للرجوع إليها:

  • للحصول على عرض نطاق ترددي أعلى للشبكة وتحسين أداء إدخال/إخراج القرص، نوصي ب SKU أكبر.
    • خذ DV2/DSv2 على سبيل المثال، يمكن أن يقلل استخدام SKU الكبير من وقت سحب الصورة للحصول على أداء أفضل للشبكة/التخزين.
    • يمكن العثور على مزيد من المعلومات حول حجز AKS في حجز AKS.
  • إذا كنت تستخدم نظام مجموعة AKS، فقد تحتاج إلى التفكير في حد الحجم على صورة حاوية في AKS، والمزيد من المعلومات التي يمكنك العثور عليها في حد حجم صورة حاوية AKS.

المتطلبات الأساسية لمجموعات ARO أو OCP

تعطيل Security Enhanced Linux (SELinux)

مجموعة بيانات Azure التعلم الآلي (ميزة SDK v1 المستخدمة في مهام تدريب Azure التعلم الآلي) غير مدعومة على الأجهزة مع تمكين SELinux. لذلك، تحتاج إلى تعطيل selinux على جميع العمال من أجل استخدام مجموعة بيانات Azure التعلم الآلي.

الإعداد المتميز لـ ARO وOCP

بالنسبة إلى نشر ملحق Azure التعلم الآلي على مجموعة ARO أو OCP، امنح حق الوصول المتميز إلى حسابات خدمة Azure التعلم الآلي، وقم بتشغيل oc edit scc privileged الأمر، وأضف حسابات الخدمة التالية ضمن "users:":

  • system:serviceaccount:azure-arc:azure-arc-kube-aad-proxy-sa
  • system:serviceaccount:azureml:{EXTENSION-NAME}-kube-state-metrics
  • system:serviceaccount:azureml:prom-admission
  • system:serviceaccount:azureml:default
  • system:serviceaccount:azureml:prom-operator
  • system:serviceaccount:azureml:load-amlarc-selinux-policy-sa
  • system:serviceaccount:azureml:azureml-fe-v2
  • system:serviceaccount:azureml:prom-prometheus
  • system:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default
  • system:serviceaccount:azureml:azureml-ingress-nginx
  • system:serviceaccount:azureml:azureml-ingress-nginx-admission

إشعار

  • {EXTENSION-NAME}: هو اسم الملحق المحدد بأمر CLI az k8s-extension create --name.
  • {KUBERNETES-COMPUTE-NAMESPACE}: هي مساحة اسم حساب Kubernetes المحدد عند إرفاق الحساب بمساحة عمل التعلم الآلي من Azure. تخطي التكوين system:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default إذا كان KUBERNETES-COMPUTE-NAMESPACE هو default.

تفاصيل السجل المجمعة

سيتم جمع بعض السجلات حول أحمال عمل Azure التعلم الآلي في نظام المجموعة من خلال مكونات الامتداد، مثل الحالة والمقاييس ودورة الحياة وما إلى ذلك. تعرض القائمة التالية جميع تفاصيل السجل التي تم جمعها، بما في ذلك نوع السجلات التي تم جمعها ومكان إرسالها أو تخزينها.

وحدة Resource description معلومات تسجيل التفاصيل
amlarc-identity-controller طلب وتجديد الرمز المميز Azure Blob/Azure Container Registry من خلال الهوية المُدارة. يستخدم فقط عند enableInference=true تعيين عند تثبيت الملحق. يحتوي على سجلات تتبع للحالة على الحصول على هوية لنقاط النهاية للمصادقة مع خدمة Azure التعلم الآلي.
amlarc-identity-proxy طلب وتجديد الرمز المميز Azure Blob/Azure Container Registry من خلال الهوية المُدارة. يستخدم فقط عند enableInference=true تعيين عند تثبيت الملحق. يحتوي على سجلات تتبع للحالة على الحصول على هوية لنظام المجموعة للمصادقة مع خدمة Azure التعلم الآلي.
aml-operator إدارة دورة حياة وظائف التدريب. تحتوي السجلات على Azure التعلم الآلي حالة جراب مهمة التدريب في نظام المجموعة.
azureml-fe-v2 مكون الواجهة الأمامية الذي يوجه طلبات الاستدلال الواردة إلى الخدمات المنشورة. الوصول إلى السجلات على مستوى الطلب، بما في ذلك معرف الطلب ووقت البدء ورمز الاستجابة وتفاصيل الخطأ ومدد زمن انتقال الطلب. تتبع السجلات لتغييرات بيانات تعريف الخدمة، والخدمة التي تعمل بالحالة الصحية، وما إلى ذلك لغرض تصحيح الأخطاء.
بوابة تستخدم البوابة للتواصل وإرسال البيانات ذهاباً وإياباً. تتبع سجلات الطلبات من خدمات Azure التعلم الآلي إلى المجموعات.
التحقق من الصحة -- تحتوي السجلات على azureml حالة مورد مساحة الاسم (ملحق Azure التعلم الآلي) لتشخيص ما يجعل الملحق غير وظيفي.
inference-operator-controller-manager إدارة دورة حياة نقاط نهاية الاستدلال. تحتوي السجلات على Azure التعلم الآلي نقطة نهاية الاستدلال وحالة جراب النشر في نظام المجموعة.
metrics-controller-manager إدارة التكوين ل Prometheus. تتبع السجلات لحالة تحميل مهمة التدريب ومقاييس توزيع الاستدلال على استخدام وحدة المعالجة المركزية واستخدام الذاكرة.
خادم الترحيل خادم الترحيل مطلوب فقط في نظام المجموعة المتصل ب arc ولن يتم تثبيته في نظام مجموعة AKS. يعمل خادم الترحيل مع Azure Relay للتواصل مع الخدمات السحابية. تحتوي السجلات على معلومات مستوى الطلب من Azure relay.

تتصل وظائف Azure التعلم الآلي بتخزين البيانات المخصص

وحدة التخزين الثابتة (PV) ومطالبة وحدة التخزين الدائمة (PVC) هما أحد مفاهيم Kubernetes، ما يسمح للمستخدم بتوفير موارد تخزين مختلفة واستهلاكها.

  1. لإنشاء PV، خذ NFS على سبيل المثال،
apiVersion: v1
kind: PersistentVolume
metadata:
  name: nfs-pv 
spec:
  capacity:
    storage: 1Gi 
  accessModes:
    - ReadWriteMany 
  persistentVolumeReclaimPolicy: Retain
  storageClassName: ""
  nfs: 
    path: /share/nfs
    server: 20.98.110.84 
    readOnly: false
  1. إنشاء PVC في نفس مساحة اسم Kubernetes مع أحمال عمل التعلم الآلي. في metadata، يجب إضافة تسمية ml.azure.com/pvc: "true" ليتم التعرف عليها بواسطة Azure التعلم الآلي، وإضافة تعليق توضيحي ml.azure.com/mountpath: <mount path> لتعيين مسار التحميل.
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: nfs-pvc  
  namespace: default
  labels:
    ml.azure.com/pvc: "true"
  annotations:
    ml.azure.com/mountpath: "/mnt/nfs"
spec:
  storageClassName: ""
  accessModes:
  - ReadWriteMany      
  resources:
     requests:
       storage: 1Gi

هام

  • تدعم مهمة/مكون الأمر ومهمة/مكون محرك الأقراص الفائق ونشر الدفعات تخزين البيانات المخصصة من PVC(s). > * لا تدعم نقطة النهاية عبر الإنترنت في الوقت الحقيقي ومهمة AutoML ووظيفة PRS تخزين البيانات المخصصة من PVC(s).
  • بالإضافة إلى ذلك، سيتم تحميل وحدة التخزين فقط في نفس مساحة اسم Kubernetes مع PVC(s). لعالم البيانات الحق في الوصول إلى mount path المحدد في التعليق التوضيحي PVC في الوظيفة. لن يكون لوظيفة AutoML ووظيفة Prs حق الوصول إلى PVC (PVC).

العيوب والتفاوتات المدعومة في Azure التعلم الآلي

Taint وتسامح هي مفاهيم Kubernetes التي تعمل معا لضمان عدم جدولة القرون على العقد غير المناسبة.

تدعم مجموعات Kubernetes المتكاملة مع Azure التعلم الآلي (بما في ذلك مجموعات AKS وArc Kubernetes) الآن تلطخات وتفاوتات Azure التعلم الآلي محددة، مما يسمح للمستخدمين بإضافة صبغات Azure التعلم الآلي معينة على العقد المخصصة التعلم الآلي Azure، لمنع غير Azure التعلم الآلي جدولة أحمال العمل على هذه العقد المخصصة.

نحن ندعم فقط وضع العيوب الخاصة بال amlarc على العقد الخاصة بك، والتي يتم تعريفها على النحو التالي:

العيب مفتاح القيمة التأثير ‏‏الوصف
amlarc بشكل عام ml.azure.com/amlarc صحيح NoSchedule، NoExecute أو PreferNoSchedule ستتسامح جميع أحمال عمل Azure التعلم الآلي، بما في ذلك جرابات خدمة نظام الملحقات ووحدات أحمال عمل التعلم الآلي مع هذا amlarc overall التلوث.
نظام amlarc ml.azure.com/amlarc-system صحيح NoSchedule، NoExecute أو PreferNoSchedule فقط Azure التعلم الآلي خدمات نظام ملحق pods ستتسامح مع هذا amlarc system الصبغة.
حمل عمل amlarc ml.azure.com/amlarc-workload صحيح NoSchedule، NoExecute أو PreferNoSchedule يمكن أن تتحمل وحدات حمل عمل التعلم الآلي فقط هذه amlarc workload الصبغة.
مجموعة موارد amlarc ml.azure.com/resource-group <اسم مجموعة الموارد> NoSchedule، NoExecute أو PreferNoSchedule لن تتحمل هذه amlarc resource group الصبغة سوى وحدات أحمال عمل التعلم الآلي التي تم إنشاؤها من مجموعة الموارد المحددة.
مساحة عمل amlarc ml.azure.com/workspace <اسم مساحة العمل> NoSchedule، NoExecute أو PreferNoSchedule لن تتحمل هذه amlarc workspace الصبغة سوى وحدات أحمال عمل التعلم الآلي التي تم إنشاؤها من مساحة العمل المحددة.
حساب amlarc ml.azure.com/compute <اسم الحساب> NoSchedule، NoExecute أو PreferNoSchedule لن تتحمل هذه amlarc compute الصبغة سوى وحدات أحمال عمل التعلم الآلي التي تم إنشاؤها باستخدام هدف الحوسبة المحدد.

تلميح

  1. بالنسبة إلى Azure Kubernetes Service (AKS)، يمكنك اتباع المثال في أفضل الممارسات لميزات المجدول المتقدمة في خدمة Azure Kubernetes (AKS) لتطبيق الصبغات على تجمعات العقد.
  2. بالنسبة لمجموعات Arc Kubernetes، مثل مجموعات Kubernetes المحلية، يمكنك استخدام kubectl taint الأمر لإضافة العيوب إلى العقد. لمزيد من الأمثلة، راجع وثائق Kubernetes.

أفضل الممارسات

وفقا لمتطلبات الجدولة للعقد المخصصة التعلم الآلي Azure، يمكنك إضافة العديد من العيوب الخاصة بال amlarc لتقييد ما يمكن أن تعمل عليه أحمال عمل Azure التعلم الآلي على العقد. ندرج أفضل الممارسات لاستخدام الصبغات الأملرية:

  • لمنع أحمال العمل غير التابعة ل Azure التعلم الآلي من العمل على العقد/تجمعات العقد المخصصة التعلم الآلي Azure، يمكنك فقط إضافة الصبغة aml overall إلى هذه العقد.
  • لمنع تشغيل القرون غير النظامية على العقد/تجمعات العقد المخصصة التعلم الآلي Azure، يجب إضافة العيوب التالية:
    • amlarc overall العيب
    • amlarc system العيب
  • لمنع أحمال العمل غير ml من العمل على العقد/تجمعات العقد المخصصة التعلم الآلي Azure، يجب عليك إضافة العيوب التالية:
    • amlarc overall العيب
    • amlarc workloads العيب
  • لمنع أحمال العمل التي لم يتم إنشاؤها من مساحة العمل X من العمل على العقد/تجمعات العقد المخصصة ل Azure التعلم الآلي، يجب إضافة العيوب التالية:
    • amlarc overall العيب
    • amlarc resource group (has this <workspace X>) العيب
    • amlarc <workspace X> العيب
  • لمنع أحمال العمل التي لم يتم إنشاؤها بواسطة حساب الهدف X من العمل على العقد/تجمعات العقد المخصصة التعلم الآلي Azure، يجب عليك إضافة العيوب التالية:
    • amlarc overall العيب
    • amlarc resource group (has this <workspace X>) العيب
    • amlarc workspace (has this <compute X>) العيب
    • amlarc <compute X> العيب

دمج وحدة تحكم الدخول الأخرى مع ملحق Azure التعلم الآلي عبر HTTP أو HTTPS

بالإضافة إلى موازن تحميل الاستدلال الافتراضي Azure التعلم الآلي azureml-fe، يمكنك أيضا دمج موازنات التحميل الأخرى مع ملحق Azure التعلم الآلي عبر HTTP أو HTTPS.

يساعد هذا البرنامج التعليمي على توضيح كيفية دمج وحدة تحكم دخول Nginx أو بوابة تطبيق Azure.

المتطلبات الأساسية

  • انشر ملحق Azure التعلم الآلي مع inferenceRouterServiceType=ClusterIP وallowInsecureConnections=True، بحيث يمكن لوحدة تحكم الدخول Nginx معالجة إنهاء TLS بنفسها بدلا من تسليمها إلى azureml-fe عند عرض الخدمة عبر HTTPS.
  • للتكامل مع وحدة تحكم دخول Nginx، تحتاج إلى إعداد مجموعة Kubernetes مع وحدة تحكم دخول Nginx.
  • للتكامل مع Azure Application Gateway، تحتاج إلى إعداد مجموعة Kubernetes مع وحدة تحكم دخول بوابة تطبيق Azure.
    • Greenfield Deployment: إذا كنت تبدأ من الصفر، فراجع هذه الإرشادات.
    • Brownfield Deployment: إذا كان لديك مجموعة AKS موجودة وبوابة التطبيق، فراجع هذه الإرشادات.
  • إذا كنت ترغب في استخدام HTTPS على هذا التطبيق، فأنت بحاجة إلى شهادة x509 ومفتاحها الخاص.

كشف الخدمات عبر HTTP

من أجل كشف azureml-fe، سنستخدم مورد الدخول التالي:

# Nginx Ingress Controller example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: azureml-fe
  namespace: azureml
spec:
  ingressClassName: nginx
  rules:
  - http:
      paths:
      - path: /
        backend:
          service:
            name: azureml-fe
            port:
              number: 80
        pathType: Prefix

يعرض azureml-fe هذا الدخول الخدمة والنشر المحدد كواجهة خلفية افتراضية لوحدة تحكم دخول Nginx.

# Azure Application Gateway example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: azureml-fe
  namespace: azureml
spec:
  ingressClassName: azure-application-gateway
  rules:
  - http:
      paths:
      - path: /
        backend:
          service:
            name: azureml-fe
            port:
              number: 80
        pathType: Prefix

يعرض azureml-fe هذا الدخول الخدمة والنشر المحدد كواجهة خلفية افتراضية لبوابة التطبيق.

حفظ مورد الدخول أعلاه كـ ing-azureml-fe.yaml.

  1. نشر ing-azureml-fe.yaml بتشغيل:

    kubectl apply -f ing-azureml-fe.yaml
    
  2. تحقق من سجل وحدة تحكم الدخول للوصول لحالة النشر.

  3. الآن يجب أن يكون التطبيق azureml-fe متاحًا. يمكنك التحقق من خلال زيارة:

    • وحدة تحكم دخول Nginx: عنوان LoadBalancer العام لوحدة تحكم دخول Nginx
    • بوابة تطبيق Azure: العنوان العام لبوابة التطبيق.
  4. إنشاء مهمة استدلال واستدعاء.

    إشعار

    استبدل ip في scoring_uri بعنوان LoadBalancer العام لوحدة تحكم دخول Nginx قبل الاستدعاء.

كشف الخدمات عبر HTTPS

  1. قبل نشر الدخول، تحتاج إلى إنشاء بيانات سرية لـ kubernetes لاستضافة الشهادة والمفتاح الخاص. يمكنك إنشاء بيانات سرية لـ kubernetes عن طريق تشغيل

    kubectl create secret tls <ingress-secret-name> -n azureml --key <path-to-key> --cert <path-to-cert>
    
  2. تحديد القيم التالية. في الدخول، حدد اسم البيانات السرية في المقطع secretName.

    # Nginx Ingress Controller example
    apiVersion: networking.k8s.io/v1
    kind: Ingress
    metadata:
      name: azureml-fe
      namespace: azureml
    spec:
      ingressClassName: nginx
      tls:
      - hosts:
        - <domain>
        secretName: <ingress-secret-name>
      rules:
      - host: <domain>
        http:
          paths:
          - path: /
            backend:
              service:
                name: azureml-fe
                port:
                  number: 80
            pathType: Prefix
    
    # Azure Application Gateway example
    apiVersion: networking.k8s.io/v1
    kind: Ingress
    metadata:
      name: azureml-fe
      namespace: azureml
    spec:
      ingressClassName: azure-application-gateway
      tls:
      - hosts:
        - <domain>
        secretName: <ingress-secret-name>
      rules:
      - host: <domain>
        http:
          paths:
          - path: /
            backend:
              service:
                name: azureml-fe
                port:
                  number: 80
            pathType: Prefix
    

    إشعار

    استبدل <domain> و <ingress-secret-name> في مورد الدخول أعلاه بالمجال الذي يشير إلى LoadBalancer لوحدة تحكم دخول Nginx/Application Gateway واسم سرك. تخزين مورد الدخول أعلاه في اسم ملف ing-azureml-fe-tls.yaml.

  3. نشر ing-azureml-fe-tls.yaml عن طريق تشغيل

    kubectl apply -f ing-azureml-fe-tls.yaml
    
  4. تحقق من سجل وحدة تحكم الدخول للوصول لحالة النشر.

  5. azureml-fe الآن التطبيق متاح على HTTPS. يمكنك التحقق من ذلك عن طريق زيارة عنوان LoadBalancer العام لوحدة تحكم دخول Nginx.

  6. إنشاء مهمة استدلال واستدعاء.

    إشعار

    استبدل البروتوكول وعنوان IP في scoring_uri ب https والمجال الذي يشير إلى LoadBalancer لوحدة تحكم دخول Nginx أو بوابة التطبيق قبل الاستدعاء.

استخدام قالب ARM لنشر الملحق

يمكن نشر الملحق على نظام المجموعة المدارة باستخدام قالب ARM. يمكن العثور على نموذج قالب من deployextension.json، مع ملف معلمة تجريبي deployextension.parameters.json

لاستخدام نموذج قالب التوزيع، قم بتحرير ملف المعلمة بالقيمة الصحيحة، ثم قم بتشغيل الأمر التالي:

az deployment group create --name <ARM deployment name> --resource-group <resource group name> --template-file deployextension.json --parameters deployextension.parameters.json

يمكن العثور على مزيد من المعلومات حول كيفية استخدام قالب ARM من مستند قالب ARM

ملاحظة إصدار ملحق AzuremML

إشعار

يتم إصدار ميزات جديدة في تقويم نصف أسبوعي.

التاريخ إصدار وصف الإصدار
21 نوفمبر 2023 1.1.39 الثغرات الأمنية الثابتة. رسالة خطأ محسنة. زيادة الاستقرار لواجهة برمجة تطبيقات خادم الترحيل.
1 نوفمبر 2023 1.1.37 تحديث إصدار envoy لمستوى البيانات.
11 أكتوبر 2023 1.1.35 إصلاح الصورة الضعيفة. إصلاحات الأخطاء.
25 أغسطس 2023 1.1.34 إصلاح الصورة الضعيفة. إرجاع خطأ هوية أكثر تفصيلا. إصلاحات الأخطاء.
18 يوليو 2023 1.1.29 إضافة أخطاء عامل تشغيل هوية جديدة. إصلاحات الأخطاء.
4 يونيو 2023 1.1.28 تحسين التحجيم التلقائي للتعامل مع تجمع عقدة متعددة. إصلاحات الأخطاء.
18 أبريل 2023 1.1.26 إصلاح الأخطاء وإصلاح الثغرات الأمنية.
27 مارس 2023 1.1.25 إضافة تقييد وظيفة Azure التعلم الآلي. فشل سريع لمهمة التدريب عند فشل إعداد SSH. تقليل الفاصل الزمني لاستخراج Prometheus إلى 30s. تحسين رسائل الخطأ للاستدلال. إصلاح الصورة الضعيفة.
7 مارس 2023 1.1.23 تغيير نوع المثيل الافتراضي لاستخدام ذاكرة 2Gi. تحديث تكوينات المقاييس لتسجيل النقاط fe التي تضيف 15s scrape_interval. إضافة مواصفات المورد ل mdc sidecar. إصلاح الصورة الضعيفة. إصلاحات الأخطاء.
14 فبراير 2023 1.1.21 إصلاحات الأخطاء.
7 فبراير 2023 1.1.19 تحسين رسالة إرجاع الخطأ للاستدلال. تحديث نوع المثيل الافتراضي لاستخدام حد ذاكرة 2Gi. إجراء فحص صحة نظام المجموعة ل pod healthiness وحصة الموارد وإصدار Kubernetes وإصدار الملحق. إصلاح الأخطاء
27 ديسمبر 2022 1.1.17 انقل Fluent-bit من DaemonSet إلى sidecars. إضافة دعم MDC. تحسين رسائل الخطأ. دعم وظائف وضع نظام المجموعة (windows، linux). إصلاح الأخطاء
29 نوفمبر 2022 1.1.16 إضافة التحقق من صحة نوع المثيل بواسطة CRD جديد. دعم التسامح. تقصير اسم SVC. ساعة حمل العمل الأساسية. إصلاحات وتحسينات متعددة للأخطاء.
13 سبتمبر 2022 1.1.10 إصلاحات الأخطاء.
29 أغسطس 2022 1.1.9 تحسين منطق التحقق من الصحة. إصلاحات الأخطاء.
23 يونيو 2022 1.1.6 إصلاحات الأخطاء.
15 يونيو 2022 1.1.5 تدريب محدث لاستخدام وقت تشغيل شائع جديد لتشغيل المهام. تمت إزالة استخدام Azure Relay لملحق AKS. تمت إزالة استخدام ناقل الخدمة من الملحق. استخدام سياق الأمان المحدث. الاستدلال المحدث azureml-fe إلى v2. تم تحديثه لاستخدام بركان كمجدول وظيفة تدريبية. إصلاحات الأخطاء.
14 أكتوبر 2021 1.0.37 دعم تحميل وحدة تخزين PV/PVC في مهمة تدريب AMLArc.
16 سبتمبر 2021 1.0.29 مناطق جديدة متاحة، WestUS، CentralUS، NorthCentralUS، KoreaCentral. إمكانية توسيع قائمة انتظار المهام. راجع تفاصيل قائمة انتظار المهمة في Azure التعلم الآلي Workspace Studio. سياسة القتل التلقائي. دعم max_run_duration_seconds في ScriptRunConfig. يحاول النظام إلغاء التشغيل تلقائيا إذا استغرق وقتا أطول من قيمة الإعداد. تحسين الأداء على دعم التحجيم التلقائي لنظام المجموعة. عامل Arc ونشر ملحق التعلم الآلي من سجل الحاوية المحلي.
24 أغسطس 2021 1.0.28 نوع مثيل الحساب مدعوم في وظيفة YAML. تعيين الهوية المدارة لحساب AMLArc.
10 أغسطس 2021 1.0.20 دعم توزيع Kubernetes جديد، K3S - Kubernetes خفيف الوزن. انشر ملحق Azure التعلم الآلي إلى نظام مجموعة AKS دون الاتصال عبر Azure Arc. التعلم الآلي التلقائي (AutoML) عبر Python SDK. استخدم 2.0 CLI لإرفاق مجموعة Kubernetes إلى مساحة عمل Azure التعلم الآلي. تحسين استخدام موارد وحدة المعالجة المركزية/الذاكرة لمكونات ملحق Azure التعلم الآلي.
2 يوليو 2021 1.0.13 دعم توزيعات Kubernetes الجديدة، OpenShift Kubernetes وGKE (محرك Google Kubernetes). دعم التحجيم التلقائي. إذا كان نظام مجموعة Kubernetes المدار من قبل المستخدم يتيح التحجيم التلقائي، يتم توسيع نطاق نظام المجموعة تلقائيا أو توسيع نطاقها وفقا لحجم عمليات التشغيل والنشر النشطة. تحسين الأداء على مشغل الوظيفة، ما يقلل من وقت تنفيذ الوظيفة إلى حد كبير.