مشاركة عبر


مرجع CLI المحلي من Foundry

مهم

  • يتوفر Foundry Local في المعاينة. توفر إصدارات المعاينة العامة access مبكرا إلى الميزات التي يتم نشرها بنشاط.
  • يمكن أن تتغير الميزات والنهج والعمليات أو لديها قدرات محدودة، قبل التوفر العام (GA).

توفر هذه المقالة مرجعا شاملا لواجهة سطر أوامر Foundry Local (CLI). ينظم CLI الأوامر في فئات منطقية لمساعدتك في إدارة النماذج والتحكم في الخدمة والحفاظ على ذاكرة التخزين المؤقت المحلية.

المتطلبات المسبقه

  • قم بتثبيت Foundry Local. لخطوات الإعداد، راجع Get started مع Foundry Local.
  • استخدم محطة محلية حيث تتوفر تقنية foundry الاستخبارات (CLI).
  • تأكد من وجود access إنترنت للتنزيلات لأول مرة (مزودي التنفيذ والنماذج).
  • Azure RBAC: غير قابل للتطبيق (يعمل محليا).
  • إذا كان لديك وحدة معالجة إنتل على ويندوز، قم بتثبيت برنامج تشغيل Intel NPU لتسريع أفضل لوحدة NPU.

تحقق سريع

شغل هذه الأوامر للتأكد من تثبيت مؤشر الأوامر وأن الخدمة قابلة للوصول.

  1. اعرض المساعدة في CLI:

     foundry --help
    

    يقوم هذا الأمر بطباعة معلومات الاستخدام وقائمة مجموعات الأوامر المتاحة.

    المصدر: نظرة عامة

  2. تحقق من حالة الخدمة:

     foundry service status
    

    تطبع هذه الأوامر ما إذا كانت خدمة Foundry Local تعمل وتشمل نقطة النهاية المحلية.

    المرجع: أوامر الخدمة

نظرة عامة

استخدم المساعدة المدمجة لاستكشاف الأوامر والخيارات.

ينظم CLI الأوامر في ثلاث فئات رئيسية:

  • النموذج: أوامر لإدارة وتشغيل نماذج الذكاء الاصطناعي
  • الخدمة: أوامر للتحكم في خدمة Foundry المحلية
  • Cache: أوامر لإدارة نموذج النموذج المحلي الخاص بك storage

أوامر النموذج

يلخص الجدول التالي الأوامر المتعلقة بإدارة النماذج وتشغيلها:

‏‫ملاحظة‬

يمكنك تحديد الوسيطة model بواسطة الاسم المستعار أو معرف النموذج الخاص بها. باستخدام اسم مستعار:

  • يختار تلقائيا أفضل موديل للأجهزة المتاحة لديك. على سبيل المثال، إذا كان لديك بطاقة رسومات Nvidia متاحة، يختار Foundry Local أفضل طراز من بطاقة الرسوميات. إذا كان لديك وحدة معالجة NPU مدعومة متوفرة، يحدد Foundry Local نموذج NPU.
  • يتيح لك استخدام اسم أقصر دون الحاجة إلى تذكر معرف الطراز.

إذا كنت تريد تشغيل نموذج معين، فاستخدم معرف النموذج. على سبيل المثال، لتشغيل على وحدة المعالجة qwen2.5-0.5b المركزية - بغض النظر عن الأجهزة المتوفرة لديك - استخدم: foundry model run qwen2.5-0.5b-instruct-generic-cpu.

الأمر الوصف
foundry model --help يعرض جميع الأوامر المتوفرة المتعلقة بالنموذج واستخدامها.
foundry model run <model> تشغيل نموذج محدد وتنزيله إذا لم يتم تخزينه مؤقتا وبدء التفاعل.
foundry model list يسرد جميع النماذج المتوفرة للاستخدام المحلي. في التشغيل الأول ، يقوم بتنزيل موفري التنفيذ (EPs) لأجهزتك.
foundry model list --filter <key>=<value> يسرد النماذج التي تمت تصفيتها حسب المعايير المحددة (الجهاز ، المهمة ، الاسم المستعار ، الموفر).
foundry model info <model> عرض معلومات مفصلة حول نموذج معين.
foundry model info <model> --license عرض معلومات الترخيص لنموذج معين.
foundry model download <model> تنزيل نموذج إلى ذاكرة التخزين المؤقت المحلية دون تشغيله.
foundry model load <model> تحميل نموذج في الخدمة.
foundry model unload <model> إلغاء تحميل نموذج من الخدمة.

ترتيب قائمة النماذج

عندما تتوفر عدة نسخ من معرف النموذج لاسم مستعار، تعرض قائمة النماذج النماذج بترتيب الأولوية. النموذج الأول في القائمة هو النموذج الذي يعمل عندما تحدد النموذج بواسطة alias.

تصفية قائمة النماذج

يدعم الأمر foundry model list تصفية النماذج باستخدام --filter الخيار. يمكنك تصفية النماذج بناء على سمة واحدة باستخدام أزواج القيم المفتاحية.

foundry model list --filter <key>=<value>

يقوم هذا الأمر بطباعة نماذج تطابق مفتاح الفلتر والقيمة.

المرجع: تصفية قوائم النماذج

‏‫ملاحظة‬

عند التشغيل foundry model list لأول مرة بعد التثبيت، يقوم Foundry Local تلقائيا بتنزيل موفري التنفيذ (EPs) المعنيين لتكوين أجهزة جهازك. ترى شريط تقدم يشير إلى اكتمال التنزيل قبل ظهور قائمة النماذج.

مفاتيح التصفية المدعومة:

device - نوع الجهاز

تصفية النماذج حسب الجهاز الذي تعمل عليه.

القيم المحتملة:

  • CPU - نماذج وحدات المعالجة المركزية
  • GPU - نماذج وحدات معالجة الرسوميات
  • NPU - نماذج وحدات المعالجة العصبية

مزود - مزود التنفيذ

يقوم بتصفية النماذج حسب مزود التنفيذ أو وقت التشغيل.

القيم المحتملة:

  • CPUExecutionProvider - التنفيذ المستند إلى وحدة المعالجة المركزية
  • CUDAExecutionProvider - تنفيذ وحدة معالجة الرسومات NVIDIA CUDA
  • WebGpuExecutionProvider - تنفيذ WebGPU
  • QNNExecutionProvider - تنفيذ شبكة كوالكوم العصبية (NPU)
  • OpenVINOExecutionProvider - تنفيذ Intel OpenVINO
  • NvTensorRTRTXExecutionProvider - تنفيذ NVIDIA TensorRT
  • VitisAIExecutionProvider - تنفيذ AMD Vitis الذكاء الاصطناعي

المهمة - نوع مهمة النموذج

يقوم بتصفية النماذج حسب حالة الاستخدام أو المهمة المقصودة.

القيم المشتركة:

  • chat-completionنماذج الذكاء الاصطناعي للمحادثة:
  • text-generationنماذج إنشاء النصوص:

الاسم المستعار - الاسم المستعار للنموذج

تصفية النماذج حسب معرف الاسم المستعار الخاص بها. يدعم مطابقة أحرف البدل مع * الللاحقة.

قيم العينة:

  • phi4-cpu
  • qwen2.5-coder-0.5b-instruct-generic-cpu
  • deepseek-r1-distill-qwen-1.5b-generic-cpu
  • phi-4-mini-instruct-generic-cpu

ميزات التصفية الخاصة

دعم النفي: بادئة أي قيمة مع ! لاستبعاد النماذج المطابقة.

foundry model list --filter device=!GPU

هذا الأمر يستبعد نماذج وحدات معالجة الرسومات من النتائج.

مرجع: ميزات خاصية للمرشحات

مطابقة أحرف البدل (الاسم المستعار فقط): إلحاق * البادئات بمطابقتها عند التصفية بالاسم المستعار.

foundry model list --filter alias=qwen*

تعيد هذه الأوامر نماذج يبدأ اسمها المستعار ب qwen.

مرجع: ميزات خاصية للمرشحات

الأمثلة

foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider

تقوم هذه الأمثلة بتصفية قائمة النماذج حسب الجهاز أو المهمة أو مزود التنفيذ.

المرجع: تصفية قوائم النماذج

‏‫ملاحظة‬

  • جميع المقارنات غير حساسة لحالة الأحرف.
  • يمكن استخدام مرشح واحد فقط لكل أمر.
  • تؤدي مفاتيح التصفية غير المعروفة إلى حدوث خطأ.

أوامر الخدمة

يلخص الجدول التالي الأوامر المتعلقة بإدارة وتشغيل خدمة Foundry المحلية:

الأمر الوصف
foundry service --help يعرض جميع الأوامر المتوفرة المتعلقة بالخدمة واستخدامها.
foundry service start بدء تشغيل خدمة Foundry Local.
foundry service stop إيقاف خدمة Foundry Local.
foundry service restart إعادة تشغيل خدمة Foundry Local.
foundry service status يعرض الحالة الحالية للخدمة المحلية ل Foundry.
foundry service ps يسرد جميع النماذج المحملة حاليا في خدمة Foundry المحلية.
foundry service diag يعرض سجلات خدمة Foundry المحلية.
foundry service set <options> لتعيين تكوين خدمة Foundry المحلية.

أوامر ذاكرة التخزين المؤقت

يلخص الجدول التالي أوامر إدارة ذاكرة التخزين المؤقت المحلية حيث يتم تخزين النماذج:

الأمر الوصف
foundry cache --help يعرض جميع الأوامر المتوفرة المتعلقة بذاكرة التخزين المؤقت واستخدامها.
foundry cache location يعرض دليل ذاكرة التخزين المؤقت الحالي.
foundry cache list يسرد جميع النماذج المخزنة في ذاكرة التخزين المؤقت المحلية.
foundry cache cd <path> تغيير دليل ذاكرة التخزين المؤقت إلى المسار المحدد.
foundry cache remove <model> يزيل نموذجا من ذاكرة التخزين المؤقت المحلية.

مزودو التنفيذ

مزودو التنفيذ هم مكتبات تسريع خاصة بالأجهزة تشغل النماذج بأكبر قدر ممكن من الكفاءة على جهازك.

مزودو التنفيذ المدمجين

يشمل Foundry Local مزود تنفيذ وحدة المعالجة المركزية، ومزود تنفيذ WebGPU، ومزود تنفيذ CUDA.

يستخدم مزود تنفيذ وحدة المعالجة المركزية Microsoft Linear Algebra Subroutines (MLAS) للعمل على أي معالج رئيسي، وهو البديل للمعالج ل Foundry Local.

يستخدم مزود تنفيذ WebGPU Dawn، وهو التطبيق الأصلي لواجهة برمجة التطبيقات المعتمدة على الويب، للتسريع على أي وحدة معالجة رسوميات، وهو الخيار الاحتياطي لوحدة معالجة الرسومات Foundry Local.

مزود تنفيذ CUDA يستخدم NVIDIA CUDA للتسريع على وحدات معالجة الرسوميات NVIDIA. يتطلب جهاز NVIDIA GeForce RTX 30 Series ولاحقا مع إصدار تعريف موصى به 32.0.15.5585 وإصدار CUDA 12.5. يخضع لشروط الترخيص التالية: اتفاقية ترخيص مجموعات تطوير البرمجيات من NVIDIA—اتفاقية ترخيص EULA.

مزودو تنفيذ الإضافات

مزودو التنفيذ المدرجين في الجدول التالي متاحون للتحميل والتسجيل الديناميكي على ويندوز، حسب توافق الأجهزة والتعريفات. هم يخضعون لشروط الترخيص المحددة.

يقوم Foundry Local بتنزيل مزودي التنفيذ تلقائيا عند التشغيل الأول. يقوم مزودو تنفيذ الإضافات بالتحديث تلقائيا عند توفر نسخ جديدة.

الاسم (بائع) المتطلبات شروط الترخيص
NvTensorRTRTXExecutionProvider (نفيديا) إصدارات NVIDIA GeForce RTX 30XX والإصدارات الأحدث مع الحد الأدنى الموصى به من إصدار تعريف 32.0.15.5585 وإصدار CUDA 12.5 اتفاقية الترخيص لمجموعات تطوير برمجيات NVIDIA — اتفاقية ترخيص المستخدم النهائي
OpenVINOExecutionProvider (معلومات) المعالج: Intel TigerLake (الجيل الحادي عشر) والإصدارات الأحدث مع تعريف موصى به 32.0.100.9565
بطاقة الرسوميات: Intel AlderLake (الجيل الثاني عشر) والإصدارات الأحدث مع تعريف موصى به بالحد الأدنى 32.0.101.1029
NPU: إنتل أرو ليك (الجيل الخامس عشر) والإصدارات الأحدث مع تعريف موصى به على الحد الأدنى 32.0.100.4239
اتفاقية ترخيص الاستخدام التجاري لتوزيع إنتل OBL v2025.02.12
QNNExecutionProvider (كوالكوم) سناب دراجون(R) X إيليت - X1Exxxxx - وحدة معالجة البرق Qualcomm(R) Hexagon(TM) مع الحد الأدنى لإصدار تعريف 30.0.140.0 والإصدارات الأحدث
سناب دراجون(R) X Plus - X1Pxxxxx - وحدة معالجة البرق Qualcomm(R) Hexagon(TM) مع الحد الأدنى لإصدار التعريف 30.0.140.0 والإصدارات الأحدث
لعرض رخصة QNN، قم بتنزيل حزمة تطوير تطوير كوالكوم® للمعالجة العصبية، واستخراج ملف ZIP، وافتح ملف LICENSE.pdf.
VitisAIExecutionProvider (AMD) الحد الأدنى: إصدار أدرينالين 25.6.3 مع برنامج تشغيل NPU 32.00.0203.280
ماكس: إصدار أدرينالين 25.9.1 مع تعريف NPU 32.00.0203.297
لا حاجة لترخيص إضافي