Sdílet prostřednictvím


Referenční informace k místnímu rozhraní příkazového řádku Foundry

Důležité

  • Foundry Local je k dispozici ve verzi Preview. Verze Public Preview poskytují dřívější access funkcím, které jsou v aktivním nasazení.
  • Funkce, přístupy a procesy se můžou před obecnou dostupností měnit nebo mít omezené možnosti.

Tento článek obsahuje komplexní referenční informace pro rozhraní příkazového řádku Foundry Local (CLI). Rozhraní příkazového řádku uspořádá příkazy do logických kategorií, které vám pomůžou spravovat modely, řídit službu a udržovat místní mezipaměť.

Předpoklady

  • Nainstalujte Foundry Local. Postup nastavení najdete v tématu Get started s foundry Local.
  • Použijte místní terminál, kde je rozhraní příkazového foundry řádku k dispozici.
  • Ujistěte se, že máte přístup k internetu při prvním stahování (poskytovatelé služeb a modely).
  • Azure RBAC: Nejde použít (spouští se místně).
  • Pokud máte intel NPU ve Windows, nainstalujte ovladač Intel NPU pro optimální akceleraci NPU.

Rychlé ověření

Spuštěním těchto příkazů potvrďte, že je rozhraní příkazového řádku nainstalované a služba je dostupná.

  1. Zobrazit nápovědu k rozhraní příkazového řádku:

     foundry --help
    

    Tento příkaz vytiskne informace o využití a seznam dostupných skupin příkazů.

    Referenční informace: Přehled

  2. Zkontrolujte stav služby:

     foundry service status
    

    Tento příkaz vypíše, zda je spuštěna služba Foundry Local a vypíše její místní koncový bod.

    Referenční informace: Příkazy služby

Přehled

Pomocí integrované nápovědy můžete prozkoumat příkazy a možnosti.

Rozhraní CLI uspořádává příkazy do tří hlavních kategorií:

  • Model: Příkazy pro správu a spouštění modelů AI
  • Služba: Příkazy pro řízení místní služby Foundry
  • Cache: Příkazy pro správu místního modelu storage

Příkazy modelu

Následující tabulka shrnuje příkazy související se správou a spouštěním modelů:

Poznámka:

Pomocí model můžete argument zadat podle jeho aliasu nebo ID modelu. Použití aliasu:

  • Vybere nejlepší model pro váš dostupný hardware automaticky. Pokud máte například k dispozici Nvidia GPU, Foundry Local vybere nejlepší model GPU. Pokud máte k dispozici podporovanou NPU, Foundry Local vybere model NPU.
  • Umožňuje použít kratší název, aniž byste si museli pamatovat ID modelu.

Pokud chcete spustit konkrétní model, použijte ID modelu. Pokud například chcete spustit qwen2.5-0.5b na procesoru, bez ohledu na dostupný hardware, použijte: foundry model run qwen2.5-0.5b-instruct-generic-cpu.

Command Description
foundry model --help Zobrazí všechny dostupné příkazy související s modelem a jejich použití.
foundry model run <model> Spustí zadaný model, stáhne ho, pokud není uložený v mezipaměti, a spustí interakci.
foundry model list Zobrazí seznam všech dostupných modelů pro místní použití. Při prvním spuštění stáhne poskytovatele spouštění (EPs) pro váš hardware.
foundry model list --filter <key>=<value> Zobrazí seznam modelů filtrovaných podle zadaných kritérií (zařízení, úkol, alias, poskytovatel).
foundry model info <model> Zobrazí podrobné informace o konkrétním modelu.
foundry model info <model> --license Zobrazí informace o licenci pro konkrétní model.
foundry model download <model> Stáhne model do místní mezipaměti, aniž by ho spustil.
foundry model load <model> Načte model do služby.
foundry model unload <model> Odstraní model ze služby.

Řazení modelů v seznamu

Pokud je pro alias k dispozici více variant ID modelu, zobrazí se v seznamu modelů modely v pořadí priority. Prvním modelem v seznamu je model, který se spouští při zadávání modelu podle alias.

Filtrování seznamu modelů

Příkaz foundry model list podporuje filtrování modelů pomocí možnosti --filter. Modely můžete filtrovat na základě jednoho atributu pomocí párů klíč-hodnota.

foundry model list --filter <key>=<value>

Tento příkaz vytiskne modely, které odpovídají klíči filtru a hodnotě.

Referenční informace: Filtrování seznamu modelů

Poznámka:

Když po instalaci spustíte foundry model list poprvé, Foundry Local automaticky stáhne příslušné poskytovatele spouštění (EPs) pro konfiguraci hardwaru vašeho počítače. Zobrazí se indikátor průběhu označující dokončení stahování před zobrazením seznamu modelů.

Podporované klíče filtru:

zařízení – Typ hardwarového zařízení

Filtruje modely podle hardwarového zařízení, na kterých běží.

Možné hodnoty:

  • CPU - Modely jednotek centrálního zpracování
  • GPU - Modely grafických procesorů
  • NPU - Neurální zpracování modelů jednotek

provider – Zprostředkovatel spuštění

Filtruje modely podle poskytovatele spouštění nebo modulu runtime.

Možné hodnoty:

  • CPUExecutionProvider – Spuštění řízené procesorem
  • CUDAExecutionProvider – Spouštění GPU NVIDIA CUDA
  • WebGpuExecutionProvider – Provádění protokolu WebGPU
  • QNNExecutionProvider - Spuštění neurální sítě Qualcomm (NPU)
  • OpenVINOExecutionProvider - Spuštění Technologie Intel OpenVINO
  • NvTensorRTRTXExecutionProvider – Zpracování pomocí NVIDIA TensorRT
  • VitisAIExecutionProvider - AMD Vitis AI spouštění

task – typ úlohy modelu

Filtruje modely podle zamýšleného případu použití nebo úkolu.

Běžné hodnoty:

  • chat-completion: Konverzační modely AI
  • text-generation: Modely generování textu

alias – Modelový alias

Filtruje modely podle jejich identifikátoru aliasu. Podporuje porovnávání pomocí zástupných znaků s příponou *.

Ukázkové hodnoty:

  • phi4-cpu
  • qwen2.5-coder-0.5b-instruct-generic-cpu
  • deepseek-r1-distill-qwen-1.5b-generic-cpu
  • phi-4-mini-instruct-generic-cpu

Speciální funkce filtru

Podpora negace: Předpona jakékoli hodnoty s vyloučením ! odpovídajících modelů.

foundry model list --filter device=!GPU

Tento příkaz z výsledků vyloučí modely GPU.

Referenční informace: Speciální funkce filtru

Porovnávání zástupných znaků (pouze alias): Při filtrování podle aliasu připojte * k předponám pro shodu.

foundry model list --filter alias=qwen*

Tento příkaz vrátí modely, jejichž alias začíná qwen.

Referenční informace: Speciální funkce filtru

Příklady

foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider

Tyto příklady filtrují seznam modelů podle zařízení, úlohy a poskytovatele spouštění.

Referenční informace: Filtrování seznamu modelů

Poznámka:

  • Všechna porovnání nerozlišují malá a velká písmena.
  • Pro každý příkaz lze použít pouze jeden filtr.
  • Nerozpoznané klíče filtru způsobí chybu.

Příkazy služby

Následující tabulka shrnuje příkazy související se správou a spuštěním místní služby Foundry:

Command Description
foundry service --help Zobrazí všechny dostupné příkazy související se službami a jejich použití.
foundry service start Spustí službu „Foundry Local“.
foundry service stop Zastaví službu Foundry Local.
foundry service restart Restartuje službu Foundry Local.
foundry service status Zobrazí aktuální stav místní služby Foundry.
foundry service ps Zobrazí seznam všech modelů aktuálně načtených ve službě Foundry Local.
foundry service diag Zobrazí protokoly místní služby Foundry.
foundry service set <options> Nastaví konfiguraci místní služby Foundry.

Příkazy mezipaměti

Následující tabulka shrnuje příkazy pro správu místní mezipaměti, ve které jsou uložené modely:

Command Description
foundry cache --help Zobrazí všechny dostupné příkazy související s mezipamětí a jejich použití.
foundry cache location Zobrazuje aktuální adresář mezipaměti.
foundry cache list Zobrazí seznam všech modelů uložených v místní mezipaměti.
foundry cache cd <path> Změní adresář mezipaměti na zadanou cestu.
foundry cache remove <model> Odebere model z místní mezipaměti.

Zprostředkovatelé spouštění

Poskytovatelé spouštění jsou hardwarově specifické akcelerační knihovny, které na vašem zařízení spouštějí modely nejefektivnějším možným způsobem.

Předdefinované zprostředkovatelé spouštění

Foundry Local zahrnuje zprostředkovatele spouštění procesoru, poskytovatele spuštění WebGPU a poskytovatele provádění CUDA.

Poskytovatel spouštění procesoru používá Mcrosoft Linear Algebra Subroutines (MLAS) ke spuštění na libovolném procesoru a je záložním procesorem pro Foundry Local.

Zprostředkovatel spouštění WebGPU používá Dawn, nativní implementaci webového rozhraní API pro akceleraci libovolného GPU a je náhradním gpu pro Foundry Local.

Zprostředkovatel provádění CUDA používá NVIDIA CUDA pro akceleraci grafických procesorů NVIDIA. Vyžaduje řadu NVIDIA GeForce RTX 30 a novější s minimální doporučenou verzí ovladače 32.0.15.5585 a CUDA verze 12.5. Podléhá následujícím licenčním podmínkám: Licenční smlouva pro NVIDIA Software Development Kits – EULA.

Poskytovatelé spouštění modulů plug-in

Poskytovatelé spouštění uvedené v následující tabulce jsou k dispozici pro dynamické stahování a registraci ve Windows v závislosti na kompatibilitě zařízení a ovladačů. Podléhají zadaným licenčním podmínkám.

Foundry Local automaticky stáhne tyto zprostředkovatele spouštění při prvním spuštění. Poskytovatelé spouštění modulů plug-in se automaticky aktualizují, když jsou k dispozici nové verze.

Název (dodavatel) Požadavky Licenční podmínky
NvTensorRTRTXExecutionProvider (NVIDIA) NVIDIA GeForce RTX 30XX a novější verze s minimální doporučenou verzí ovladače 32.0.15.5585 a CUDA verze 12.5 Licenční smlouva pro sady NVIDIA Software Development Kits – EULA
OpenVINOExecutionProvider (Intel) PROCESOR: Intel TigerLake (11. generace) a novější verze s minimálním doporučeným ovladačem 32.0.100.9565
GPU: Intel AlderLake (12. generace) a novější verze s minimálním doporučeným ovladačem 32.0.101.1029
NPU: Intel ArrowLake (15. generace) a novější verze s minimálním doporučeným ovladačem 32.0.100.4239
Licenční smlouva s komerčním využitím distribuce Intel OBL v2025.02.12
QNNExecutionProvider (Qualcomm) Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU s minimální verzí ovladače 30.0.140.0 a novějšími verzemi
Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU s minimální verzí ovladače 30.0.140.0 a dalšími verzemi.
Pokud chcete zobrazit licenci QNN, stáhněte si Qualcomm® Neural Processing SDK, extrahujte soubor ZIP a otevřete soubor LICENSE.pdf.
VitisAIExecutionProvider (AMD) Min: Adrenalin Edition 25.6.3 s ovladačem NPU 32.00.0203.280
Max: Adrenalin Edition 25.9.1 s ovladačem NPU 32.00.0203.297
Nevyžaduje se žádná další licence.