Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Důležité
- Foundry Local je k dispozici ve verzi Preview. Verze Public Preview poskytují dřívější access funkcím, které jsou v aktivním nasazení.
- Funkce, přístupy a procesy se můžou před obecnou dostupností měnit nebo mít omezené možnosti.
Tento článek obsahuje komplexní referenční informace pro rozhraní příkazového řádku Foundry Local (CLI). Rozhraní příkazového řádku uspořádá příkazy do logických kategorií, které vám pomůžou spravovat modely, řídit službu a udržovat místní mezipaměť.
Předpoklady
- Nainstalujte Foundry Local. Postup nastavení najdete v tématu Get started s foundry Local.
- Použijte místní terminál, kde je rozhraní příkazového
foundryřádku k dispozici. - Ujistěte se, že máte přístup k internetu při prvním stahování (poskytovatelé služeb a modely).
- Azure RBAC: Nejde použít (spouští se místně).
- Pokud máte intel NPU ve Windows, nainstalujte ovladač Intel NPU pro optimální akceleraci NPU.
Rychlé ověření
Spuštěním těchto příkazů potvrďte, že je rozhraní příkazového řádku nainstalované a služba je dostupná.
Zobrazit nápovědu k rozhraní příkazového řádku:
foundry --helpTento příkaz vytiskne informace o využití a seznam dostupných skupin příkazů.
Referenční informace: Přehled
Zkontrolujte stav služby:
foundry service statusTento příkaz vypíše, zda je spuštěna služba Foundry Local a vypíše její místní koncový bod.
Referenční informace: Příkazy služby
Přehled
Pomocí integrované nápovědy můžete prozkoumat příkazy a možnosti.
Rozhraní CLI uspořádává příkazy do tří hlavních kategorií:
- Model: Příkazy pro správu a spouštění modelů AI
- Služba: Příkazy pro řízení místní služby Foundry
- Cache: Příkazy pro správu místního modelu storage
Příkazy modelu
Následující tabulka shrnuje příkazy související se správou a spouštěním modelů:
Poznámka:
Pomocí model můžete argument zadat podle jeho aliasu nebo ID modelu. Použití aliasu:
- Vybere nejlepší model pro váš dostupný hardware automaticky. Pokud máte například k dispozici Nvidia GPU, Foundry Local vybere nejlepší model GPU. Pokud máte k dispozici podporovanou NPU, Foundry Local vybere model NPU.
- Umožňuje použít kratší název, aniž byste si museli pamatovat ID modelu.
Pokud chcete spustit konkrétní model, použijte ID modelu. Pokud například chcete spustit qwen2.5-0.5b na procesoru, bez ohledu na dostupný hardware, použijte: foundry model run qwen2.5-0.5b-instruct-generic-cpu.
| Command | Description |
|---|---|
foundry model --help |
Zobrazí všechny dostupné příkazy související s modelem a jejich použití. |
foundry model run <model> |
Spustí zadaný model, stáhne ho, pokud není uložený v mezipaměti, a spustí interakci. |
foundry model list |
Zobrazí seznam všech dostupných modelů pro místní použití. Při prvním spuštění stáhne poskytovatele spouštění (EPs) pro váš hardware. |
foundry model list --filter <key>=<value> |
Zobrazí seznam modelů filtrovaných podle zadaných kritérií (zařízení, úkol, alias, poskytovatel). |
foundry model info <model> |
Zobrazí podrobné informace o konkrétním modelu. |
foundry model info <model> --license |
Zobrazí informace o licenci pro konkrétní model. |
foundry model download <model> |
Stáhne model do místní mezipaměti, aniž by ho spustil. |
foundry model load <model> |
Načte model do služby. |
foundry model unload <model> |
Odstraní model ze služby. |
Řazení modelů v seznamu
Pokud je pro alias k dispozici více variant ID modelu, zobrazí se v seznamu modelů modely v pořadí priority. Prvním modelem v seznamu je model, který se spouští při zadávání modelu podle alias.
Filtrování seznamu modelů
Příkaz foundry model list podporuje filtrování modelů pomocí možnosti --filter. Modely můžete filtrovat na základě jednoho atributu pomocí párů klíč-hodnota.
foundry model list --filter <key>=<value>
Tento příkaz vytiskne modely, které odpovídají klíči filtru a hodnotě.
Referenční informace: Filtrování seznamu modelů
Poznámka:
Když po instalaci spustíte foundry model list poprvé, Foundry Local automaticky stáhne příslušné poskytovatele spouštění (EPs) pro konfiguraci hardwaru vašeho počítače. Zobrazí se indikátor průběhu označující dokončení stahování před zobrazením seznamu modelů.
Podporované klíče filtru:
zařízení – Typ hardwarového zařízení
Filtruje modely podle hardwarového zařízení, na kterých běží.
Možné hodnoty:
-
CPU- Modely jednotek centrálního zpracování -
GPU- Modely grafických procesorů -
NPU- Neurální zpracování modelů jednotek
provider – Zprostředkovatel spuštění
Filtruje modely podle poskytovatele spouštění nebo modulu runtime.
Možné hodnoty:
-
CPUExecutionProvider– Spuštění řízené procesorem -
CUDAExecutionProvider– Spouštění GPU NVIDIA CUDA -
WebGpuExecutionProvider– Provádění protokolu WebGPU -
QNNExecutionProvider- Spuštění neurální sítě Qualcomm (NPU) -
OpenVINOExecutionProvider- Spuštění Technologie Intel OpenVINO -
NvTensorRTRTXExecutionProvider– Zpracování pomocí NVIDIA TensorRT -
VitisAIExecutionProvider- AMD Vitis AI spouštění
task – typ úlohy modelu
Filtruje modely podle zamýšleného případu použití nebo úkolu.
Běžné hodnoty:
-
chat-completion: Konverzační modely AI -
text-generation: Modely generování textu
alias – Modelový alias
Filtruje modely podle jejich identifikátoru aliasu. Podporuje porovnávání pomocí zástupných znaků s příponou *.
Ukázkové hodnoty:
phi4-cpuqwen2.5-coder-0.5b-instruct-generic-cpudeepseek-r1-distill-qwen-1.5b-generic-cpuphi-4-mini-instruct-generic-cpu
Speciální funkce filtru
Podpora negace: Předpona jakékoli hodnoty s vyloučením ! odpovídajících modelů.
foundry model list --filter device=!GPU
Tento příkaz z výsledků vyloučí modely GPU.
Referenční informace: Speciální funkce filtru
Porovnávání zástupných znaků (pouze alias): Při filtrování podle aliasu připojte * k předponám pro shodu.
foundry model list --filter alias=qwen*
Tento příkaz vrátí modely, jejichž alias začíná qwen.
Referenční informace: Speciální funkce filtru
Příklady
foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider
Tyto příklady filtrují seznam modelů podle zařízení, úlohy a poskytovatele spouštění.
Referenční informace: Filtrování seznamu modelů
Poznámka:
- Všechna porovnání nerozlišují malá a velká písmena.
- Pro každý příkaz lze použít pouze jeden filtr.
- Nerozpoznané klíče filtru způsobí chybu.
Příkazy služby
Následující tabulka shrnuje příkazy související se správou a spuštěním místní služby Foundry:
| Command | Description |
|---|---|
foundry service --help |
Zobrazí všechny dostupné příkazy související se službami a jejich použití. |
foundry service start |
Spustí službu „Foundry Local“. |
foundry service stop |
Zastaví službu Foundry Local. |
foundry service restart |
Restartuje službu Foundry Local. |
foundry service status |
Zobrazí aktuální stav místní služby Foundry. |
foundry service ps |
Zobrazí seznam všech modelů aktuálně načtených ve službě Foundry Local. |
foundry service diag |
Zobrazí protokoly místní služby Foundry. |
foundry service set <options> |
Nastaví konfiguraci místní služby Foundry. |
Příkazy mezipaměti
Následující tabulka shrnuje příkazy pro správu místní mezipaměti, ve které jsou uložené modely:
| Command | Description |
|---|---|
foundry cache --help |
Zobrazí všechny dostupné příkazy související s mezipamětí a jejich použití. |
foundry cache location |
Zobrazuje aktuální adresář mezipaměti. |
foundry cache list |
Zobrazí seznam všech modelů uložených v místní mezipaměti. |
foundry cache cd <path> |
Změní adresář mezipaměti na zadanou cestu. |
foundry cache remove <model> |
Odebere model z místní mezipaměti. |
Zprostředkovatelé spouštění
Poskytovatelé spouštění jsou hardwarově specifické akcelerační knihovny, které na vašem zařízení spouštějí modely nejefektivnějším možným způsobem.
Předdefinované zprostředkovatelé spouštění
Foundry Local zahrnuje zprostředkovatele spouštění procesoru, poskytovatele spuštění WebGPU a poskytovatele provádění CUDA.
Poskytovatel spouštění procesoru používá Mcrosoft Linear Algebra Subroutines (MLAS) ke spuštění na libovolném procesoru a je záložním procesorem pro Foundry Local.
Zprostředkovatel spouštění WebGPU používá Dawn, nativní implementaci webového rozhraní API pro akceleraci libovolného GPU a je náhradním gpu pro Foundry Local.
Zprostředkovatel provádění CUDA používá NVIDIA CUDA pro akceleraci grafických procesorů NVIDIA. Vyžaduje řadu NVIDIA GeForce RTX 30 a novější s minimální doporučenou verzí ovladače 32.0.15.5585 a CUDA verze 12.5. Podléhá následujícím licenčním podmínkám: Licenční smlouva pro NVIDIA Software Development Kits – EULA.
Poskytovatelé spouštění modulů plug-in
Poskytovatelé spouštění uvedené v následující tabulce jsou k dispozici pro dynamické stahování a registraci ve Windows v závislosti na kompatibilitě zařízení a ovladačů. Podléhají zadaným licenčním podmínkám.
Foundry Local automaticky stáhne tyto zprostředkovatele spouštění při prvním spuštění. Poskytovatelé spouštění modulů plug-in se automaticky aktualizují, když jsou k dispozici nové verze.
| Název (dodavatel) | Požadavky | Licenční podmínky |
|---|---|---|
NvTensorRTRTXExecutionProvider (NVIDIA) |
NVIDIA GeForce RTX 30XX a novější verze s minimální doporučenou verzí ovladače 32.0.15.5585 a CUDA verze 12.5 | Licenční smlouva pro sady NVIDIA Software Development Kits – EULA |
OpenVINOExecutionProvider (Intel) |
PROCESOR: Intel TigerLake (11. generace) a novější verze s minimálním doporučeným ovladačem 32.0.100.9565 GPU: Intel AlderLake (12. generace) a novější verze s minimálním doporučeným ovladačem 32.0.101.1029 NPU: Intel ArrowLake (15. generace) a novější verze s minimálním doporučeným ovladačem 32.0.100.4239 |
Licenční smlouva s komerčním využitím distribuce Intel OBL v2025.02.12 |
QNNExecutionProvider (Qualcomm) |
Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU s minimální verzí ovladače 30.0.140.0 a novějšími verzemi Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU s minimální verzí ovladače 30.0.140.0 a dalšími verzemi. |
Pokud chcete zobrazit licenci QNN, stáhněte si Qualcomm® Neural Processing SDK, extrahujte soubor ZIP a otevřete soubor LICENSE.pdf. |
VitisAIExecutionProvider (AMD) |
Min: Adrenalin Edition 25.6.3 s ovladačem NPU 32.00.0203.280 Max: Adrenalin Edition 25.9.1 s ovladačem NPU 32.00.0203.297 |
Nevyžaduje se žádná další licence. |