Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Important
- Místní rozhraní příkazového řádku Foundry je k dispozici ve verzi Preview. Verze Public Preview poskytují dřívější access funkcím, které jsou v aktivním nasazení.
- Funkce, přístupy a procesy se můžou před obecnou dostupností měnit nebo mít omezené možnosti.
Tento článek obsahuje komplexní referenční informace pro rozhraní příkazového řádku Foundry Local (CLI). Rozhraní příkazového řádku uspořádá příkazy do logických kategorií, které vám pomůžou spravovat modely, řídit službu a udržovat místní mezipaměť.
Prerequisites
- Nainstalujte Foundry Local.
- Místní terminál, kde je rozhraní příkazového
foundryřádku k dispozici. - Ujistěte se, že máte přístup k internetu při prvním stahování (poskytovatelé služeb a modely).
- Azure RBAC: Nejde použít (spouští se místně).
- Pokud máte na Windows intel NPU, nainstalujte ovladač Intel NPU pro optimální akceleraci NPU.
Nainstalujte Foundry Local
Nainstalujte Foundry Local pomocí správce balíčků pro váš operační systém.
-
Windows: Otevřete terminál a spusťte:
winget install Microsoft.FoundryLocal -
macOS: Otevřete terminál a spusťte:
Případně si stáhněte instalační program z úložiště Foundry Local GitHub.brew tap microsoft/foundrylocal brew install foundrylocal
Ověřte tuto instalaci:
foundry --version
Ujistěte se, že máte práva správce k instalaci softwaru.
Tip
Pokud se po instalaci zobrazí chyba připojení služby (například Request to local service failed), spusťte foundry service restart.
Quick verification
Spuštěním těchto příkazů potvrďte, že je rozhraní příkazového řádku nainstalované a služba je dostupná.
Zobrazit nápovědu k rozhraní příkazového řádku:
foundry --helpTento příkaz vytiskne informace o využití a seznam dostupných skupin příkazů.
Reference: Overview
Zkontrolujte stav služby:
foundry service statusTento příkaz vypíše, zda je spuštěna služba Foundry Local a vypíše její místní koncový bod.
Referenční informace: Příkazy služby
Overview
Pomocí integrované nápovědy můžete prozkoumat příkazy a možnosti.
Rozhraní CLI uspořádává příkazy do tří hlavních kategorií:
- Model: Příkazy pro správu a spouštění modelů AI
- Služba: Příkazy pro řízení místní služby Foundry
- Cache: Příkazy pro správu místního modelu storage
Model commands
Následující tabulka shrnuje příkazy související se správou a spouštěním modelů:
Note
Pomocí model můžete argument zadat podle jeho aliasu nebo ID modelu. Použití aliasu:
- Vybere nejlepší model pro váš dostupný hardware automaticky. Pokud máte například k dispozici Nvidia GPU, Foundry Local vybere nejlepší model GPU. Pokud máte k dispozici podporovanou NPU, Foundry Local vybere model NPU.
- Umožňuje použít kratší název, aniž byste si museli pamatovat ID modelu.
Pokud chcete spustit konkrétní model, použijte ID modelu. Pokud například chcete spustit qwen2.5-0.5b na procesoru, bez ohledu na dostupný hardware, použijte: foundry model run qwen2.5-0.5b-instruct-generic-cpu.
| Command | Description |
|---|---|
foundry model --help |
Zobrazí všechny dostupné příkazy související s modelem a jejich použití. |
foundry model run <model> |
Spustí zadaný model, stáhne ho, pokud není uložený v mezipaměti, a spustí interakci. |
foundry model list |
Zobrazí seznam všech dostupných modelů pro místní použití. Při prvním spuštění stáhne poskytovatele spouštění (EPs) pro váš hardware. |
foundry model list --filter <key>=<value> |
Zobrazí seznam modelů filtrovaných podle zadaných kritérií (zařízení, úkol, alias, poskytovatel). |
foundry model info <model> |
Zobrazí podrobné informace o konkrétním modelu. |
foundry model info <model> --license |
Zobrazí informace o licenci pro konkrétní model. |
foundry model download <model> |
Stáhne model do místní mezipaměti, aniž by ho spustil. |
foundry model load <model> |
Načte model do služby. |
foundry model unload <model> |
Odstraní model ze služby. |
Řazení modelů v seznamu
Pokud je pro alias k dispozici více variant ID modelu, zobrazí se v seznamu modelů modely v pořadí priority. Prvním modelem v seznamu je model, který se spouští při zadávání modelu podle alias.
Filtrování seznamu modelů
Příkaz foundry model list podporuje filtrování modelů pomocí možnosti --filter. Modely můžete filtrovat na základě jednoho atributu pomocí párů klíč-hodnota.
foundry model list --filter <key>=<value>
Tento příkaz vytiskne modely, které odpovídají klíči filtru a hodnotě.
Referenční informace: Filtrování seznamu modelů
Note
Když po instalaci spustíte foundry model list poprvé, Foundry Local automaticky stáhne příslušné poskytovatele spouštění (EPs) pro konfiguraci hardwaru vašeho počítače. Zobrazí se indikátor průběhu označující dokončení stahování před zobrazením seznamu modelů.
Podporované klíče filtru:
zařízení – Typ hardwarového zařízení
Filtruje modely podle hardwarového zařízení, na kterých běží.
Possible values:
-
CPU- Modely jednotek centrálního zpracování -
GPU- Modely grafických procesorů -
NPU- Neurální zpracování modelů jednotek
provider – Zprostředkovatel spuštění
Filtruje modely podle poskytovatele spouštění nebo modulu runtime.
Possible values:
-
CPUExecutionProvider– Spuštění řízené procesorem -
CUDAExecutionProvider– Spouštění GPU NVIDIA CUDA -
WebGpuExecutionProvider– Provádění protokolu WebGPU -
QNNExecutionProvider- Spuštění neurální sítě Qualcomm (NPU) -
OpenVINOExecutionProvider- Spuštění Technologie Intel OpenVINO -
NvTensorRTRTXExecutionProvider– Zpracování pomocí NVIDIA TensorRT -
VitisAIExecutionProvider- AMD Vitis AI spouštění
task – typ úlohy modelu
Filtruje modely podle zamýšleného případu použití nebo úkolu.
Common values:
-
chat-completion: Konverzační modely AI -
text-generation: Modely generování textu
alias – Modelový alias
Filtruje modely podle jejich identifikátoru aliasu. Podporuje porovnávání pomocí zástupných znaků s příponou *.
Sample values:
phi4-cpuqwen2.5-coder-0.5b-instruct-generic-cpudeepseek-r1-distill-qwen-1.5b-generic-cpuphi-4-mini-instruct-generic-cpu
Speciální funkce filtru
Podpora negace: Předpona jakékoli hodnoty s vyloučením ! odpovídajících modelů.
foundry model list --filter device=!GPU
Tento příkaz z výsledků vyloučí modely GPU.
Referenční informace: Speciální funkce filtru
Porovnávání zástupných znaků (pouze alias): Při filtrování podle aliasu připojte * k předponám pro shodu.
foundry model list --filter alias=qwen*
Tento příkaz vrátí modely, jejichž alias začíná qwen.
Referenční informace: Speciální funkce filtru
Examples
foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider
Tyto příklady filtrují seznam modelů podle zařízení, úlohy a poskytovatele spouštění.
Referenční informace: Filtrování seznamu modelů
Note
- Všechna porovnání nerozlišují malá a velká písmena.
- Pro každý příkaz lze použít pouze jeden filtr.
- Nerozpoznané klíče filtru způsobí chybu.
Interaktivní spuštění modelu
Spusťte model a interagujte s ním přímo v terminálu:
foundry model run qwen2.5-0.5b
Foundry Local stáhne model při prvním spuštění a pak spustí interaktivní relaci. Zadejte výzvu k získání odpovědi:
Why is the sky blue?
Tip
Nahraďte qwen2.5-0.5b libovolným aliasem modelu z katalogu. Spuštěním foundry model list zobrazíte dostupné modely. Foundry Local stáhne variantu, která nejlépe odpovídá vašemu hardwaru – například varianta CUDA pro GRAFICKÉ procesory NVIDIA nebo varianta NPU pro NpU Typu NpU.
Service commands
Následující tabulka shrnuje příkazy související se správou a spuštěním místní služby Foundry:
| Command | Description |
|---|---|
foundry service --help |
Zobrazí všechny dostupné příkazy související se službami a jejich použití. |
foundry service start |
Spustí službu „Foundry Local“. |
foundry service stop |
Zastaví službu Foundry Local. |
foundry service restart |
Restartuje službu Foundry Local. |
foundry service status |
Zobrazí aktuální stav místní služby Foundry. |
foundry service ps |
Zobrazí seznam všech modelů aktuálně načtených ve službě Foundry Local. |
foundry service diag |
Zobrazí protokoly místní služby Foundry. |
foundry service set <options> |
Nastaví konfiguraci místní služby Foundry. |
Cache commands
Následující tabulka shrnuje příkazy pro správu místní mezipaměti, ve které jsou uložené modely:
| Command | Description |
|---|---|
foundry cache --help |
Zobrazí všechny dostupné příkazy související s mezipamětí a jejich použití. |
foundry cache location |
Zobrazuje aktuální adresář mezipaměti. |
foundry cache list |
Zobrazí seznam všech modelů uložených v místní mezipaměti. |
foundry cache cd <path> |
Změní adresář mezipaměti na zadanou cestu. |
foundry cache remove <model> |
Odebere model z místní mezipaměti. |
Execution providers
Poskytovatelé spouštění jsou hardwarově specifické akcelerační knihovny, které na vašem zařízení spouštějí modely nejefektivnějším možným způsobem.
Předdefinované zprostředkovatelé spouštění
Foundry Local zahrnuje zprostředkovatele spouštění procesoru, poskytovatele spuštění WebGPU a poskytovatele provádění CUDA.
Poskytovatel spouštění procesoru používá Microsoft Lineární podprogramy Algebra (MLAS) ke spuštění na libovolném procesoru a je náhradním procesorem pro Foundry Local.
Zprostředkovatel spouštění WebGPU používá Dawn, nativní implementaci webového rozhraní API pro akceleraci libovolného GPU a je náhradním gpu pro Foundry Local.
Zprostředkovatel provádění CUDA používá NVIDIA CUDA pro akceleraci grafických procesorů NVIDIA. Vyžaduje řadu NVIDIA GeForce RTX 30 a novější s minimální doporučenou verzí ovladače 32.0.15.5585 a CUDA verze 12.5. Podléhá následujícím licenčním podmínkám: Licenční smlouva pro NVIDIA Software Development Kits – EULA.
Poskytovatelé spouštění modulů plug-in
Poskytovatelé spouštění uvedené v následující tabulce jsou k dispozici pro dynamické stahování a registraci v Windows v závislosti na kompatibilitě zařízení a ovladačů. Podléhají zadaným licenčním podmínkám.
Foundry Local automaticky stáhne tyto zprostředkovatele spouštění při prvním spuštění. Poskytovatelé spouštění modulů plug-in se automaticky aktualizují, když jsou k dispozici nové verze.
| Name (Vendor) | Requirements | License terms |
|---|---|---|
NvTensorRTRTXExecutionProvider (NVIDIA) |
NVIDIA GeForce RTX 30XX a novější verze s minimální doporučenou verzí ovladače 32.0.15.5585 a CUDA verze 12.5 | Licenční smlouva pro sady NVIDIA Software Development Kits – EULA |
OpenVINOExecutionProvider (Intel) |
PROCESOR: Intel TigerLake (11. generace) a novější verze s minimálním doporučeným ovladačem 32.0.100.9565 GPU: Intel AlderLake (12. generace) a novější verze s minimálním doporučeným ovladačem 32.0.101.1029 NPU: Intel ArrowLake (15. generace) a novější verze s minimálním doporučeným ovladačem 32.0.100.4239 |
Licenční smlouva s komerčním využitím distribuce Intel OBL v2025.02.12 |
QNNExecutionProvider (Roku 2019) |
Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU s minimální verzí ovladače 30.0.140.0 a novějšími verzemi Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU s minimální verzí ovladače 30.0.140.0 a dalšími verzemi. |
Pokud chcete zobrazit licenci QNN, stáhněte si Qualcomm® Neural Processing SDK, extrahujte soubor ZIP a otevřete soubor LICENSE.pdf. |
VitisAIExecutionProvider (AMD) |
Min: Adrenalin Edition 25.6.3 s ovladačem NPU 32.00.0203.280 Max: Adrenalin Edition 25.9.1 s ovladačem NPU 32.00.0203.297 |
Nevyžaduje se žádná další licence. |
Použití Open WebUI s místním serverem
Připojte Open WebUI k Foundry Local pro rozhraní chatu založeného na prohlížeči, které běží zcela na vašem zařízení.
Spusťte model a nechte terminál otevřený:
foundry model run qwen2.5-0.5bZískejte adresu URL místního koncového bodu:
foundry service statusZkopírujte adresu URL koncového bodu. Foundry Local při každém spuštění služby přiřadí dynamický port.
Nainstalujte a spusťte Open WebUI a otevřete ho
http://localhost:8080v prohlížeči.Připojit Open WebUI k Foundry Local:
- Přejděte na>Připojení> a povolte přímá připojení.
- Přejděte na Nastavení>Připojení>Spravovat přímá připojení a vyberte +.
- Nastavte adresu URL na
http://localhost:PORT/v1(nahraďtePORTportem z kroku 2) a ověřováním na Hodnotu None. - Select Save.
V rozevíracím seznamu vyberte model a začněte chatovat.
Tip
Pokud se nezobrazí žádné modely, spusťte foundry model run <model> v terminálu a znovu načtěte Open WebUI. Pokud se připojení nezdaří, potvrďte port pomocí foundry service status.
Upgrade systému Foundry na místní úrovni
Spuštěním příkazu pro váš operační systém upgradujte Foundry Local.
-
Windows:
winget upgrade --id Microsoft.FoundryLocal -
macOS:
brew upgrade foundrylocal
Odinstalujte Foundry Local
Spuštěním příkazu pro váš operační systém odinstalujte Foundry Local.
-
Windows:
winget uninstall Microsoft.FoundryLocal -
macOS:
brew rm foundrylocal brew untap microsoft/foundrylocal brew cleanup --scrub
Troubleshooting
Problémy s připojením ke službě
Pokud se při spuštění příkazu zobrazí tato chyba, například foundry model list:
Exception: Request to local service failed.
Uri: http://127.0.0.1:0/foundry/list
The requested address is not valid in its context. (127.0.0.1:0)
Please check service status with 'foundry service status'.
Zrestartujte službu:
foundry service restart
Tento příkaz opravuje případy, kdy se služba spouští, ale není přístupná kvůli problému s vazbou portu.
Další pokyny k řešení potíží najdete v tématu Osvědčené postupy a řešení potíží.