Referenční informace k místnímu rozhraní příkazového řádku Foundry

Important

Místní rozhraní příkazového řádku Foundry je k dispozici ve verzi Preview. Verze Public Preview poskytují dřívější access funkcím, které jsou v aktivním nasazení.
Funkce, přístupy a procesy se můžou před obecnou dostupností měnit nebo mít omezené možnosti.

Tento článek obsahuje komplexní referenční informace pro rozhraní příkazového řádku Foundry Local (CLI). Rozhraní příkazového řádku uspořádá příkazy do logických kategorií, které vám pomůžou spravovat modely, řídit službu a udržovat místní mezipaměť.

Prerequisites

Nainstalujte Foundry Local.
Místní terminál, kde je rozhraní příkazového foundry řádku k dispozici.
Ujistěte se, že máte přístup k internetu při prvním stahování (poskytovatelé služeb a modely).
Azure RBAC: Nejde použít (spouští se místně).
Pokud máte na Windows intel NPU, nainstalujte ovladač Intel NPU pro optimální akceleraci NPU.

Nainstalujte Foundry Local

Nainstalujte Foundry Local pomocí správce balíčků pro váš operační systém.

Windows: Otevřete terminál a spusťte:
```
winget install Microsoft.FoundryLocal
```
macOS: Otevřete terminál a spusťte:
```
brew tap microsoft/foundrylocal
brew install foundrylocal
```
Případně si stáhněte instalační program z úložiště Foundry Local GitHub.

Ověřte tuto instalaci:

foundry --version

Ujistěte se, že máte práva správce k instalaci softwaru.

Tip

Pokud se po instalaci zobrazí chyba připojení služby (například Request to local service failed), spusťte foundry service restart.

Quick verification

Spuštěním těchto příkazů potvrďte, že je rozhraní příkazového řádku nainstalované a služba je dostupná.

Zobrazit nápovědu k rozhraní příkazového řádku:
```
 foundry --help
```
Tento příkaz vytiskne informace o využití a seznam dostupných skupin příkazů.

Reference: Overview
Zkontrolujte stav služby:
```
 foundry service status
```
Tento příkaz vypíše, zda je spuštěna služba Foundry Local a vypíše její místní koncový bod.

Referenční informace: Příkazy služby

Overview

Pomocí integrované nápovědy můžete prozkoumat příkazy a možnosti.

Rozhraní CLI uspořádává příkazy do tří hlavních kategorií:

Model: Příkazy pro správu a spouštění modelů AI
Služba: Příkazy pro řízení místní služby Foundry
Cache: Příkazy pro správu místního modelu storage

Model commands

Následující tabulka shrnuje příkazy související se správou a spouštěním modelů:

Note

Pomocí model můžete argument zadat podle jeho aliasu nebo ID modelu. Použití aliasu:

Vybere nejlepší model pro váš dostupný hardware automaticky. Pokud máte například k dispozici Nvidia GPU, Foundry Local vybere nejlepší model GPU. Pokud máte k dispozici podporovanou NPU, Foundry Local vybere model NPU.
Umožňuje použít kratší název, aniž byste si museli pamatovat ID modelu.

Pokud chcete spustit konkrétní model, použijte ID modelu. Pokud například chcete spustit qwen2.5-0.5b na procesoru, bez ohledu na dostupný hardware, použijte: foundry model run qwen2.5-0.5b-instruct-generic-cpu.

Command	Description
`foundry model --help`	Zobrazí všechny dostupné příkazy související s modelem a jejich použití.
`foundry model run <model>`	Spustí zadaný model, stáhne ho, pokud není uložený v mezipaměti, a spustí interakci.
`foundry model list`	Zobrazí seznam všech dostupných modelů pro místní použití. Při prvním spuštění stáhne poskytovatele spouštění (EPs) pro váš hardware.
`foundry model list --filter <key>=<value>`	Zobrazí seznam modelů filtrovaných podle zadaných kritérií (zařízení, úkol, alias, poskytovatel).
`foundry model info <model>`	Zobrazí podrobné informace o konkrétním modelu.
`foundry model info <model> --license`	Zobrazí informace o licenci pro konkrétní model.
`foundry model download <model>`	Stáhne model do místní mezipaměti, aniž by ho spustil.
`foundry model load <model>`	Načte model do služby.
`foundry model unload <model>`	Odstraní model ze služby.

Řazení modelů v seznamu

Pokud je pro alias k dispozici více variant ID modelu, zobrazí se v seznamu modelů modely v pořadí priority. Prvním modelem v seznamu je model, který se spouští při zadávání modelu podle alias.

Filtrování seznamu modelů

Příkaz foundry model list podporuje filtrování modelů pomocí možnosti --filter. Modely můžete filtrovat na základě jednoho atributu pomocí párů klíč-hodnota.

foundry model list --filter <key>=<value>

Tento příkaz vytiskne modely, které odpovídají klíči filtru a hodnotě.

Referenční informace: Filtrování seznamu modelů

Note

Když po instalaci spustíte foundry model list poprvé, Foundry Local automaticky stáhne příslušné poskytovatele spouštění (EPs) pro konfiguraci hardwaru vašeho počítače. Zobrazí se indikátor průběhu označující dokončení stahování před zobrazením seznamu modelů.

Podporované klíče filtru:

zařízení – Typ hardwarového zařízení

Filtruje modely podle hardwarového zařízení, na kterých běží.

Possible values:

CPU - Modely jednotek centrálního zpracování
GPU - Modely grafických procesorů
NPU - Neurální zpracování modelů jednotek

provider – Zprostředkovatel spuštění

Filtruje modely podle poskytovatele spouštění nebo modulu runtime.

Possible values:

CPUExecutionProvider – Spuštění řízené procesorem
CUDAExecutionProvider – Spouštění GPU NVIDIA CUDA
WebGpuExecutionProvider – Provádění protokolu WebGPU
QNNExecutionProvider - Spuštění neurální sítě Qualcomm (NPU)
OpenVINOExecutionProvider - Spuštění Technologie Intel OpenVINO
NvTensorRTRTXExecutionProvider – Zpracování pomocí NVIDIA TensorRT
VitisAIExecutionProvider - AMD Vitis AI spouštění

task – typ úlohy modelu

Filtruje modely podle zamýšleného případu použití nebo úkolu.

Common values:

chat-completion: Konverzační modely AI
text-generation: Modely generování textu

alias – Modelový alias

Filtruje modely podle jejich identifikátoru aliasu. Podporuje porovnávání pomocí zástupných znaků s příponou *.

Sample values:

phi4-cpu
qwen2.5-coder-0.5b-instruct-generic-cpu
deepseek-r1-distill-qwen-1.5b-generic-cpu
phi-4-mini-instruct-generic-cpu

Speciální funkce filtru

Podpora negace: Předpona jakékoli hodnoty s vyloučením ! odpovídajících modelů.

foundry model list --filter device=!GPU

Tento příkaz z výsledků vyloučí modely GPU.

Referenční informace: Speciální funkce filtru

Porovnávání zástupných znaků (pouze alias): Při filtrování podle aliasu připojte * k předponám pro shodu.

foundry model list --filter alias=qwen*

Tento příkaz vrátí modely, jejichž alias začíná qwen.

Referenční informace: Speciální funkce filtru

Examples

foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider

Tyto příklady filtrují seznam modelů podle zařízení, úlohy a poskytovatele spouštění.

Referenční informace: Filtrování seznamu modelů

Note

Všechna porovnání nerozlišují malá a velká písmena.
Pro každý příkaz lze použít pouze jeden filtr.
Nerozpoznané klíče filtru způsobí chybu.

Interaktivní spuštění modelu

Spusťte model a interagujte s ním přímo v terminálu:

foundry model run qwen2.5-0.5b

Foundry Local stáhne model při prvním spuštění a pak spustí interaktivní relaci. Zadejte výzvu k získání odpovědi:

Why is the sky blue?

Tip

Nahraďte qwen2.5-0.5b libovolným aliasem modelu z katalogu. Spuštěním foundry model list zobrazíte dostupné modely. Foundry Local stáhne variantu, která nejlépe odpovídá vašemu hardwaru – například varianta CUDA pro GRAFICKÉ procesory NVIDIA nebo varianta NPU pro NpU Typu NpU.

Service commands

Následující tabulka shrnuje příkazy související se správou a spuštěním místní služby Foundry:

Command	Description
`foundry service --help`	Zobrazí všechny dostupné příkazy související se službami a jejich použití.
`foundry service start`	Spustí službu „Foundry Local“.
`foundry service stop`	Zastaví službu Foundry Local.
`foundry service restart`	Restartuje službu Foundry Local.
`foundry service status`	Zobrazí aktuální stav místní služby Foundry.
`foundry service ps`	Zobrazí seznam všech modelů aktuálně načtených ve službě Foundry Local.
`foundry service diag`	Zobrazí protokoly místní služby Foundry.
`foundry service set <options>`	Nastaví konfiguraci místní služby Foundry.

Cache commands

Následující tabulka shrnuje příkazy pro správu místní mezipaměti, ve které jsou uložené modely:

Command	Description
`foundry cache --help`	Zobrazí všechny dostupné příkazy související s mezipamětí a jejich použití.
`foundry cache location`	Zobrazuje aktuální adresář mezipaměti.
`foundry cache list`	Zobrazí seznam všech modelů uložených v místní mezipaměti.
`foundry cache cd <path>`	Změní adresář mezipaměti na zadanou cestu.
`foundry cache remove <model>`	Odebere model z místní mezipaměti.

Execution providers

Poskytovatelé spouštění jsou hardwarově specifické akcelerační knihovny, které na vašem zařízení spouštějí modely nejefektivnějším možným způsobem.

Předdefinované zprostředkovatelé spouštění

Foundry Local zahrnuje zprostředkovatele spouštění procesoru, poskytovatele spuštění WebGPU a poskytovatele provádění CUDA.

Poskytovatel spouštění procesoru používá Microsoft Lineární podprogramy Algebra (MLAS) ke spuštění na libovolném procesoru a je náhradním procesorem pro Foundry Local.

Zprostředkovatel spouštění WebGPU používá Dawn, nativní implementaci webového rozhraní API pro akceleraci libovolného GPU a je náhradním gpu pro Foundry Local.

Zprostředkovatel provádění CUDA používá NVIDIA CUDA pro akceleraci grafických procesorů NVIDIA. Vyžaduje řadu NVIDIA GeForce RTX 30 a novější s minimální doporučenou verzí ovladače 32.0.15.5585 a CUDA verze 12.5. Podléhá následujícím licenčním podmínkám: Licenční smlouva pro NVIDIA Software Development Kits – EULA.

Poskytovatelé spouštění modulů plug-in

Poskytovatelé spouštění uvedené v následující tabulce jsou k dispozici pro dynamické stahování a registraci v Windows v závislosti na kompatibilitě zařízení a ovladačů. Podléhají zadaným licenčním podmínkám.

Foundry Local automaticky stáhne tyto zprostředkovatele spouštění při prvním spuštění. Poskytovatelé spouštění modulů plug-in se automaticky aktualizují, když jsou k dispozici nové verze.

Name (Vendor)	Requirements	License terms
`NvTensorRTRTXExecutionProvider` (NVIDIA)	NVIDIA GeForce RTX 30XX a novější verze s minimální doporučenou verzí ovladače 32.0.15.5585 a CUDA verze 12.5	Licenční smlouva pro sady NVIDIA Software Development Kits – EULA
`OpenVINOExecutionProvider` (Intel)	PROCESOR: Intel TigerLake (11. generace) a novější verze s minimálním doporučeným ovladačem 32.0.100.9565 GPU: Intel AlderLake (12. generace) a novější verze s minimálním doporučeným ovladačem 32.0.101.1029 NPU: Intel ArrowLake (15. generace) a novější verze s minimálním doporučeným ovladačem 32.0.100.4239	Licenční smlouva s komerčním využitím distribuce Intel OBL v2025.02.12
`QNNExecutionProvider` (Roku 2019)	Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU s minimální verzí ovladače 30.0.140.0 a novějšími verzemi Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU s minimální verzí ovladače 30.0.140.0 a dalšími verzemi.	Pokud chcete zobrazit licenci QNN, stáhněte si Qualcomm® Neural Processing SDK, extrahujte soubor ZIP a otevřete soubor LICENSE.pdf.
`VitisAIExecutionProvider` (AMD)	Min: Adrenalin Edition 25.6.3 s ovladačem NPU 32.00.0203.280 Max: Adrenalin Edition 25.9.1 s ovladačem NPU 32.00.0203.297	Nevyžaduje se žádná další licence.

Použití Open WebUI s místním serverem

Připojte Open WebUI k Foundry Local pro rozhraní chatu založeného na prohlížeči, které běží zcela na vašem zařízení.

Spusťte model a nechte terminál otevřený:
```
foundry model run qwen2.5-0.5b
```
Získejte adresu URL místního koncového bodu:
```
foundry service status
```
Zkopírujte adresu URL koncového bodu. Foundry Local při každém spuštění služby přiřadí dynamický port.
Nainstalujte a spusťte Open WebUI a otevřete ho http://localhost:8080 v prohlížeči.
Připojit Open WebUI k Foundry Local:
1. Přejděte na>Připojení> a povolte přímá připojení.
2. Přejděte na Nastavení>Připojení>Spravovat přímá připojení a vyberte +.
3. Nastavte adresu URL na http://localhost:PORT/v1 (nahraďte PORT portem z kroku 2) a ověřováním na Hodnotu None.
4. Select Save.
V rozevíracím seznamu vyberte model a začněte chatovat.

Tip

Pokud se nezobrazí žádné modely, spusťte foundry model run <model> v terminálu a znovu načtěte Open WebUI. Pokud se připojení nezdaří, potvrďte port pomocí foundry service status.

Upgrade systému Foundry na místní úrovni

Spuštěním příkazu pro váš operační systém upgradujte Foundry Local.

Windows:

winget upgrade --id Microsoft.FoundryLocal

macOS:
```
brew upgrade foundrylocal
```

Odinstalujte Foundry Local

Spuštěním příkazu pro váš operační systém odinstalujte Foundry Local.

Windows:

winget uninstall Microsoft.FoundryLocal

macOS:

brew rm foundrylocal
brew untap microsoft/foundrylocal
brew cleanup --scrub

Troubleshooting

Problémy s připojením ke službě

Pokud se při spuštění příkazu zobrazí tato chyba, například foundry model list:

Exception: Request to local service failed.
Uri: http://127.0.0.1:0/foundry/list

The requested address is not valid in its context. (127.0.0.1:0)

Please check service status with 'foundry service status'.

Zrestartujte službu:

foundry service restart

Tento příkaz opravuje případy, kdy se služba spouští, ale není přístupná kvůli problému s vazbou portu.

Další pokyny k řešení potíží najdete v tématu Osvědčené postupy a řešení potíží.

Váš názor

Byla tato stránka užitečná?

Last updated on 2026-04-09

Referenční informace k místnímu rozhraní příkazového řádku Foundry

Prerequisites

Nainstalujte Foundry Local

Quick verification

Overview

Model commands

Řazení modelů v seznamu

Filtrování seznamu modelů

zařízení – Typ hardwarového zařízení

provider – Zprostředkovatel spuštění

task – typ úlohy modelu

alias – Modelový alias

Speciální funkce filtru

Examples

Interaktivní spuštění modelu

Service commands

Cache commands

Execution providers

Předdefinované zprostředkovatelé spouštění

Poskytovatelé spouštění modulů plug-in

Použití Open WebUI s místním serverem

Upgrade systému Foundry na místní úrovni

Odinstalujte Foundry Local

Troubleshooting

Problémy s připojením ke službě

Váš názor

Další materiály