Foundry ローカル「CLI」リファレンス

Important

Foundry Local CLI はプレビューで利用できます。パブリックプレビューリリースでは、アクティブなデプロイ中の機能に早期accessが提供されます。
一般提供 (GA) の前は、機能、アプローチ、プロセスが変更されたり、機能が制限されたりする場合があります。

この記事では、Foundry Local コマンドラインインターフェイス (CLI) の包括的なリファレンスを提供します。 CLI は、モデルの管理、サービスの制御、ローカルキャッシュの維持に役立つコマンドを論理カテゴリに編成します。

Prerequisites

Foundry Local をインストールします。
foundry CLI が使用可能なローカルターミナル。
初回ダウンロード（実行プロバイダーとモデル）のためにインターネットアクセスがあることを確認します。
Azure RBAC: 適用できません (ローカルで実行されます)。
Windowsに Intel NPU がある場合は、最適な NPU アクセラレーションのために Intel NPU ドライバーをインストールします。

Foundry Local のインストール

オペレーティングシステムのパッケージマネージャーを使用して Foundry Local をインストールします。

Windows: ターミナルを開き、次のコマンドを実行します。
```
winget install Microsoft.FoundryLocal
```
macOS: ターミナルを開き、次のコマンドを実行します。
```
brew tap microsoft/foundrylocal
brew install foundrylocal
```
または、Foundry Local GitHub リポジトリからインストーラーをダウンロードします。

インストールを確認します。

foundry --version

ソフトウェアをインストールするための管理者権限があることを確認します。

Tip

インストール後にサービス接続エラー ( Request to local service failed など) が表示された場合は、 foundry service restart実行します。

Quick verification

これらのコマンドを実行して、CLI がインストールされ、サービスに到達可能であることを確認します。

CLI のヘルプを表示する:
```
 foundry --help
```
このコマンドは、使用状況情報と使用可能なコマンドグループの一覧を出力します。

Reference: Overview
サービスの状態を確認します。
```
 foundry service status
```
このコマンドは、Foundry Local サービスが実行されていて、そのローカルエンドポイントが含まれているかどうかを出力します。

リファレンス: サービスコマンド

Overview

組み込みのヘルプを使用して、コマンドとオプションを調べる。

CLI は、次の 3 つの主要なカテゴリにコマンドを整理します。

モデル: AI モデルを管理および実行するためのコマンド
サービス: Foundry Local サービスを制御するためのコマンド
Cache: ローカルモデルストレージを管理するためのコマンド

Model commands

次の表は、モデルの管理と実行に関連するコマンドをまとめたものです。

Note

model引数は、そのエイリアスまたはモデル ID で指定できます。エイリアスの使用:

使用可能なハードウェアに最適なモデルを自動的に選択します。たとえば、Nvidia GPU を使用できる場合、Foundry Local は最適な GPU モデルを選択します。サポートされている NPU を使用できる場合は、Foundry Local によって NPU モデルが選択されます。
モデル ID を覚えておく必要なく、短い名前を使用できます。

特定のモデルを実行する場合は、モデル ID を使用します。たとえば、使用可能なハードウェアに関係なく、CPU で qwen2.5-0.5b を実行するには、 foundry model run qwen2.5-0.5b-instruct-generic-cpuを使用します。

Command	Description
`foundry model --help`	使用可能なすべてのモデル関連コマンドとその使用方法を表示します。
`foundry model run <model>`	指定したモデルを実行し、キャッシュされていない場合はダウンロードして、対話を開始します。
`foundry model list`	ローカルで使用できるすべてのモデルを一覧表示します。初回実行時には、ハードウェアの実行プロバイダー (EP) がダウンロードされます。
`foundry model list --filter <key>=<value>`	指定した条件 (デバイス、タスク、エイリアス、プロバイダー) でフィルター処理されたモデルを一覧表示します。
`foundry model info <model>`	特定のモデルに関する詳細情報を表示します。
`foundry model info <model> --license`	特定のモデルのライセンス情報を表示します。
`foundry model download <model>`	モデルを実行せずにローカルキャッシュにダウンロードします。
`foundry model load <model>`	サービスにモデルを読み込みます。
`foundry model unload <model>`	サービスからモデルをアンロードします。

モデルリストの順序付け

エイリアスに対して複数のモデル ID バリアントを使用できる場合、モデルの一覧にモデルが優先順位で表示されます。一覧の最初のモデルは、 aliasでモデルを指定したときに実行されるモデルです。

モデルリストのフィルタリング

foundry model list コマンドでは、--filter オプションを使用したモデルのフィルター処理がサポートされています。キーと値のペアを使用して、1 つの属性に基づいてモデルをフィルター処理できます。

foundry model list --filter <key>=<value>

このコマンドは、フィルターキーと値に一致するモデルを出力します。

リファレンス: モデルリストのフィルター処理

Note

インストール後に foundry model list を初めて実行すると、Foundry Local によって、コンピューターのハードウェア構成に関連する実行プロバイダー (IP) が自動的にダウンロードされます。モデルの一覧が表示される前に、ダウンロードの完了を示す進行状況バーが表示されます。

サポートされているフィルターキー:

デバイス - ハードウェアデバイスの種類

実行されているハードウェアデバイスによってモデルをフィルター処理します。

Possible values:

CPU - 中央処理装置モデル
GPU - グラフィックス処理装置モデル
NPU - ニューラル処理ユニットモデル

プロバイダー - 実行プロバイダー

実行プロバイダーまたはランタイムによってモデルをフィルター処理します。

Possible values:

CPUExecutionProvider - CPU ベースの実行
CUDAExecutionProvider - NVIDIA CUDA GPU の実行
WebGpuExecutionProvider - WebGPU の実行
QNNExecutionProvider - Qualcomm ニューラルネットワーク処理 (NPU)
OpenVINOExecutionProvider - Intel OpenVINO の実行
NvTensorRTRTXExecutionProvider - NVIDIA TensorRT の実行
VitisAIExecutionProvider - AMD Vitis AI の実行

task - モデルタスクの種類

モデルを目的のユースケースまたはタスクでフィルター処理します。

Common values:

chat-completion: 会話型 AI モデル
text-generation: テキスト生成モデル

alias - モデルエイリアス

エイリアス識別子でモデルをフィルター処理します。 * サフィックスを使用したワイルドカード照合をサポートします。

Sample values:

phi4-cpu
qwen2.5-coder-0.5b-instruct-generic-cpu
deepseek-r1-distill-qwen-1.5b-generic-cpu
phi-4-mini-instruct-generic-cpu

特殊なフィルター機能

否定のサポート: 一致するモデルを除外するには、 ! を使用して値のプレフィックスを付けます。

foundry model list --filter device=!GPU

このコマンドは、結果から GPU モデルを除外します。

リファレンス: 特殊なフィルター機能

ワイルドカード一致 (エイリアスのみ): エイリアスでフィルター処理するときにプレフィックスに一致する * を追加します。

foundry model list --filter alias=qwen*

このコマンドは、エイリアスが qwen で始まるモデルを返します。

リファレンス: 特殊なフィルター機能

Examples

foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider

次の例では、デバイス、タスク、実行プロバイダーによってモデルの一覧をフィルター処理します。

リファレンス: モデルリストのフィルター処理

Note

すべての比較において大文字と小文字を区別しません。
コマンドごとに使用できるフィルターは 1 つだけです。
認識できないフィルターキーを使用すると、エラーが発生します。

モデルを対話形式で実行する

モデルを実行し、ターミナルで直接操作します。

foundry model run qwen2.5-0.5b

Foundry Local は、最初の実行時にモデルをダウンロードし、対話型セッションを開始します。応答を取得するためのプロンプトを入力します。

Why is the sky blue?

Tip

qwen2.5-0.5bをカタログの任意のモデルエイリアスに置き換えます。 foundry model listを実行して、使用可能なモデルを表示します。 Foundry Local は、ハードウェアに最適なバリアント (NVIDIA GPU の CUDA バリアントや、Qualcomm NPU の NPU バリアントなど) をダウンロードします。

Service commands

次の表は、Foundry Local サービスの管理と実行に関連するコマンドをまとめたものです。

Command	Description
`foundry service --help`	使用可能なすべてのサービス関連コマンドとその使用方法を表示します。
`foundry service start`	Foundry Local サービスを開始します。
`foundry service stop`	Foundry Local サービスを停止します。
`foundry service restart`	Foundry Local サービスを再起動します。
`foundry service status`	Foundry Local サービスの現在の状態を表示します。
`foundry service ps`	Foundry Local サービスに現在読み込まれているすべてのモデルを一覧表示します。
`foundry service diag`	Foundry Local サービスのログを表示します。
`foundry service set <options>`	Foundry Local サービスの構成を設定します。

Cache commands

次の表は、モデルが格納されているローカルキャッシュを管理するためのコマンドをまとめたものです。

Command	Description
`foundry cache --help`	使用可能なすべてのキャッシュ関連コマンドとその使用状況が表示されます。
`foundry cache location`	現在のキャッシュディレクトリを表示します。
`foundry cache list`	ローカルキャッシュに格納されているすべてのモデルを一覧表示します。
`foundry cache cd <path>`	キャッシュディレクトリを指定したパスに変更します。
`foundry cache remove <model>`	ローカルキャッシュからモデルを削除します。

Execution providers

実行プロバイダーは、デバイスで可能な限り効率的にモデルを実行するハードウェア固有のアクセラレーションライブラリです。

組み込みの実行プロバイダー

Foundry Local には、CPU 実行プロバイダー、WebGPU 実行プロバイダー、および CUDA 実行プロバイダーが含まれます。

CPU 実行プロバイダーは、Microsoft線形代数サブルーチン (MLAS) を使用して任意の CPU で実行され、Foundry Local の CPU フォールバックです。

WebGPU 実行プロバイダーは、web ベースの API のネイティブ実装である Dawn を任意の GPU での高速化に使用し、Foundry Local の GPU フォールバックです。

CUDA 実行プロバイダーは、NVIDIA GPU の高速化に NVIDIA CUDA を使用します。最小推奨ドライバーバージョン 32.0.15.5585 および CUDA バージョン 12.5 を備えた NVIDIA GeForce RTX 30 シリーズ以降が必要です。 NVIDIA ソフトウェア開発キットの使用許諾契約書 (EULA) のライセンス条項が適用されます。

プラグイン実行プロバイダー

次の表に示す実行プロバイダーは、デバイスとドライバーの互換性に応じて、Windowsでの動的なダウンロードと登録に使用できます。指定されたライセンス条項に従います。

Foundry Local では、最初の実行時にこれらの実行プロバイダーが自動的にダウンロードされます。プラグイン実行プロバイダーは、新しいバージョンが利用可能になると自動的に更新されます。

Name (Vendor)	Requirements	License terms
`NvTensorRTRTXExecutionProvider` (NVIDIA)	最小推奨ドライバーバージョン 32.0.15.5585 および CUDA バージョン 12.5 の NVIDIA GeForce RTX 30XX 以降のバージョン	NVIDIA ソフトウェア開発キットの使用許諾契約書 - EULA
`OpenVINOExecutionProvider` （インテル）	CPU: Intel TigerLake (第 11 世代) 以降のバージョン (最小推奨ドライバー 32.0.100.9565) GPU: Intel AlderLake (第 12 世代) 以降のバージョン (最小推奨ドライバー 32.0.101.1029) NPU: Intel ArrowLake (第 15 世代) 以降のバージョン (最小推奨ドライバー 32.0.100.4239)	Intel OBLディストリビューション商用使用ライセンス契約 v2025.02.12
`QNNExecutionProvider` (クアルコム)	Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU (最小ドライバーバージョン 30.0.140.0 以降) Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU (最小ドライバーバージョン 30.0.140.0 以降)	QNN ライセンスを表示するには、Qualcomm® Neural Processing SDK をダウンロードし、ZIP を抽出して、LICENSE.pdf ファイルを開きます。
`VitisAIExecutionProvider` (AMD)	最小要件: Adrenalin Edition 25.6.3 (NPU ドライバー 32.00.0203.280) Max: アドレナリンエディション 25.9.1 と NPU ドライバー 32.00.0203.297	追加のライセンスは必要ありません

ローカルサーバーで Open WebUI を使用する

Open WebUI を Foundry Local に接続して、デバイス上で完全に実行されるブラウザーベースのチャットインターフェイスを作成します。

モデルを開始し、ターミナルを開いたままにします。
```
foundry model run qwen2.5-0.5b
```
ローカルエンドポイントの URL を取得します。
```
foundry service status
```
エンドポイント URL をコピーします。 Foundry Local では、サービスが開始されるたびに動的ポートが割り当てられます。
Open WebUI をインストールして起動し、ブラウザーでhttp://localhost:8080を開きます。
Open WebUI を Foundry Local に接続する:
1. 設定>Admin 設定>Connections に移動し、直接接続を有効にします。
2. 設定>Connections>Manage Direct Connections に移動し、+を選択します。
3. URL を http://localhost:PORT/v1 に設定し (PORTを手順 2 のポートに置き換えます)、認証を [なし] に設定します。
4. Select Save.
ドロップダウンからモデルを選択し、チャットを開始します。

Tip

モデルが表示されない場合は、ターミナルで foundry model run <model> を実行し、Open WebUI を再読み込みします。接続に失敗した場合は、 foundry service statusでポートを確認します。

Foundry Local のアップグレード

オペレーティングシステムのコマンドを実行して Foundry Local をアップグレードします。

Windows:

winget upgrade --id Microsoft.FoundryLocal

macOS:
```
brew upgrade foundrylocal
```

Foundry Local のアンインストール

オペレーティングシステムのコマンドを実行して Foundry Local をアンインストールします。

Windows:

winget uninstall Microsoft.FoundryLocal

macOS:

brew rm foundrylocal
brew untap microsoft/foundrylocal
brew cleanup --scrub

Troubleshooting

サービス接続の問題

foundry model listのようなコマンドを実行するときにこのエラーが表示される場合:

Exception: Request to local service failed.
Uri: http://127.0.0.1:0/foundry/list

The requested address is not valid in its context. (127.0.0.1:0)

Please check service status with 'foundry service status'.

サービスを再起動します。

foundry service restart

このコマンドは、サービスが実行されているが、ポートバインドの問題のためにアクセスできない場合を修正します。

トラブルシューティングのガイダンスについては、「ベストプラクティスとトラブルシューティング」を参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-09

Foundry ローカル「CLI」リファレンス

Prerequisites

Foundry Local のインストール

Quick verification

Overview

Model commands

モデル リストの順序付け

モデルリストのフィルタリング

デバイス - ハードウェア デバイスの種類

プロバイダー - 実行プロバイダー

task - モデル タスクの種類

alias - モデルエイリアス

特殊なフィルター機能

Examples

モデルを対話形式で実行する

Service commands

Cache commands

Execution providers

組み込みの実行プロバイダー

プラグイン実行プロバイダー

ローカル サーバーで Open WebUI を使用する

Foundry Local のアップグレード

Foundry Local のアンインストール

Troubleshooting

サービス接続の問題

フィードバック

その他のリソース

モデルリストの順序付け

デバイス - ハードウェアデバイスの種類

task - モデルタスクの種類

ローカルサーバーで Open WebUI を使用する