Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Penting
- Foundry Local CLI tersedia dalam pratinjau. Rilis pratinjau publik menyediakan access awal untuk fitur yang berada dalam penyebaran aktif.
- Fitur, pendekatan, dan proses dapat berubah atau memiliki kemampuan terbatas, sebelum Ketersediaan Umum (GA).
Artikel ini menyediakan referensi komprehensif untuk antarmuka baris perintah (CLI) Foundry Local. CLI mengatur perintah ke dalam kategori logis untuk membantu Anda mengelola model, mengontrol layanan, dan memelihara cache lokal Anda.
Prasyarat
- Instal Foundry Local.
- Terminal lokal tempat
foundryCLI tersedia. - Pastikan Anda memiliki akses internet untuk pengunduhan pertama (penyedia eksekusi dan model).
- Azure RBAC: Tidak berlaku (berjalan secara lokal).
- Jika Anda memiliki Intel NPU pada Windows, instal driver NPU Intel untuk akselerasi NPU yang optimal.
Instal Foundry Local
Instal Foundry Local dengan menggunakan manajer paket untuk sistem operasi Anda.
-
Windows: Buka terminal dan jalankan:
winget install Microsoft.FoundryLocal -
macOS: Buka terminal dan jalankan:
Atau, unduh alat penginstal dari repositori GitHub Foundry Local.brew tap microsoft/foundrylocal brew install foundrylocal
Verifikasi penginstalan:
foundry --version
Pastikan Anda memiliki hak admin untuk menginstal perangkat lunak.
Tip
Jika Anda melihat kesalahan koneksi layanan setelah penginstalan (misalnya, Request to local service failed), jalankan foundry service restart.
Verifikasi cepat
Jalankan perintah ini untuk mengonfirmasi bahwa CLI diinstal dan layanan dapat dijangkau.
Tampilkan bantuan CLI:
foundry --helpPerintah ini mencetak informasi penggunaan dan daftar grup perintah yang tersedia.
Referensi: Gambaran Umum
Periksa status layanan:
foundry service statusPerintah ini menampilkan status apakah layanan Foundry Local berjalan serta menyertakan titik akhir lokalnya.
Referensi: Perintah layanan
Gambaran Umum
Gunakan bantuan bawaan untuk menjelajahi perintah dan opsi.
CLI mengatur perintah ke dalam tiga kategori utama:
- Model: Perintah untuk mengelola dan menjalankan model AI
- Layanan: Perintah untuk mengontrol layanan Foundry Local
- Cache: Perintah untuk mengelola penyimpanan model lokal Anda
Perintah model
Tabel berikut ini meringkas perintah yang terkait dengan mengelola dan menjalankan model:
Nota
Anda dapat menentukan model argumen dengan alias atau ID modelnya. Menggunakan alias:
- Memilih model terbaik untuk perangkat keras yang tersedia secara otomatis. Misalnya, jika Anda memiliki GPU Nvidia yang tersedia, Foundry Local memilih model GPU terbaik. Jika Anda memiliki NPU yang tersedia dan didukung, Foundry Local akan memilih model NPU.
- Memungkinkan Anda menggunakan nama yang lebih pendek tanpa perlu mengingat ID model.
Jika Anda ingin menjalankan model tertentu, gunakan ID model. Misalnya, untuk menjalankan qwen2.5-0.5b pada CPU - terlepas dari perangkat keras Anda yang tersedia - gunakan: foundry model run qwen2.5-0.5b-instruct-generic-cpu.
| Perintah | Deskripsi |
|---|---|
foundry model --help |
Menampilkan semua perintah terkait model yang tersedia dan penggunaannya. |
foundry model run <model> |
Menjalankan model tertentu, mengunduhnya jika tidak di-cache, dan memulai interaksi. |
foundry model list |
Mencantumkan semua model yang tersedia untuk penggunaan lokal. Pada eksekusi pertama, ia mengunduh penyedia eksekusi (EPs) untuk perangkat keras Anda. |
foundry model list --filter <key>=<value> |
Mencantumkan model yang difilter berdasarkan kriteria yang ditentukan (perangkat, tugas, alias, penyedia). |
foundry model info <model> |
Menampilkan informasi terperinci tentang model tertentu. |
foundry model info <model> --license |
Menampilkan informasi lisensi untuk model tertentu. |
foundry model download <model> |
Mengunduh model ke cache lokal tanpa menjalankannya. |
foundry model load <model> |
Memuat model ke dalam layanan. |
foundry model unload <model> |
Menghapus model dari layanan. |
Pengurutan daftar model
Saat beberapa varian ID model tersedia untuk alias, daftar model menampilkan model dalam urutan prioritas. Model pertama dalam daftar adalah model yang berjalan saat Anda menentukan model dengan alias.
Pemfilteran daftar model
Perintah foundry model list ini mendukung model pemfilteran dengan menggunakan --filter opsi . Anda dapat memfilter model berdasarkan satu atribut dengan menggunakan pasangan kunci-nilai.
foundry model list --filter <key>=<value>
Perintah ini mencetak model yang cocok dengan kunci dan nilai filter.
Referensi: Pemfilteran daftar model
Nota
Saat Anda menjalankan foundry model list untuk pertama kalinya setelah penginstalan, Foundry Local secara otomatis mengunduh penyedia eksekusi (EP) yang relevan untuk konfigurasi perangkat keras komputer Anda. Anda melihat bilah kemajuan yang menunjukkan penyelesaian unduhan sebelum daftar model muncul.
Kunci filter yang didukung:
perangkat - Jenis Perangkat Keras
Memfilter model menurut perangkat keras tempat model dijalankan.
Nilai yang mungkin:
-
CPU- Model unit pemrosesan pusat -
GPU- Model unit pengolah grafis -
NPU- Model Unit Pemrosesan Syaraf
penyedia - Penyedia Eksekusi
Memfilter model menurut penyedia eksekusi atau runtimenya.
Nilai yang mungkin:
-
CPUExecutionProvider- Eksekusi berbasis CPU -
CUDAExecutionProvider- Pelaksanaan GPU NVIDIA CUDA -
WebGpuExecutionProvider- Eksekusi WebGPU -
QNNExecutionProvider- Pelaksanaan Jaringan Neural Qualcomm (NPU) -
OpenVINOExecutionProvider- Eksekusi Intel OpenVINO -
NvTensorRTRTXExecutionProvider- Eksekusi NVIDIA TensorRT -
VitisAIExecutionProvider- Eksekusi AMD Vitis AI
tugas - Jenis Tugas Model
Memfilter model berdasarkan kasus penggunaan atau tugas yang dimaksudkan.
Nilai umum:
-
chat-completion: Model AI Percakapan -
text-generation: Model pembuatan teks
alias - Alias dari Model
Memfilter model menurut pengidentifikasi aliasnya. Mendukung pencocokan karakter pengganti dengan akhiran *.
Nilai sampel:
phi4-cpuqwen2.5-coder-0.5b-instruct-generic-cpudeepseek-r1-distill-qwen-1.5b-generic-cpuphi-4-mini-instruct-generic-cpu
Fitur filter khusus
Dukungan Negasi: Awali nilai apa pun dengan ! untuk mengecualikan model yang cocok.
foundry model list --filter device=!GPU
Perintah ini mengecualikan model GPU dari hasil.
Referensi: Fitur filter khusus
Pencocokan karakter pengganti (hanya alias): Gunakan * untuk mencocokkan awalan saat memfilter berdasarkan alias.
foundry model list --filter alias=qwen*
Perintah ini mengembalikan model yang aliasnya dimulai dengan qwen.
Referensi: Fitur filter khusus
Contoh
foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider
Contoh-contoh ini memfilter daftar model menurut perangkat, tugas, dan penyedia eksekusi.
Referensi: Pemfilteran daftar model
Nota
- Semua perbandingan tidak sensitif huruf besar/kecil.
- Hanya satu filter yang dapat digunakan per perintah.
- Kunci filter yang tidak dikenal mengakibatkan kesalahan.
Menjalankan model secara interaktif
Jalankan model dan berinteraksi dengannya langsung di terminal:
foundry model run qwen2.5-0.5b
Foundry Local mengunduh model saat pertama kali dijalankan, lalu memulai sesi interaktif. Masukkan perintah untuk mendapatkan respons:
Why is the sky blue?
Tip
Ganti qwen2.5-0.5b dengan alias model apa pun dari katalog. Jalankan foundry model list untuk melihat model yang tersedia. Foundry Local mengunduh varian yang paling cocok dengan perangkat keras Anda — misalnya, varian CUDA untuk GPU NVIDIA atau varian NPU untuk NPU Qualcomm.
Perintah layanan
Tabel berikut ini meringkas perintah yang terkait dengan pengelolaan dan menjalankan layanan Foundry Local:
| Perintah | Deskripsi |
|---|---|
foundry service --help |
Menampilkan semua perintah terkait layanan yang tersedia dan penggunaannya. |
foundry service start |
Memulai layanan Foundry Local. |
foundry service stop |
Menghentikan layanan Foundry Local. |
foundry service restart |
Memulai ulang layanan Foundry Local. |
foundry service status |
Menampilkan status layanan Foundry Local saat ini. |
foundry service ps |
Mencantumkan semua model yang saat ini dimuat di layanan Foundry Local. |
foundry service diag |
Menampilkan log layanan Foundry Local. |
foundry service set <options> |
Mengatur konfigurasi layanan Foundry Local. |
Perintah cache
Tabel berikut ini meringkas perintah untuk mengelola cache lokal tempat model disimpan:
| Perintah | Deskripsi |
|---|---|
foundry cache --help |
Memperlihatkan semua perintah terkait cache yang tersedia dan penggunaannya. |
foundry cache location |
Memperlihatkan direktori cache saat ini. |
foundry cache list |
Mencantumkan semua model yang disimpan dalam cache lokal. |
foundry cache cd <path> |
Mengubah direktori cache ke jalur yang ditentukan. |
foundry cache remove <model> |
Menghapus model dari cache lokal. |
Penyedia pelaksanaan
Penyedia eksekusi adalah pustaka akselerasi khusus perangkat keras yang menjalankan model seefisien mungkin di perangkat Anda.
Penyedia eksekusi bawaan
Foundry Local mencakup penyedia eksekusi CPU, penyedia eksekusi WebGPU, dan penyedia eksekusi CUDA.
Penyedia eksekusi CPU menggunakan Microsoft Linear Algebra Subroutines (MLAS) untuk berjalan pada CPU apa pun dan merupakan fallback CPU untuk Foundry Local.
Penyedia pelaksana WebGPU menggunakan Dawn, implementasi asli dari API berbasis web, untuk akselerasi pada GPU apa pun, dan merupakan cadangan GPU untuk Foundry Local.
Penyedia eksekusi CUDA menggunakan NVIDIA CUDA untuk akselerasi pada GPU NVIDIA. Ini memerlukan seri NVIDIA GeForce RTX 30 dan yang lebih baru dengan driver minimum yang direkomendasikan versi 32.0.15.5585 dan CUDA versi 12.5. Ini tunduk pada persyaratan lisensi berikut: Perjanjian Lisensi untuk Kit Pengembangan Perangkat Lunak NVIDIA—EULA.
Penyedia pelaksanaan plugin
Penyedia eksekusi yang tercantum dalam tabel berikut ini tersedia untuk unduhan dan pendaftaran dinamis pada Windows, tergantung pada kompatibilitas perangkat dan driver. Mereka tunduk pada persyaratan lisensi yang ditentukan.
Foundry Local secara otomatis mengunduh penyedia eksekusi ini saat pertama kali dijalankan. Penyedia eksekusi plugin secara otomatis memperbarui ketika versi baru tersedia.
| Nama (Vendor) | Persyaratan | Ketentuan lisensi |
|---|---|---|
NvTensorRTRTXExecutionProvider (NVIDIA) |
NVIDIA GeForce RTX 30XX dan versi yang lebih baru dengan driver minimum yang direkomendasikan versi 32.0.15.5585 dan CUDA versi 12.5 | Perjanjian Lisensi untuk Kit Pengembangan Perangkat Lunak NVIDIA—EULA |
OpenVINOExecutionProvider (Intel) |
CPU: Intel TigerLake (Generasi ke-11) dan versi selanjutnya dengan driver minimum yang direkomendasikan 32.0.100.9565 GPU: Intel AlderLake (Gen ke-12) dan versi yang lebih baru dengan driver yang direkomendasikan min 32.0.101.1029 NPU: Intel ArrowLake generasi ke-15 dan versi-versi selanjutnya dengan driver minimum yang direkomendasikan 32.0.100.4239 |
Perjanjian Lisensi Penggunaan Komersial Distribusi Intel OBL v2025.02.12 |
QNNExecutionProvider (Qualcomm) |
Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU dengan driver minimum versi 30.0.140.0 dan versi yang lebih baru Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU dengan driver minimum versi 30.0.140.0 dan versi yang lebih baru |
Untuk melihat Lisensi QNN, unduh Qualcomm® Neural Processing SDK, ekstrak ZIP, dan buka file LICENSE.pdf. |
VitisAIExecutionProvider (AMD) |
Min: Adrenalin Edition 25.6.3 dengan driver NPU 32.00.0203.280 Maks: Adrenalin Edition 25.9.1 dengan driver NPU 32.00.0203.297 |
Tidak diperlukan lisensi tambahan |
Menggunakan Open WebUI dengan server lokal
Sambungkan Open WebUI ke Foundry Local untuk antarmuka obrolan berbasis browser yang berjalan sepenuhnya di perangkat Anda.
Mulai model dan biarkan terminal terbuka:
foundry model run qwen2.5-0.5bDapatkan URL titik akhir lokal Anda:
foundry service statusSalin URL titik akhir. Foundry Local menetapkan port dinamis setiap kali layanan dimulai.
Instal dan luncurkan Open WebUI, lalu buka
http://localhost:8080di browser Anda.Sambungkan Open WebUI ke Foundry Local:
- Buka Pengaturan>Pengaturan>Koneksi Admin dan aktifkan Koneksi Langsung.
- Buka Pengaturan>Koneksi>Kelola Koneksi Langsung dan pilih +.
- Atur URL ke
http://localhost:PORT/v1(gantiPORTdengan port dari langkah 2) dan Auth ke Tidak Ada. - Pilih Simpan.
Pilih model dari menu dropdown dan mulai mengobrol.
Tip
Jika tidak ada model yang muncul, jalankan foundry model run <model> di terminal dan muat ulang Open WebUI. Jika koneksi gagal, konfirmasikan port dengan foundry service status.
Mutakhirkan Foundry Local
Jalankan perintah untuk sistem operasi Anda untuk memutakhirkan Foundry Local.
-
Windows:
winget upgrade --id Microsoft.FoundryLocal -
macOS:
brew upgrade foundrylocal
Copot pemasangan Foundry Local
Jalankan perintah untuk sistem operasi Anda untuk menghapus instalasi Foundry Local.
-
Windows:
winget uninstall Microsoft.FoundryLocal -
macOS:
brew rm foundrylocal brew untap microsoft/foundrylocal brew cleanup --scrub
Troubleshooting
Masalah koneksi layanan
Jika Anda melihat kesalahan ini saat menjalankan perintah seperti foundry model list:
Exception: Request to local service failed.
Uri: http://127.0.0.1:0/foundry/list
The requested address is not valid in its context. (127.0.0.1:0)
Please check service status with 'foundry service status'.
Mulai ulang layanan :
foundry service restart
Perintah ini memperbaiki kasus di mana layanan berjalan tetapi tidak dapat diakses karena masalah pengikatan port.
Untuk panduan pemecahan masalah selengkapnya, lihat Praktik terbaik dan pemecahan masalah.