Bagikan melalui


Pengurangan dan penghapusan model untuk Microsoft Foundry Models

Microsoft Model Foundry terus disegarkan dengan model yang lebih baru dan lebih canggih. Sebagai bagian dari proses ini, penyedia model mungkin menghentikan atau memensiunkan model lamanya, dan Anda mungkin perlu memperbarui aplikasi Anda untuk menggunakan model yang lebih baru. Dokumen ini menyampaikan informasi tentang siklus hidup model dan jadwal penghentiannya, serta menjelaskan bagaimana Anda diberi tahu mengenai tahap-tahap siklus hidup model.

Artikel ini membahas informasi penurunan dan penghentian umum untuk Model Foundry. Untuk detail khusus Azure OpenAI dalam Model Foundry, lihat penghentian dan pensiun model Azure OpenAI dalam Model Foundry.

Tahapan siklus hidup model

Model dalam katalog model termasuk dalam salah satu tahap ini:

  • Pratinjau
  • Tersedia secara umum
  • Legacy
  • Deprecated
  • Dihentikan

Pratinjau

Model berlabel Pratinjau bersifat eksperimental. Bobot, runtime, dan skema API model dapat berubah saat model sedang dalam pratinjau. Model yang sedang dalam pratinjau tidak dijamin akan tersedia bagi publik. Model dalam pratinjau memiliki label Pratinjau di samping namanya di katalog model.

Tersedia secara umum (GA)

Tahap ini adalah tahap model default. Model yang tidak menyertakan label siklus hidup di samping namanya adalah GA dan cocok untuk digunakan di lingkungan produksi. Pada tahap ini, bobot model dan API yang telah ditetapkan. Namun, kontainer model atau runtime dengan kerentanan mungkin di-patch, tetapi patch tidak memengaruhi output model.

Legacy

Model yang diberi label Legacy akan dihentikan. Anda harus berencana untuk pindah ke model yang berbeda, seperti model baru yang ditingkatkan yang mungkin tersedia dalam keluarga model yang sama. Saat model berada dalam tahap lama, penyebaran model yang ada akan terus berfungsi, dan Anda dapat membuat penyebaran model baru sampai tanggal penghentian.

Deprecated

Model berlabel Tidak Digunakan Lagi tidak lagi tersedia untuk penyebaran baru. Anda tidak dapat membuat penempatan baru untuk model; namun, penempatan yang ada akan terus berfungsi hingga tanggal penghentian.

Dihentikan

Model berlabel Dihentikan tidak lagi tersedia untuk digunakan. Anda tidak dapat membuat penyebaran baru, dan upaya untuk menggunakan penyebaran yang ada mengembalikan kesalahan 404.

Pemberitahuan untuk Model Manufaktur

Pelanggan yang memiliki implementasi Model Foundry menerima pemberitahuan untuk model yang akan dihentikan sesuai dengan jadwal berikut:

  • Model diberi label Sebagai Warisan dan tetap dalam status warisan selama setidaknya 30 hari sebelum dipindahkan ke status tidak digunakan lagi. Selama periode pemberitahuan ini, Anda dapat membuat penyebaran baru untuk mempersiapkan pengurangan dan penghentian.

  • Model diberi label Tidak digunakan lagi dan tetap dalam status tidak digunakan lagi selama setidaknya 90 hari sebelum dipindahkan ke status dihentikan. Selama periode pemberitahuan ini, Anda dapat memigrasikan penyebaran yang ada ke model yang lebih baru atau pengganti.

Penting

Dalam beberapa kasus, penyedia model mungkin menghentikan model pada jadwal yang dipercepat dengan periode pemberitahuan yang lebih singkat. Selalu periksa tanggal tertentu dalam tabel penghentian yang akan datang untuk model Anda, karena garis waktu aktual untuk model tertentu lebih diutamakan daripada kebijakan umum.

Untuk setiap langganan yang memiliki model yang disebarkan sebagai penyebaran API tanpa server atau disebarkan ke sumber daya Foundry, anggota pemilik, kontributor, pembaca, kontributor pemantauan, dan peran pembaca pemantauan menerima pemberitahuan saat penghentian model diumumkan. Pemberitahuan berisi tanggal saat model memasuki status warisan, tidak digunakan lagi, dan dihentikan. Pemberitahuan mungkin memberikan informasi tentang kemungkinan opsi model penggantian, jika berlaku.

Cara memeriksa pemberitahuan

Untuk tetap mendapatkan informasi tentang perubahan siklus hidup model:

  1. Pantau email Anda untuk pemberitahuan yang dikirim ke anggota peran langganan.
  2. Tinjau tabel penghentian yang akan datang dalam artikel ini untuk tanggal terbaru.
  3. Siapkan pemberitahuan Azure Service Health agar langganan Anda menerima pemberitahuan otomatis tentang perubahan layanan.

Pemberitahuan untuk Azure OpenAI dalam Model Foundry

Untuk model Azure OpenAI, pelanggan yang memiliki penyebaran Azure OpenAI aktif menerima pemberitahuan untuk model yang akan dihentikan sebagai berikut:

  • Pada peluncuran model, kami secara programatik menetapkan tanggal pensiun "tidak lebih awal dari" (biasanya satu tahun ke depan).
  • Pemberitahuan setidaknya 60 hari sebelum penghentian model untuk model General Availability (GA).
  • Pemberitahuan setidaknya 30 hari sebelum pembaruan versi model pratinjau.

Anggota peran pemilik, kontributor, pembaca, kontributor pemantauan, dan pembaca pemantauan menerima pemberitahuan untuk setiap langganan dengan penyebaran model yang akan segera dipensiunkan.

Pensiun dilakukan secara bergilir, dari satu wilayah ke wilayah lainnya.

Untuk mempelajari selengkapnya tentang daur hidup model OpenAI Azure, termasuk informasi untuk model saat ini, dihapus secara bertahap, dan dihentikan, lihat Azure OpenAI dalam penghapusan dan penghentian model Foundry.

Pemensiunan yang akan datang untuk Model Foundry

Tabel berikut mencantumkan jadwal untuk model yang dijadwalkan untuk penghentian. Tahap siklus hidup mulai berlaku pada pukul 00.00.00 UTC pada tanggal yang ditentukan.

Cohere

Model Tanggal warisan Tanggal dihentikan Tanggal penghentian Model penggantian yang disarankan
Cohere-rerank-v3.5 14 Januari 2026 14 Februari 2026 Mei 14, 2026 Cohere-rerank-v4.0-pro, Cohere-rerank-v4.0-fast
Cohere-command-r-08-2024 12 Februari 2026 12 Maret 2026 Mei 12, 2026 Cohere-command-a
Cohere-command-r-plus-08-2024 12 Februari 2026 12 Maret 2026 Mei 12, 2026 Cohere-command-a

Deci AI

Model Tanggal warisan Tanggal dihentikan Tanggal penghentian Model penggantian yang disarankan
deci-decidiffusion-v1-0 16 Maret 2026 16 April 2026 31 Juli 2026 N/A

Meta

Model Tanggal warisan Tanggal dihentikan Tanggal penghentian Model penggantian yang disarankan
Meta-Llama-3.1-405B-Instruct Februari 13, 2026 13 Maret 2026 13 Juni 2026 N/A
Meta-Llama-3.1-8B-Instruct Februari 13, 2026 13 Maret 2026 13 Juni 2026 N/A
Meta-Llama-3.1-8B Februari 13, 2026 13 Maret 2026 13 Juni 2026 N/A
Llama-3.2-11B-Vision-Instruct Februari 13, 2026 13 Maret 2026 13 Juni 2026 Llama-4-Maverick-17B-128E-Instruct-FP8, Llama-4-Scout-17B-16E-Instruct
Llama-3.2-90B-Vision-Instruct Februari 13, 2026 13 Maret 2026 13 Juni 2026 Llama-4-Maverick-17B-128E-Instruct-FP8, Llama-4-Scout-17B-16E-Instruct

Microsoft

Model Tanggal warisan Tanggal dihentikan Tanggal penghentian Model penggantian yang disarankan
analisis laporan keuangan 16 Maret 2026 16 April 2026 31 Juli 2026 N/A
financial-reports-analysis-v2 16 Maret 2026 16 April 2026 31 Juli 2026 N/A
peraturan perdagangan rantai pasokan 16 Maret 2026 16 April 2026 31 Juli 2026 N/A
regulasi-rantai-pasok-perdagangan-v2 16 Maret 2026 16 April 2026 31 Juli 2026 N/A

xAI

Model Tanggal warisan Tanggal dihentikan Tanggal penghentian Model penggantian yang disarankan
grok-4-penalaran cepat 26 Maret 2026 1 April 2026 1 Mei 2026 grok-4-1-fast-reasoning
grok-4-fast-non-reasoning 26 Maret 2026 1 April 2026 1 Mei 2026 grok-4-1-fast-non-reasoning
grok-3-mini 26 Maret 2026 1 April 2026 1 Mei 2026 grok-4-1-fast-reasoning
grok-3 26 Maret 2026 1 April 2026 1 Mei 2026 grok-4

Model Foundry yang Dihentikan

Model berikut dihentikan pada 00:00:00 UTC pada tanggal yang ditentukan dan tidak tersedia untuk penyebaran atau inferensi baru.

Lab AI21

Model Tanggal penghentian Model penggantian yang disarankan
Panduan Jamba 1 Maret 2025 N/A
AI21-Jamba-1.5-Large 1 Agustus 2025 N/A
AI21-Jamba-1.5-Mini 1 Agustus 2025 N/A

Bria

Model Tanggal penghentian Model penggantian yang disarankan
Bria-2.3-Fast 31 Oktober 2025 N/A

Cohere

Model Tanggal penghentian Model penggantian yang disarankan
Perintah R 30 Juni 2025 Command Cohere R 08-2024
Perintah R+ 30 Juni 2025 Komando Cohere R+ 08-2024
Cohere-rerank-v3-english 30 Juni 2025 Cohere-rerank-v4.0-pro, Cohere-rerank-v4.0-fast
Cohere-rerank-v3-multibahasa 30 Juni 2025 Cohere-rerank-v4.0-pro, Cohere-rerank-v4.0-fast

Core42

Model Tanggal penghentian Model penggantian yang disarankan
jais-30b-chat 30 Januari 2026 N/A

DeepSeek

Model Tanggal penghentian Model penggantian yang disarankan
DeepSeek-V3 31 Agustus 2025 DeepSeek-V3-0324

Gretel

Model Tanggal penghentian Model penggantian yang disarankan
Gretel-Navigator-Tabular 16 September 2025 N/A

Meta

Model Tanggal penghentian Model penggantian yang disarankan
Llama-2-13b 30 Juni 2025 Meta-Llama-3.1-8B-Instruct
Llama-2-13b-chat 30 Juni 2025 Meta-Llama-3.1-8B-Instruct
Llama-2-70b 30 Juni 2025 Llama-3.3-70B-Instruct
Llama-2-70b-chat 30 Juni 2025 Llama-3.3-70B-Instruct
Llama-2-7b 30 Juni 2025 Meta-Llama-3.1-8B-Instruct
Llama-2-7b-chat 30 Juni 2025 Meta-Llama-3.1-8B-Instruct
Meta-Llama-3-70B-Instruct 30 Juni 2025 Llama-3.3-70B-Instruct
Meta-Llama-3-8B-Instruct 30 Juni 2025 Meta-Llama-3.1-8B-Instruct
Meta-Llama-3.1-70B-Instruct 30 Juni 2025 Llama-3.3-70B-Instruct

Microsoft

Model Tanggal penghentian Model penggantian yang disarankan
MAI-DS-R1 Februari 27, 2026 Model DeepSeek apa pun yang tersedia di katalog Model
Phi-3-medium-4k-instruct 30 Agustus 2025 Phi-4
Phi-3-medium-128k-instruct 30 Agustus 2025 Phi-4
Phi-3-mini-4k-instruct 30 Agustus 2025 Phi-4-mini-instruct
Phi-3-mini-128k-instruct 30 Agustus 2025 Phi-4-mini-instruct
Phi-3-small-8k-instruct 30 Agustus 2025 Phi-4-mini-instruct
Phi-3-small-128k-instruct 30 Agustus 2025 Phi-4-mini-instruct
Phi-3.5-mini-instruct 30 Agustus 2025 Phi-4-mini-instruct
Phi-3.5-MoE-instruct 30 Agustus 2025 Phi-4-mini-instruct
Phi-3.5-visi-instruksi 30 Agustus 2025 Phi-4-mini-instruct

Mistral Kecerdasan Buatan

Model Tanggal penghentian Model penggantian yang disarankan
Mistral-Nemo 30 Januari 2026 Mistral-small-2503
Mistral-large-2411 30 Januari 2026 Mistral-medium-2505
Mistral-ocr-2503 30 Januari 2026 Mistral-document-ai-2505
Mistral-small 31 Juli 2025 Mistral-small-2503
Mistral-large-2407 13 Mei 2025 Mistral-medium-2505
Mistral-large 15 April 2025 Mistral-medium-2505

Moonshot AI

Model Tanggal penghentian Model penggantian yang disarankan
Kimi-k2-thinking 29 Maret 2026 Kimi-k2.5

Bermigrasi ke model pengganti

Saat model yang Anda gunakan memasuki tahap warisan atau tidak digunakan lagi, ikuti langkah-langkah berikut untuk bermigrasi:

  1. Identifikasi penggantian. Periksa kolom Model penggantian yang disarankan di tabel pensiun mendatang atau model yang dihentikan.
  2. Uji penggantian. Sebarkan model pengganti yang disarankan dan validasi bahwa model tersebut memenuhi persyaratan aplikasi Anda, termasuk kualitas output, latensi, dan biaya.
  3. Perbarui penyebaran Anda. Buat penyebaran baru dengan model pengganti dan perbarui kode aplikasi Anda untuk menunjuk ke nama penyebaran baru.
  4. Hapus penyebaran lama. Setelah Anda mengonfirmasi bahwa komponen pengganti berfungsi dengan benar, hapus penyebaran model yang sudah usang untuk menghindari kesalahan tak terduga 404 setelah penghentian.

Petunjuk / Saran

Mulai migrasi segera setelah model memasuki tahap Warisan . Ini memberi Anda waktu maksimum untuk pengujian dan transisi sebelum model tidak digunakan lagi dan penyebaran baru diblokir.