Bagikan melalui


Apa yang baru di Azure OpenAI Service

Artikel ini menyediakan ringkasan rilis terbaru dan pembaruan dokumentasi utama untuk Azure OpenAI.

Juni 2024

Pembaruan tanggal penghentian

  • Tanggal penghentian 0301 yang diperbarui gpt-35-turbo menjadi tidak lebih awal dari 1 Oktober 2024.
  • Diperbarui gpt-35-turbo & gpt-35-turbo-16k0613 tanggal penghentian hingga 1 Oktober 2024.
  • Diperbarui gpt-4 & gpt-4-32k 0314 tanggal penghentian hingga 1 Oktober 2024, dan tanggal penghentian menjadi 6 Juni 2025.

Lihat panduan penghentian model kami untuk informasi terbaru tentang penghentian dan penghentian model.

Penagihan berbasis token untuk penyempurnaan

  • Penagihan penyempurnaan Azure OpenAI sekarang didasarkan pada jumlah token dalam file pelatihan Anda - alih-alih total waktu pelatihan yang berlalu. Ini dapat mengakibatkan pengurangan biaya yang signifikan untuk beberapa eksekusi pelatihan, dan membuat memperkirakan biaya penyempurnaan jauh lebih mudah. Untuk mempelajari lebih lanjut, Anda dapat berkonsultasi dengan pengumuman resmi.

GPT-4o dirilis di wilayah baru

  • GPT-4o sekarang juga tersedia di:
    • Swedia Tengah untuk penyebaran regional standar.
    • Australia Timur, Kanada Timur, Jepang Timur, Korea Tengah, Swedia Tengah, Swiss Utara, & US Barat 3 untuk penyebaran yang disediakan.

Untuk informasi terbaru tentang ketersediaan model, lihat halaman model.

Dukungan kunci yang dikelola pelanggan (CMK) untuk Asisten

Utas dan File di Asisten sekarang mendukung CMK di wilayah berikut:

  • AS Barat 3

Mei 2024

Penyebaran yang disediakan GPT-4o

gpt-4o Versi: 2024-05-13 tersedia untuk penyebaran standar dan yang disediakan. Penyebaran model yang disediakan dan standar menerima permintaan inferensi teks dan gambar/penglihatan. Untuk informasi tentang ketersediaan regional model, lihat matriks model untuk penyebaran yang disediakan.

Asisten v2 (pratinjau)

Refresh Assistants API sekarang tersedia untuk umum. Ini berisi pembaruan berikut:

  • Alat pencarian file dan penyimpanan vektor
  • Penyelesaian maksimum dan dukungan token prompt maks untuk mengelola penggunaan token.
  • tool_choiceparameter untuk memaksa Asisten menggunakan alat tertentu. Anda sekarang dapat membuat pesan dengan peran asisten untuk membuat riwayat percakapan kustom di Utas.
  • Dukungan untuk temperatureparameter , top_p, response_format .
  • Dukungan streaming dan polling. Anda dapat menggunakan fungsi pembantu di Python SDK kami untuk membuat respons eksekusi dan streaming. Kami juga telah menambahkan pembantu SDK polling untuk berbagi pembaruan status objek tanpa perlu polling.
  • Bereksperimen dengan Logic Apps dan Function Calling menggunakan Azure OpenAI Studio. Impor REST API Anda yang diterapkan di Logic Apps sebagai fungsi dan studio memanggil fungsi (sebagai alur kerja Logic Apps) secara otomatis berdasarkan permintaan pengguna.
  • AutoGen by Microsoft Research menyediakan kerangka kerja percakapan multi-agen untuk memungkinkan pembuatan alur kerja Model Bahasa Besar (LLM) yang nyaman di berbagai aplikasi. Asisten Azure OpenAI sekarang diintegrasikan ke dalam AutoGen melalui GPTAssistantAgent, agen eksperimental baru yang memungkinkan Anda menambahkan Asisten dengan mulus ke dalam alur kerja multi-agen berbasis AutoGen. Ini memungkinkan beberapa asisten Azure OpenAI yang dapat menjadi tugas atau domain khusus untuk berkolaborasi dan mengatasi tugas yang kompleks.
  • Dukungan untuk model yang disempurnakan gpt-3.5-turbo-0125 di wilayah berikut:
    • AS Timur 2
    • Swedia Tengah
  • Dukungan regional yang diperluas untuk:
    • Jepang Timur
    • UK Selatan
    • US Barat
    • AS Barat 3
    • Norwegia timur

Untuk informasi selengkapnya, lihat posting blog tentang asisten.

Ketersediaan umum model GPT-4o (GA)

GPT-4o ("o adalah untuk "omni") adalah model terbaru dari OpenAI yang diluncurkan pada 13 Mei 2024.

  • GPT-4o mengintegrasikan teks, dan gambar dalam satu model, memungkinkannya menangani beberapa jenis data secara bersamaan. Pendekatan multimodal ini meningkatkan akurasi dan responsivitas dalam interaksi manusia-komputer.
  • GPT-4o cocok dengan GPT-4 Turbo dalam tugas teks dan pengodean bahasa Inggris sambil menawarkan performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi, menetapkan tolok ukur baru untuk kemampuan AI.

Untuk informasi tentang ketersediaan regional model, lihat halaman model.

Jenis penyebaran standar global (pratinjau)

Penyebaran global tersedia di sumber daya Azure OpenAI yang sama dengan penawaran non-global tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dengan ketersediaan terbaik untuk setiap permintaan. Standar global akan memberikan kuota default tertinggi untuk model baru dan menghilangkan kebutuhan untuk memuat keseimbangan di beberapa sumber daya.

Untuk informasi selengkapnya, lihat panduan jenis penyebaran.

Menyempurnakan pembaruan

Filter konten DALL-E dan GPT-4 Turbo Vision GA yang dapat dikonfigurasi

Buat filter konten kustom untuk penyebaran DALL-E 2 dan 3, GPT-4 Turbo dengan Vision GA (gpt-4-turbo-2024-04-09) dan GPT-4o. Pemfilteran konten

Filter Asinkron tersedia untuk semua pelanggan Azure OpenAI

Menjalankan filter secara asinkron untuk meningkatkan latensi dalam skenario streaming sekarang tersedia untuk semua pelanggan Azure OpenAI. Pemfilteran konten

Prompt Shields

Prompt Shields melindungi aplikasi yang didukung oleh model Azure OpenAI dari dua jenis serangan: serangan langsung (jailbreak) dan tidak langsung. Serangan Tidak Langsung (juga dikenal sebagai Serangan Prompt Tidak Langsung atau Serangan Injeksi Prompt Lintas Domain) adalah jenis serangan pada sistem yang didukung oleh model AI Generatif yang dapat terjadi ketika aplikasi memproses informasi yang tidak secara langsung ditulis oleh pengembang aplikasi atau pengguna. Pemfilteran konten

Rilis API pratinjau 05-01-2024

  • Untuk informasi selengkapnya, lihat siklus hidup versi API.

Ketersediaan umum model GPT-4 Turbo (GA)

Rilis GA terbaru dari GPT-4 Turbo adalah:

  • gpt-4Versi: turbo-2024-04-09

Ini adalah pengganti untuk model pratinjau berikut:

  • gpt-4Versi: 1106-Preview
  • gpt-4Versi: 0125-Preview
  • gpt-4Versi: vision-preview

Perbedaan antara OpenAI dan Azure OpenAI GPT-4 Turbo GA Model

  • Versi OpenAI dari model turbo terbaru 0409 mendukung mode JSON dan panggilan fungsi untuk semua permintaan inferensi.
  • Versi turbo-2024-04-09 Terbaru Azure OpenAI saat ini tidak mendukung penggunaan mode JSON dan panggilan fungsi saat membuat permintaan inferensi dengan input gambar (visi). Permintaan input berbasis teks (permintaan tanpa image_url dan gambar sebaris) mendukung mode JSON dan panggilan fungsi.

Perbedaan dari gpt-4 vision-preview

  • Integrasi peningkatan Visi khusus Azure AI dengan GPT-4 Turbo dengan Visi tidak didukung untuk gpt-4 Versi: turbo-2024-04-09. Ini termasuk Pengenalan Karakter Optik (OCR), landasan objek, permintaan video, dan peningkatan penanganan data Anda dengan gambar.

Ketersediaan terkelola yang disediakan GPT-4 Turbo

  • gpt-4Versi: turbo-2024-04-09 tersedia untuk penyebaran standar dan yang disediakan. Saat ini versi yang disediakan dari model ini tidak mendukung permintaan inferensi gambar/penglihatan. Penyebaran yang disediakan dari model ini hanya menerima input teks. Penyebaran model standar menerima permintaan inferensi teks dan gambar/visi.

Ketersediaan wilayah

Untuk informasi tentang ketersediaan regional model, lihat matriks model untuk penyebaran standar, dan yang disediakan.

Menyebarkan GPT-4 Turbo dengan Vision GA

Untuk menyebarkan model GA dari Studio UI, pilih GPT-4 lalu pilih turbo-2024-04-09 versi dari menu dropdown. Kuota default untuk gpt-4-turbo-2024-04-09 model akan sama dengan kuota saat ini untuk GPT-4-Turbo. Lihat batas kuota regional.

April 2024

Penyempurnaan sekarang didukung di dua wilayah baru US Timur 2 dan Swiss Barat

Penyempurnaan sekarang tersedia dengan dukungan untuk:

AS Timur 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Swiss Barat

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Periksa halaman model, untuk informasi terbaru tentang ketersediaan model dan dukungan penyempurnaan di setiap wilayah.

Contoh pelatihan obrolan multi-giliran

Penyempurnaan sekarang mendukung contoh pelatihan obrolan multi-giliran.

GPT-4 (0125) tersedia untuk Azure OpenAI On Your Data

Anda sekarang dapat menggunakan model GPT-4 (0125) di wilayah yang tersedia dengan Azure OpenAI On Your Data.

Maret 2024

Risiko & Pemantauan keamanan di Azure OpenAI Studio

Azure OpenAI Studio sekarang menyediakan dasbor Risks & Safety untuk setiap penyebaran Anda yang menggunakan konfigurasi filter konten. Gunakan untuk memeriksa hasil aktivitas pemfilteran. Kemudian Anda dapat menyesuaikan konfigurasi filter untuk melayani kebutuhan bisnis Anda dengan lebih baik dan memenuhi prinsip AI yang Bertanggung Jawab.

Gunakan Risiko & Pemantauan keamanan

Pembaruan Azure OpenAI On Your Data

  • Anda sekarang dapat menyambungkan ke database vektor Elasticsearch untuk digunakan dengan Azure OpenAI On Your Data.
  • Anda dapat menggunakan parameter ukuran gugus selama penyerapan data untuk mengatur jumlah maksimum token dari potongan data tertentu dalam indeks Anda.

API ketersediaan umum (GA) 2024-02-01 dirilis

Ini adalah rilis GA API terbaru dan merupakan pengganti rilis GA sebelumnya 2023-05-15 . Rilis ini menambahkan dukungan untuk fitur Azure OpenAI GA terbaru seperti Whisper, DALLE-3, fine-tuning, pada data Anda, dll.

Fitur yang masih dalam pratinjau seperti Asisten, teks ke ucapan (TTS), tertentu pada sumber data Anda, masih memerlukan versi API pratinjau. Untuk informasi selengkapnya, lihat panduan siklus hidup versi API kami.

Ketersediaan umum bisikan (GA)

Model Ucapan ke teks Berbisik sekarang menjadi GA untuk REST dan Python. SDK pustaka klien saat ini masih dalam pratinjau publik.

Cobalah Whisper dengan mengikuti mulai cepat.

Ketersediaan umum DALL-E 3 (GA)

Model pembuatan gambar DALL-E 3 sekarang menjadi GA untuk REST dan Python. SDK pustaka klien saat ini masih dalam pratinjau publik.

Cobalah DALL-E 3 dengan mengikuti mulai cepat.

Dukungan regional baru untuk DALL-E 3

Anda sekarang dapat mengakses DALL-E 3 dengan sumber daya Azure OpenAI di East US wilayah atau AustraliaEast Azure, selain SwedenCentral.

Penghentian dan penghentian model

Kami telah menambahkan halaman untuk melacak penghentian dan penghentian model di Azure OpenAI Service. Halaman ini menyediakan informasi tentang model yang saat ini tersedia, tidak digunakan lagi, dan dihentikan.

API pratinjau 03-03-2024 dirilis

2024-03-01-preview memiliki semua fungsionalitas yang sama dengan 2024-02-15-preview dan menambahkan dua parameter baru untuk penyematan:

  • encoding_format memungkinkan Anda menentukan format untuk menghasilkan penyematan di float, atau base64. Default adalah float.
  • dimensions memungkinkan Anda mengatur jumlah penyematan output. Parameter ini hanya didukung dengan model penyematan generasi ketiga baru: text-embedding-3-large, text-embedding-3-small. Biasanya penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Mampu menyesuaikan jumlah dimensi memungkinkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameter dimensions tidak didukung di semua versi pustaka OpenAI 1.x Python, untuk memanfaatkan parameter ini, sebaiknya tingkatkan ke versi terbaru: pip install openai --upgrade.

Jika saat ini Anda menggunakan versi API pratinjau untuk memanfaatkan fitur terbaru, sebaiknya konsultasikan dengan artikel siklus hidup versi API untuk melacak berapa lama versi API Anda saat ini akan didukung.

Memperbarui ke paket peningkatan Pratinjau GPT-4-1106

Peningkatan penyebaran gpt-4 Pratinjau 1106 ke gpt-4 Pratinjau 0125 yang dijadwalkan pada 8 Maret 2024 tidak lagi berlangsung. Penyebaran gpt-4 versi 1106-Preview dan 0125-Preview diatur ke "Pembaruan otomatis ke default" dan "Tingkatkan ketika kedaluwarsa" akan mulai ditingkatkan setelah versi stabil model dirilis.

Untuk informasi selengkapnya tentang proses peningkatan, lihat halaman model.

Februari 2024

Model GPT-3.5-turbo-0125 tersedia

Model ini memiliki berbagai peningkatan, termasuk akurasi yang lebih tinggi dalam merespons dalam format yang diminta dan perbaikan untuk bug yang menyebabkan masalah pengodean teks untuk panggilan fungsi bahasa non-bahasa Inggris.

Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.

Model penyematan generasi ketiga tersedia

  • text-embedding-3-large
  • text-embedding-3-small

Dalam pengujian, OpenAI melaporkan model penyematan generasi ketiga besar dan kecil menawarkan performa pengambilan multibahasa rata-rata yang lebih baik dengan tolok ukur MIRACL sambil tetap mempertahankan performa yang lebih baik untuk tugas bahasa Inggris dengan tolok ukur MTEB daripada model text-embedding-ada-002 generasi kedua.

Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.

Konsolidasi kuota GPT-3.5 Turbo

Untuk menyederhanakan migrasi antara versi model GPT-3.5-Turbo yang berbeda (termasuk 16k), kami akan mengonsolidasikan semua kuota GPT-3.5-Turbo ke dalam satu nilai kuota.

  • Setiap pelanggan yang telah meningkatkan kuota yang disetujui akan memiliki total kuota gabungan yang mencerminkan peningkatan sebelumnya.

  • Setiap pelanggan yang total penggunaannya saat ini di seluruh versi model kurang dari default akan mendapatkan total kuota gabungan baru secara default.

Model pratinjau GPT-4-0125 tersedia

Versi gpt-4 0125-preview model sekarang tersedia di Azure OpenAI Service di wilayah US Timur, US Tengah Utara, dan US Tengah Selatan. Pelanggan dengan penyebaran gpt-4 versi 1106-preview akan secara otomatis ditingkatkan ke 0125-preview dalam beberapa minggu mendatang.

Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.

Pratinjau publik ASSISTANTS API

Azure OpenAI sekarang mendukung API yang mendukung GPM OpenAI. Asisten Azure OpenAI (Pratinjau) memungkinkan Anda membuat asisten AI yang disesuaikan dengan kebutuhan Anda melalui instruksi kustom dan alat tingkat lanjut seperti penerjemah kode, dan fungsi kustom. Untuk mempelajari selengkapnya, lihat:

Pratinjau publik teks openAI ke suara ucapan

Azure OpenAI Service sekarang mendukung API teks ke ucapan dengan suara OpenAI. Dapatkan ucapan yang dihasilkan AI dari teks yang Anda berikan. Untuk mempelajari selengkapnya, lihat panduan gambaran umum dan coba mulai cepat.

Catatan

Azure AI Speech juga mendukung teks OpenAI ke suara ucapan. Untuk mempelajari selengkapnya, lihat Teks OpenAI ke suara ucapan melalui Azure OpenAI Service atau melalui panduan Azure AI Speech .

Kemampuan penyempurnaan dan dukungan model baru

Dukungan regional baru untuk Azure OpenAI On Your Data

Sekarang Anda dapat menggunakan Azure OpenAI On Your Data di wilayah Azure berikut:

  • Afrika Selatan Utara

Ketersediaan umum Azure OpenAI On Your Data

Desember 2023

Azure OpenAI Pada data Anda

  • Dukungan VPN lengkap dan titik akhir privat untuk Azure OpenAI On Your Data, termasuk dukungan keamanan untuk: akun penyimpanan, sumber daya Azure OpenAI, dan sumber daya Azure AI layanan Pencarian.
  • Artikel baru untuk menggunakan Azure OpenAI On Your Data dengan aman dengan melindungi data dengan jaringan virtual dan titik akhir privat.

GPT-4 Turbo dengan Visi sekarang tersedia

GPT-4 Turbo dengan Visi di layanan Azure OpenAI sekarang dalam pratinjau publik. GPT-4 Turbo with Vision adalah model multimodal besar (LMM) yang dikembangkan oleh OpenAI yang dapat menganalisis gambar dan memberikan respons tekstual terhadap pertanyaan tentang mereka. Ini menggabungkan pemrosesan bahasa alami dan pemahaman visual. Dengan mode yang disempurnakan , Anda dapat menggunakan fitur Azure AI Vision untuk menghasilkan wawasan tambahan dari gambar.

  • Jelajahi kemampuan GPT-4 Turbo dengan Vision dalam pengalaman tanpa kode menggunakan Azure OpenAI Playground. Pelajari selengkapnya di panduan Mulai Cepat.
  • Peningkatan visi menggunakan GPT-4 Turbo dengan Visi sekarang tersedia di Azure OpenAI Playground dan mencakup dukungan untuk Pengenalan Karakter Optik, landasan objek, dukungan gambar untuk "tambahkan data Anda," dan dukungan untuk permintaan video.
  • Lakukan panggilan ke API obrolan secara langsung menggunakan REST API.
  • Ketersediaan wilayah saat ini terbatas pada SwitzerlandNorth, SwedenCentral, WestUS, dan AustraliaEast
  • Pelajari lebih lanjut tentang batasan GPT-4 Turbo yang diketahui dengan Visi dan pertanyaan umum lainnya.

November 2023

Dukungan sumber data baru di Azure OpenAI On Your Data

  • Anda sekarang dapat menggunakan Azure Cosmos DB untuk MongoDB vCore serta URL/alamat web sebagai sumber data untuk menyerap data Anda dan mengobrol dengan model Azure OpenAI yang didukung.

Pratinjau GPT-4 Turbo & GPT-3.5-Turbo-1106 dirilis

Kedua model adalah rilis terbaru dari OpenAI dengan instruksi yang ditingkatkan berikut, mode JSON, output yang dapat direproduksi, dan panggilan fungsi paralel.

  • Pratinjau Turbo GPT-4 memiliki jendela konteks maksimum 128.000 token dan dapat menghasilkan 4.096 token output. Ini memiliki data pelatihan terbaru dengan pengetahuan hingga April 2023. Model ini dalam pratinjau dan tidak disarankan untuk penggunaan produksi. Semua penyebaran model pratinjau ini akan diperbarui secara otomatis setelah rilis stabil tersedia.

  • GPT-3.5-Turbo-1106 memiliki jendela konteks maksimum 16.385 token dan dapat menghasilkan 4.096 token output.

Untuk informasi tentang ketersediaan regional model, lihat halaman model.

Model memiliki alokasi kuota unik per wilayahnya sendiri.

Pratinjau publik DALL-E 3

DALL-E 3 adalah model pembuatan gambar terbaru dari OpenAI. Ini fitur kualitas gambar yang ditingkatkan, adegan yang lebih kompleks, dan peningkatan performa saat merender teks dalam gambar. Ini juga dilengkapi dengan lebih banyak opsi rasio aspek. DALL-E 3 tersedia melalui OpenAI Studio dan melalui REST API. Sumber daya OpenAI Anda harus berada di SwedenCentral wilayah Azure.

DALL-E 3 mencakup penulisan ulang permintaan bawaan untuk meningkatkan gambar, mengurangi bias, dan meningkatkan variasi alami.

Cobalah DALL-E 3 dengan mengikuti mulai cepat.

AI yang Bertanggung Jawab

  • Konfigurasi pelanggan yang diperluas: Semua pelanggan Azure OpenAI sekarang dapat mengonfigurasi semua tingkat keparahan (rendah, sedang, tinggi) untuk kategori kebencian, kekerasan, seksual dan bahaya diri, termasuk hanya memfilter konten dengan tingkat keparahan tinggi. Mengonfigurasi filter konten

  • Kredensial Konten di semua model DALL-E: Gambar yang dihasilkan AI dari semua model DALL-E sekarang menyertakan kredensial digital yang mengungkapkan konten sebagai yang dihasilkan AI. Aplikasi yang menampilkan aset gambar dapat memanfaatkan SDK Inisiatif Keaslian Konten sumber terbuka untuk menampilkan kredensial dalam gambar yang dihasilkan AI mereka. Kredensial Konten di Azure OpenAI

  • Model RAI baru

    • Deteksi risiko Jailbreak: Serangan Jailbreak adalah permintaan pengguna yang dirancang untuk memprovokasi model AI Generatif agar menunjukkan perilaku yang dilatih untuk menghindari atau melanggar aturan yang ditetapkan dalam Pesan Sistem. Model deteksi risiko jailbreak bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada permintaan pengguna.
    • Teks materi yang dilindungi: Teks materi yang dilindungi menjelaskan konten teks yang diketahui (misalnya, lirik lagu, artikel, resep, dan konten web yang dipilih) yang dapat dihasilkan oleh model bahasa besar. Model teks material yang dilindungi bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada penyelesaian LLM.
    • Kode material yang dilindungi: Kode material yang dilindungi menjelaskan kode sumber yang cocok dengan sekumpulan kode sumber dari repositori publik, yang dapat dihasilkan oleh model bahasa besar tanpa kutipan repositori sumber yang tepat. Model kode material yang dilindungi bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada penyelesaian LLM.

    Mengonfigurasi filter konten

  • Daftar blokir: Pelanggan sekarang dapat dengan cepat menyesuaikan perilaku filter konten untuk permintaan dan penyelesaian lebih lanjut dengan membuat daftar blokir kustom di filter mereka. Daftar blokir kustom memungkinkan filter untuk mengambil tindakan pada daftar pola yang disesuaikan, seperti istilah tertentu atau pola regex. Selain daftar blokir kustom, kami menyediakan daftar blokir kata-kata kokoh Microsoft (Bahasa Inggris). Menggunakan daftar blokir

Oktober 2023

Model penyempurnaan baru (pratinjau)

Azure OpenAI Pada data Anda

  • Parameter kustom baru untuk menentukan jumlah dokumen dan ketegasan yang diambil.
    • Pengaturan ketat mengatur ambang batas untuk mengategorikan dokumen yang relevan dengan kueri Anda.
    • Pengaturan dokumen yang diambil menentukan jumlah dokumen dengan skor teratas dari indeks data Anda yang digunakan untuk menghasilkan respons.
  • Anda dapat melihat status penyerapan/pengunggahan data di Azure OpenAI Studio.
  • Dukungan untuk titik akhir privat & VPN untuk kontainer blob.

September 2023

GPT-4

GPT-4 dan GPT-4-32k sekarang tersedia untuk semua pelanggan Azure OpenAI Service. Pelanggan tidak perlu lagi mengajukan daftar tunggu untuk menggunakan GPT-4 dan GPT-4-32k (persyaratan pendaftaran Akses Terbatas terus berlaku untuk semua model Azure OpenAI). Ketersediaan mungkin bervariasi menurut wilayah. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

GPT-3.5 Instruksi Turbo

Azure OpenAI Service sekarang mendukung model GPT-3.5 Turbo Instruct. Model ini memiliki performa yang sebanding text-davinci-003 dengan dan tersedia untuk digunakan dengan API Penyelesaian. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

Pratinjau publik bisikan

Azure OpenAI Service sekarang mendukung API ucapan ke teks yang didukung oleh model Whisper OpenAI. Dapatkan teks yang dihasilkan AI berdasarkan audio ucapan yang Anda berikan. Untuk mempelajari lebih lanjut , lihat mulai cepat.

Catatan

Azure AI Speech juga mendukung model Whisper OpenAI melalui API transkripsi batch. Untuk mempelajari lebih lanjut , lihat panduan Membuat transkripsi batch. Lihat Apa model Whisper? untuk mempelajari selengkapnya tentang kapan menggunakan Azure AI Speech vs. Azure OpenAI Service.

Wilayah Baru

  • Azure OpenAI sekarang juga tersedia di wilayah Swedia Tengah, dan Swiss Utara. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

Batas kuota regional meningkat

  • Meningkatkan ke batas kuota default maksimum untuk model dan wilayah tertentu. Memigrasikan beban kerja ke model dan wilayah ini akan memungkinkan Anda memanfaatkan Token per menit (TPM) yang lebih tinggi.

Agustus 2023

Azure OpenAI pada pembaruan data Anda sendiri (pratinjau)

Juli 2023

Dukungan untuk panggilan fungsi

Menyematkan peningkatan array input

Wilayah Baru

  • Azure OpenAI sekarang juga tersedia di wilayah Kanada Timur, US Timur 2, Jepang Timur, dan US Tengah Utara. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

Juni 2023

Menggunakan Azure OpenAI pada data Anda sendiri (pratinjau)

  • Azure OpenAI On Your Data sekarang tersedia dalam pratinjau, memungkinkan Anda untuk mengobrol dengan model OpenAI seperti GPT-35-Turbo dan GPT-4 dan menerima respons berdasarkan data Anda.

Versi baru model gpt-35-turbo dan gpt-4

  • gpt-35-turbo (versi 0613)
  • gpt-35-turbo-16k (versi 0613)
  • gpt-4 (versi 0613)
  • gpt-4-32k (versi 0613)

UK Selatan

  • Azure OpenAI sekarang tersedia di wilayah Inggris Selatan. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

Pemfilteran konten & anotasi (Pratinjau)

  • Cara mengonfigurasi filter konten dengan Azure OpenAI Service.
  • Aktifkan anotasi untuk melihat kategori pemfilteran konten dan informasi tingkat keparahan sebagai bagian dari panggilan Penyelesaian dan Penyelesaian Obrolan berbasis GPT Anda.

Kuota

Mei 2023

Dukungan Java & JavaScript SDK

  • SDK pratinjau Azure OpenAI BARU menawarkan dukungan untuk JavaScript dan Java.

Ketersediaan Umum Penyelesaian Obrolan Azure OpenAI (GA)

  • Dukungan ketersediaan umum untuk:
    • Versi API 2023-05-15Penyelesaian Obrolan .
    • Model GPT-35-Turbo.
    • Seri model GPT-4.

Jika saat ini Anda menggunakan 2023-03-15-preview API, sebaiknya migrasikan ke GA 2023-05-15 API. Jika saat ini Anda menggunakan api versi 2022-12-01 API, API ini tetap GA, tetapi tidak menyertakan kemampuan Penyelesaian Obrolan terbaru.

Penting

Menggunakan versi model GPT-35-Turbo saat ini dengan titik akhir penyelesaian tetap dalam pratinjau.

Prancis Tengah

  • Azure OpenAI sekarang tersedia di wilayah Prancis Tengah. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

April 2023

  • Pratinjau publik DALL-E 2. Azure OpenAI Service sekarang mendukung API pembuatan gambar yang didukung oleh model DALL-E 2 OpenAI. Dapatkan gambar yang dihasilkan AI berdasarkan teks deskriptif yang Anda berikan. Untuk mempelajari lebih lanjut , lihat mulai cepat. Untuk meminta akses, pelanggan Azure OpenAI yang ada dapat mendaftar dengan mengisi formulir ini.

  • Penyebaran model yang disesuaikan yang tidak aktif sekarang akan dihapus setelah 15 hari; model akan tetap tersedia untuk penyebaran ulang. Jika model yang disesuaikan (disempurnakan) disebarkan selama lebih dari lima belas (15) hari di mana tidak ada penyelesaian atau panggilan penyelesaian obrolan yang dilakukan padanya, penyebaran akan secara otomatis dihapus (dan tidak ada biaya hosting lebih lanjut yang akan dikeluarkan untuk penyebaran tersebut). Model yang disesuaikan yang mendasar akan tetap tersedia dan dapat disebarkan ulang kapan saja. Untuk mempelajari selengkapnya, lihat artikel cara penggunaan.

Maret 2023

  • Model seri GPT-4 sekarang tersedia dalam pratinjau di Azure OpenAI. Untuk meminta akses, pelanggan Azure OpenAI yang ada dapat mendaftar dengan mengisi formulir ini. Model-model ini saat ini tersedia di wilayah US Timur dan US Tengah Selatan.

  • API Penyelesaian Obrolan Baru untuk model GPT-35-Turbo dan GPT-4 dirilis dalam pratinjau pada 3/21. Untuk mempelajari selengkapnya, lihat artikel mulai cepat dan panduan yang diperbarui.

  • Pratinjau GPT-35-Turbo. Untuk mempelajari selengkapnya, lihat artikel cara penggunaan.

  • Peningkatan batas pelatihan untuk penyempurnaan: Ukuran pekerjaan pelatihan maks (token dalam file pelatihan) x (# dari epoch) adalah 2 Miliar token untuk semua model. Kami juga telah meningkatkan pekerjaan pelatihan maks dari 120 menjadi 720 jam.

  • Menambahkan kasus penggunaan tambahan ke akses Anda yang sudah ada.  Sebelumnya, proses untuk menambahkan kasus penggunaan baru mengharuskan pelanggan untuk menerapkan kembali ke layanan. Sekarang, kami merilis proses baru yang memungkinkan Anda menambahkan kasus penggunaan baru dengan cepat ke penggunaan layanan. Proses ini mengikuti proses Akses Terbatas yang ditetapkan dalam layanan Azure AI. Pelanggan yang ada dapat membuktikan setiap dan semua kasus penggunaan baru di sini. Harap dicatat bahwa ini diperlukan kapan saja Anda ingin menggunakan layanan untuk kasus penggunaan baru yang awalnya tidak Anda ajukan.

Februari 2023

Fitur baru

Pembaruan

  • Pemfilteran konten aktif secara default.

Artikel baru tentang:

Kursus pelatihan baru:

January 2023

Fitur baru

  • Layanan GA. Layanan Azure OpenAI sekarang tersedia secara umum.

  • Model baru: Penambahan model teks terbaru, text-davinci-003 (US Timur, Eropa Barat), text-ada-embeddings-002 (US Timur, US Tengah Selatan, Eropa Barat)

Desember 2022

Fitur baru

  • Model terbaru dari OpenAI. Azure OpenAI menyediakan akses ke semua model terbaru termasuk seri GPT-3.5.

  • Versi API baru (2022-12-01). Pembaruan ini mencakup beberapa penyempurnaan yang diminta termasuk informasi penggunaan token dalam respons API, pesan kesalahan yang ditingkatkan untuk file, penyelarasan dengan OpenAI pada struktur data pembuatan penyempurnaan, dan dukungan untuk parameter akhiran untuk memungkinkan penamaan kustom pekerjaan yang disempurnakan. ​

  • Batas permintaan per detik yang lebih tinggi. 50 untuk model non-Davinci. 20 untuk model Davinci.

  • Penyebaran penyempurnaan yang lebih cepat. Sebarkan model Ada dan Curie yang disempurnakan dalam waktu kurang dari 10 menit.

  • Batas pelatihan yang lebih tinggi: Token pelatihan 40M untuk Ada, Babbage, dan Curie. 10M untuk Davinci.

  • Proses untuk meminta modifikasi pada penyalahgunaan & pengelogan data yang tidak digunakan & tinjauan manusia. Saat ini, layanan mencatat data permintaan/respons untuk tujuan penyalahgunaan dan penyalahgunaan deteksi untuk memastikan bahwa model yang kuat ini tidak disalahgunakan. Namun, banyak pelanggan memiliki persyaratan privasi dan keamanan data yang ketat yang memerlukan kontrol yang lebih besar atas data mereka. Untuk mendukung kasus penggunaan ini, kami merilis proses baru bagi pelanggan untuk mengubah kebijakan pemfilteran konten atau menonaktifkan pengelogan penyalahgunaan untuk kasus penggunaan berisiko rendah. Proses ini mengikuti proses Akses Terbatas yang ditetapkan dalam layanan Azure AI dan pelanggan OpenAI yang ada dapat diterapkan di sini.

  • Enkripsi kunci yang dikelola pelanggan (CMK). CMK memberi pelanggan kontrol yang lebih besar atas pengelolaan data mereka di Azure OpenAI dengan menyediakan kunci enkripsi mereka sendiri yang digunakan untuk menyimpan data pelatihan dan model yang disesuaikan. Kunci yang dikelola pelanggan (CMK),juga dikenal sebagai Bring Your Own Key (BYOK), menawarkan fleksibilitas yang lebih luas untuk membuat, memutar, menonaktifkan, dan mencabut kontrol akses. Anda juga dapat mengaudit kunci enkripsi yang digunakan untuk melindungi data Anda. Pelajari lebih lanjut dari dokumentasi enkripsi saat tidak aktif.

  • Dukungan lockbox

  • Kepatuhan SOC-2

  • Pengelogan dan diagnostik melalui Pengaturan Azure Resource Health, Analisis Biaya, dan Metrik & Diagnostik.

  • Penyempurnaan studio. Banyak peningkatan kegunaan pada alur kerja Studio termasuk dukungan peran Azure ACTIVE Directory untuk mengontrol siapa di tim yang memiliki akses untuk membuat model dan penyebaran yang disempurnakan.

Perubahan (melanggar)

Permintaan API pembuatan penyempurnaan telah diperbarui agar sesuai dengan skema OpenAI.

Pratinjau versi API:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API versi 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

Pemfilteran konten untuk sementara nonaktif secara default. Azure con mode tenda ration bekerja secara berbeda dari Azure OpenAI. Azure OpenAI menjalankan filter konten selama panggilan pembuatan untuk mendeteksi konten berbahaya atau kasar dan memfilternya dari respons. Pelajari lebih lanjut

Model-model ini akan diaktifkan kembali pada Q1 2023 dan aktif secara default. ​

Tindakan pelanggan

Langkah berikutnya

Pelajari selengkapnya tentang model yang mendasari yang mendukung Azure OpenAI.