Episode

Menyebarkan Layanan OpenAI dalam Skala Besar Menggunakan Unit Throughput Provisi

dengan Thomas Maurer, David Huntley

Dalam episode Azure Essentials Show ini, Thomas dan David membahas bagaimana bisnis dapat menerapkan dan menskalakan AI generatif menggunakan Azure OpenAI Service. Mereka mengeksplorasi berbagai opsi penyebaran, berfokus pada penyebaran standar dan yang disediakan, dan menyediakan demo tentang mengoptimalkan penyebaran ini dengan praktik terbaik Azure. David menjelaskan konsep Provisioned Throughput Units (PTUs) dan menawarkan tips praktis untuk memperkirakan kebutuhan PTU, memeriksa kuota, dan membeli reservasi untuk memastikan performa yang andal dan efisiensi biaya.

Bab

  • 00.00- Pengantar
  • 01:10 - Bayar sesuai penggunaan
  • 01:25 - Penyebaran yang disediakan
  • 01:45 - PTUs dijelaskan
  • 02:19 - Demo: kalkulator kapasitas
  • 03:35 - Demo: Memeriksa kuota
  • 04:21 - Demo: Membuat penyebaran provisi
  • 05:47 - Per jam vs. reservasi
  • 06:30 - Kapasitas tidak dijamin
  • 07:17 - Demo: Pembelian reservasi
  • 09:55 - Memantau penggunaan
  • 10:27 - Tips: Membuat penyebaran lalu reservasi
  • 10:59 - Sumber Daya

Sambungkan

Azure
Azure OpenAI Service