Bölüm
Buluttan İstemciye ONNX Çalışma Zamanı ile Daha Hızlı ve Daha Hafif Model Çıkarımı
ONNX Runtime , makine öğrenmesi modelleri için yüksek performanslı bir çıkarım ve eğitim altyapısıdır. Bu gösteri, model çıkarımı için ONNX Çalışma Zamanına odaklanır. ONNX Runtime, Bing, Office 365 ve Azure Bilişsel Hizmetler gibi çeşitli Microsoft ürünleri tarafından yaygın olarak benimsenmiştir ve ortalama 2,9 kat çıkarım hızı elde edilmiştir. Şimdi daha da küçük model boyutu ve çalışma zamanı boyutuyla model çıkarımının daha da hızlandırılması için ONNX Çalışma Zamanı niceleme ve ONNX Runtime mobil'i kullanıma sunmaktan mutluluk duyarız. ONNX Çalışma Zamanı yalnızca bulut tabanlı çıkarım için değil, aynı zamanda cihaz içi çıkarım için de gelişmeye devam ediyor.
Şuraya Atla:
- [01:02] ONNX ve ONNX Runtime'a genel bakış
- [02:26] ONNX Runtime ile model kullanıma hazır hale getirme
- [04:04] ONNX Çalışma Zamanı benimsemesi
- [05:07] Model boyutunu küçültme ve çıkarım hızlandırma için ONNX Runtime INT8 nicelemesi
- [09:46] ONNX Runtime INT8 niceleme tanıtımı
- [16:00] Çalışma zamanı boyutunu küçültmek için ONNX Runtime mobil
Daha fazla bilgi edinin:
- ONNX Çalışma Zamanı
- Yüz Tanıma ve ONNX Çalışma Zamanı ile daha hızlı ve daha küçük nicelenmiş NLP
- Mobil Platformlar için ONNX Çalışma Zamanı
- Azure Machine Learning'de ONNX Çalışma Zamanı Çıkarımı
- Ücretsiz hesap oluşturma (Azure)
- Derin Öğrenme ve Makine Öğrenmesi karşılaştırması
- Machine Learning'i Kullanmaya Başlama
Yeni bölümleri kaçırmayın,yapay zeka gösterisine abone olun
ONNX Runtime , makine öğrenmesi modelleri için yüksek performanslı bir çıkarım ve eğitim altyapısıdır. Bu gösteri, model çıkarımı için ONNX Çalışma Zamanına odaklanır. ONNX Runtime, Bing, Office 365 ve Azure Bilişsel Hizmetler gibi çeşitli Microsoft ürünleri tarafından yaygın olarak benimsenmiştir ve ortalama 2,9 kat çıkarım hızı elde edilmiştir. Şimdi daha da küçük model boyutu ve çalışma zamanı boyutuyla model çıkarımının daha da hızlandırılması için ONNX Çalışma Zamanı niceleme ve ONNX Runtime mobil'i kullanıma sunmaktan mutluluk duyarız. ONNX Çalışma Zamanı yalnızca bulut tabanlı çıkarım için değil, aynı zamanda cihaz içi çıkarım için de gelişmeye devam ediyor.
Şuraya Atla:
- [01:02] ONNX ve ONNX Runtime'a genel bakış
- [02:26] ONNX Runtime ile model kullanıma hazır hale getirme
- [04:04] ONNX Çalışma Zamanı benimsemesi
- [05:07] Model boyutunu küçültme ve çıkarım hızlandırma için ONNX Runtime INT8 nicelemesi
- [09:46] ONNX Runtime INT8 niceleme tanıtımı
- [16:00] Çalışma zamanı boyutunu küçültmek için ONNX Runtime mobil
Daha fazla bilgi edinin:
- ONNX Çalışma Zamanı
- Yüz Tanıma ve ONNX Çalışma Zamanı ile daha hızlı ve daha küçük nicelenmiş NLP
- Mobil Platformlar için ONNX Çalışma Zamanı
- Azure Machine Learning'de ONNX Çalışma Zamanı Çıkarımı
- Ücretsiz hesap oluşturma (Azure)
- Derin Öğrenme ve Makine Öğrenmesi karşılaştırması
- Machine Learning'i Kullanmaya Başlama
Yeni bölümleri kaçırmayın,yapay zeka gösterisine abone olun
Geri bildirimde bulunmak ister misiniz? Burada bir sorun gönderin.