Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Önemli
Bu özellik önizleme aşamasındadır.
Microsoft Fabric güvenli, ölçeklenebilir ve kullanımı kolay çevrimiçi uç noktalarla ML modellerinden gerçek zamanlı tahminler sunmanızı sağlar. Bu uç noktalar çoğu Doku modelinde yerleşik özellikler olarak kullanılabilir ve tam olarak yönetilen gerçek zamanlı dağıtımları başlatmak için kurulum gerektirmez.
Genel kullanıma yönelik REST API ile model uç noktalarını etkinleştirebilir, yapılandırabilir ve sorgulayabilirsiniz. Model uç noktalarını etkinleştirmek ve tahminleri anında önizlemek için düşük kodlu bir deneyim kullanarak doğrudan Doku arabiriminden de çalışmaya başlayabilirsiniz.
Önkoşullar
- Gerçek zamanlı tahminler sunabilmek için yöneticinizin Fabric yönetim portalında ML modeli uç noktaları için kiracı anahtarı özelliğini etkinleştirmesi gerekir.
Sınırlamalar
- Uç noktalar şu anda Keras, LightGBM, Sklearn ve XGBoost gibi sınırlı sayıda ML modeli için kullanılabilir.
- Uç noktalar şu anda tensor tabanlı şemaları olan veya şeması olmayan modeller için kullanılamamaktadır.
Model uç noktalarını kullanmaya başlama
Fabric'teki ML modelleri, gerçek zamanlı tahminler sunmak için kullanılabilecek çevrimiçi uç noktalarla önceden oluşturulmuş olarak gelir. Her kayıtlı model sürümü, Doku arabirimindeki "Uç nokta ayrıntıları" başlığı altında bulunabilen ayrılmış bir uç nokta URL'sine sahiptir. Bu URL, belirli bir sürümü (örneğin, /versions/1/score) belirten bir alt yol ile sona erer.
Model uç noktaları aşağıdaki özelliklere sahiptir:
| Emlak | Açıklama | Varsayılan |
|---|---|---|
| Varsayılan sürüm | Bu özellik (Yes veya No) sürümün gerçek tahminleri sunma için modelin varsayılan değeri olarak ayarlanıp ayarlanmadığını gösterir.
Varsayılan sürümü modelin ayarlarından özelleştirebilirsiniz. |
No |
| Statü | Bu özellik, uç noktanın tahminleri sunmak için hazır olup olmadığını gösterir. Durum Inactive, Activating, Active, Deactivating veya Failed olabilir. Yalnızca etkin uç noktalar tahminlere hizmet edebilir. |
Inactive |
| Otomatik uyku | Bu özellik (On veya Off) etkin olduğunda uç noktanın trafik olmadığında kapasite kullanımını sıfıra düşürmesi gerekip gerekmediğini belirtir. Otomatik uyku açıksa, uç nokta gelen istekler olmadan beş dakika sonra boşta durumuna girer. Boşta olan uç noktayı uyandırmak için ilk çağrı kısa bir gecikme gerektirir. |
On |
Model uç noktalarını etkinleştirme
Model uç noktalarını doğrudan Doku arabiriminden etkinleştirebilirsiniz. Gerçek zamanlı tahminler sunmak istediğiniz sürüme gidin ve şeritten "Sürüm uç noktasını etkinleştir" seçeneğini belirleyin.
Bir bildirim iletisi, Doku'nun uç noktanızı tahminlere hizmet etmeye hazır hale getirdiğini ve uç noktanın durumunun "Etkinleştiriliyor" olarak değiştiğini gösterir. Arka planda Doku, modelinizi barındırmak için temel kapsayıcı altyapısını oluşturur. Birkaç dakika içinde uç noktanız tahminlere hizmet etmeye hazır olur.
Her uç noktanın gerçek zamanlı tahminlere hazır olup olmadığını belirten bir durumu vardır:
| Statü | Açıklama |
|---|---|
Inactive |
Uç nokta, gerçek zamanlı tahminler sunmak için etkinleştirilmemiştir ve Doku kapasitesini kullanmamaktadır. |
Activating |
Uç nokta gerçek zamanlı tahminlere hizmet etmek için yapılandırılıyor. Arka planda Fabric, modeli barındırmak için temel kapsayıcı altyapısını ayarlar. Birkaç dakika içinde uç nokta etkin olur. |
Active |
Uç nokta gerçek zamanlı tahminlere hizmet etmeye hazırdır. Arka planda Fabric, temel alınan altyapıyı yönetir ve gelen trafiğe göre kaynak kullanımını ölçeklendirir. Daha yüksek trafik, doku kapasitesinin daha yüksek kullanımına neden olur. |
Deactivating |
Uç birim devre dışı bırakılıyor, böylece artık gerçek zamanlı tahminlere hizmet etmez ve Fabric kapasitesini tüketmez. Arka planda Fabric, temel kapsayıcı altyapıyı söker. |
Uyarı
ML modelleri aynı anda beş sürüme kadar etkin uç noktaları destekleyebilir. Altıncı sürümden gelen tahminleri sunmak için önce etkin uç noktayı devre dışı bırakmanız gerekir.
Model uç noktalarını yönetme
Modelinizin etkin uç noktalarına genel bir bakış için arabirimdeki şeritten "Uç noktaları yönet"i seçin. Her model, seçtiğiniz bir sürümden tahminler sunan özelleştirilebilir bir varsayılan uç noktaya sahiptir. Ayarlar bölmesindeki açılan seçiciyi kullanarak varsayılan sürümü güncelleştirebilirsiniz.
Önemli
Kullanmayı planlıyorsanız varsayılan özelliği etkin bir sürüme ayarladığınızdan emin olun. Varsayılan özellik ayarlanmadıysa veya etkin olmayan bir sürüme ayarlandıysa, varsayılan uç noktaya yapılan çağrılar başarısız olur.
Etkin uç noktaları olan tüm sürümler modelin uç nokta ayarları altında listelenir. Değiştiriciyi "Açık" veya "Kapalı" olarak ayarlayarak her uç noktanın otomatik uyku özelliğini değiştirebilirsiniz.
Tavsiye
Otomatik uyku açık olan aktif uç noktalar, trafik olmadan beş dakika sonra boşta moduna geçer ve onları uyandırmak için yapılan ilk çağrıda kısa bir gecikme yaşanır. Üretimdeki uç noktalar için bu özelliği kapatmak isteyebilirsiniz.
Gerçek zamanlı tahminler için model uç noktalarını sorgulama
Model uç noktaları, Fabric'de düşük kod deneyimiyle anında test edilebilir. Etkin uç nokta içeren bir sürüme gidin ve arabirimdeki şeritten "Önizleme tahminleri"ni seçin. Modelin giriş imzası ile eşleşen form alanlarını kullanarak uç noktaya örnek istekler gönderebilir ve gerçek zamanlı olarak örnek tahminler alabilirsiniz.
Form alanlarını rastgele örnek değerlerle doldurmak için "Otomatik Doldur" seçeneğini belirleyin. Uç noktayı birden çok girişle test etmek için daha fazla form değeri kümesi ekleyebilirsiniz. Uç noktaya örnek isteğinizi göndermek için "Tahminleri al" seçeneğini belirleyin.
Örnek istekleri JSON yükleri olarak biçimlendirmeyi tercih ediyorsanız, görünümü değiştirmek için açılan seçiciyi kullanın.
Model uç noktalarını devre dışı bırakma
Model uç noktalarını doğrudan Doku arabiriminden devre dışı bırakabilirsiniz. Artık gerçek zamanlı tahminlerde bulunmanız gerekmeyen bir sürüme gidin ve arabirimdeki şeritten "Sürüm uç noktasını devre dışı bırak" seçeneğini belirleyin.
Bir ekran mesajı, Doku'nun etkin dağıtımınızı bozduğunu ve uç noktanın durumunun "Devre dışı bırakılıyor" olarak değiştiğini gösterir. Uç nokta, yeniden etkinleştirmediğiniz sürece artık gerçek zamanlı tahminler sunamaz.
Modelin ayarlar bölmesinden birden çok sürüm için uç noktaları aynı anda devre dışı bırakabilirsiniz. Arabirimdeki şeritten "Uç noktaları yönet" seçeneğini belirleyin ve devre dışı bırakmak için bir veya daha fazla etkin uç nokta seçin.
Tüketim oranı
Etkin model uç noktalarını barındırmak, Doku Kapasite Birimlerini (CU) kullanır. Uç noktalar işlem düğümlerinde çalışır ve gelen trafiğe göre otomatik olarak üç düğüme kadar ölçeklendirilebilir. Bir uç nokta etkinken faturalama düğüm başına hesaplanır. Aşağıdaki tabloda etkin bir Machine Learning modeli uç noktası için CU tüketimi gösterilmektedir.
| İşlem | İşlem Ölçü Birimi | Tüketim oranı |
|---|---|---|
| model uç noktası | Düğüm başına saniyede 1 model uç noktası (versiyon) | 5 CU saniye |
Aşağıdaki tabloda örnek senaryolar ve buna karşılık gelen tüketim oranları ve saatlik maliyetler gösterilmektedir.
| Senaryo | Açıklama | Tüketim oranı | Saatlik Maliyet |
|---|---|---|---|
| Etkin Olmayan Uç Noktaları Olan Modeller | Bu modellerin etkin sürüm uç noktaları ve ilişkili kaynak kullanımı yoktur. Ek ücret uygulanmaz. | 0 CU saniye | 0 CU Saat |
| Etkin ancak Boşta Uç Noktaları olan modeller | Bu modellerin bir veya daha fazla etkin sürüm uç noktası vardır, ancak normal trafik olmadan bunların tümü sıfıra ölçeklendirilerek maliyetleri otomatik olarak azaltır. | 5 CU saniye | 0,42 CU Saat |
| 1 Etkin Uç Nokta ve Sabit Düşük Trafikli Modeller | Bu modellerin tahminleri sunan yalnızca bir etkin sürüm uç noktasına sahiptir, ancak tam bir ölçek genişlemesini tetiklemek için yeterli trafik yoktur. Bir düğüm tüm trafiğe hizmet verebilir. Diğer sürüm uç noktaları etkin olmayabilir veya boşta olabilir. | 5 CU saniye | 5 CU Saati |
| 1 Etkin Uç Nokta ve Sabit Yüksek Trafikli Modeller | Bu modellerde tahmin sunan yalnızca 1 aktif sürüm uç noktası vardır ve tam ölçek genişletmesini tetiklemek için yeterli trafik bulunmaktadır. Diğer sürüm uç noktaları etkin olmayabilir veya boşta bekliyor olabilir. | 15 CU saniye | 15 CU Saati |
| 5 Etkin Uç Nokta ve Sabit Yüksek Trafikli Modeller | Bu modellerin tahminleri sunan 5 aktif sürüm uç noktası (geçerli sınır) vardır ve her birinin tam ölçek genişletmeyi tetiklemek için yeterli trafik vardır. | 75 CU saniye | 75 CU Saati |
Doku Kapasitesi Ölçümleri uygulaması , model uç noktası işlemleri için toplam kapasite kullanımını "Model Uç Noktası" adı altında görüntüler. Buna ek olarak, kullanıcılar "ML Model Uç Noktası Kapasitesi Kullanımı CU" faturalama öğesi altında Model Uç Noktası kullanımı için faturalama ücretlerinin özetini görüntüleyebilir.
Model uç noktası işlemi arka plan işlemleri olarak sınıflandırılır.
Tüketim oranları herhangi bir zamanda değişebilir. Microsoft, e-posta veya ürün içi bildirim yoluyla bildirim sağlamak için makul çabayı gösterir. Değişiklikler, Microsoft Sürüm Notları'nda veya Microsoft Fabric Blogunda belirtilen tarihte geçerli olacaktır. Doku Tüketim Oranı'nda model uç noktasında yapılan herhangi bir değişiklik, kullanmak için gereken Kapasite Birimlerini (CU) önemli ölçüde artırırsa, müşteriler seçilen ödeme yöntemi için kullanılabilir iptal seçeneklerini kullanabilir.
İlgili içerik
- ML modeli uç noktası REST API'siyle program aracılığıyla uç noktaları yönetin ve sorgular.
- Fabric defterlerindeki
PREDICTişleviyle toplu tahminler oluşturun. - Fabric'de model eğitimi ve deneyleri hakkında daha fazla bilgi edinin.
- İhtiyacınız olan bir özelliği kaçırdık mı? Fabric Fikirleri forumu'nda önerin.