Muistiinpano
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää kirjautua sisään tai vaihtaa hakemistoa.
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää vaihtaa hakemistoa.
Microsoft Fabricin avulla voit tarjota koneoppimismallien reaaliaikaisia ennusteita suojattujen, skaalattavien ja helppokäyttöisten online-päätepisteiden avulla. Nämä päätepisteet ovat saatavilla useimpien Fabric-mallien sisäänrakennettuina ominaisuutena, eikä niitä tarvitse määrittää täysin hallittujen reaaliaikaisten käyttöönottojen käynnistämiseksi.
Voit aktivoida, määrittää ja tehdä kyselyjä mallin päätepisteistä julkisella REST-ohjelmointirajapinnalla. Voit aloittaa myös suoraan Fabric-käyttöliittymästä ilman koodausta ja aktivoida mallin päätepisteet ja esikatsella ennusteita heti vähäisellä koodauksella.
Prerequisites
- Jos haluat antaa reaaliaikaisia ennusteita, järjestelmänvalvojasi on otettava käyttöön vuokraajavaihtaminen koneoppimisen mallipäätepisteisiin Fabric-hallintaportaalissa.
Limitations
- Päätepisteet ovat tällä hetkellä saatavilla rajoitetulle määrälle koneoppimismallin makuja, kuten Keras, LightGBM, Sklearn ja XGBoost.
- Päätepisteet eivät ole tällä hetkellä käytettävissä malleissa, joissa on tensoripohjaisia rakenteita tai ei rakenteita.
Aloita mallin päätepisteiden käyttäminen
Fabricin ml-mallit ovat valmiita verkkopäätepisteillä, joita voidaan käyttää reaaliaikaisten ennusteiden palvelemiseen. Jokaisella rekisteröidyllä malliversiolla on erillinen päätepisteen URL-osoite, joka löytyy Fabric-liittymän Päätepisteen tiedot -otsikon alareunasta. Tämän URL-osoitteen lopussa on alipolku, joka määrittää tietyn version (esimerkiksi /versions/1/score).
Mallin päätepisteillä on seuraavat ominaisuudet:
| Property | Description | Default |
|---|---|---|
| Oletusversio | Tämä ominaisuus (Yes tai No) ilmaisee, onko versio määritetty mallin oletukseksi reaaliennusteiden palvelemiselle. Voit mukauttaa oletusversiota mallin asetuksissa. |
No |
| Status | Tämä ominaisuus ilmaisee, onko päätepiste valmis tekemään ennusteita. Tila voi olla Inactive, , ActivatingActive, Deactivating, tai Failed. Vain aktiiviset päätepisteet voivat palvella ennusteita. |
Inactive |
| Automaattinen lepotila | Tämä ominaisuus (On tai Off) ilmaisee, tuleeko aktiivisena olevan päätepisteen skaalata kapasiteetin käyttö nollaan ilman liikennettä. Jos automaattinen uni on käytössä, päätepisteeseen tulee käyttämättömyystila viiden minuutin kuluttua ilman saapuvia pyyntöjä. Ensimmäinen kutsu, joka herättää tyhjän päätepisteen, sisältää lyhyen viiveen. |
On |
Aktivoi mallin päätepisteet
Voit aktivoida mallin päätepisteet suoraan Fabric-käyttöliittymästä. Siirry versioon, jonka haluat antaa reaaliaikaisilla ennusteilla, ja valitse valintanauhasta Aktivoi version päätepiste.
Paahtoleipäviesti kertoo, että Fabric on valmistelemassa päätepistettäsi ennakoimaan ennusteita, ja päätepisteen tilaksi muuttuu "Aktivointi". Fabric pyörittää taustalla pohjana olevaa säilöinfrastruktuuria mallisi isännöimiseksi. Päätepiste on valmis ennakoimaan ennusteita muutaman minuutin kuluessa.
Jokaisella päätepisteellä on tila, joka ilmaisee, onko se valmis suorittamaan reaaliaikaisia ennusteita:
| Status | Description |
|---|---|
Inactive |
Päätepistettä ei ole aktivoitu reaaliaikaisten ennusteiden palvelemiseksi, eikä se käytä Fabric-kapasiteettia. |
Activating |
Päätepistettä määritetään palvelemaan reaaliaikaisia ennusteita. Taustalla Fabric määrittää pohjana olevan säilöinfrastruktuurin mallin isännöimiseksi. Päätepiste on aktiivinen muutaman minuutin kuluessa. |
Active |
Päätepiste on valmis reaaliaikaisten ennusteiden palvelemiseen. Taustalla Fabric hallitsee pohjana olevaa infrastruktuuria ja skaalaa resurssien käyttöä saapuvan liikenteen perusteella. Kun liikenne on suurempi, Fabric-kapasiteetin käyttö on suurempaa. |
Deactivating |
Päätepistettä ollaan poistamasta käytöstä, jotta se ei enää käytä reaaliaikaisia ennusteita eikä käytä Fabric-kapasiteettia. Taustalla Fabric purkaa pohjana olevan säilöinfrastruktuurin. |
Note
Koneoppimismallit voivat tukea aktiivisia päätepisteitä enintään viidelle versiolle kerralla. Jotta voit antaa ennusteita kuudennesta versiosta, aktiivisen päätepisteen aktivointi on ensin poistettava.
Mallien päätepisteiden hallinta
Saat yleiskatsauksen mallisi aktiivisista päätepisteistä valitsemalla Päätepisteiden hallinta -vaihtoehdon käyttöliittymän valintanauhasta. Jokaisella mallilla on mukautettava oletuspäätepiste, joka lähettää ennusteita valitsemastasi versiosta. Voit päivittää oletusversion asetukset-ruudun avattavan valikon valitsimella.
Important
Muista määrittää oletusominaisuudeksi aktiivinen versio, jos aiot käyttää sitä. Jos oletusominaisuutta ei ole määritetty tai jos se on määritetty passiiviseksi versioksi, kutsut oletuspäätepisteeseen epäonnistuvat.
Kaikki aktiiviset päätepisteet sisältävät versiot luetellaan mallin päätepisteasetuksissa. Voit muokata kunkin päätepisteen automaattista lepotilaominaisuutta vaihtamalla valitsimen arvoksi "On" tai "Off".
Tip
Aktiiviset päätepisteet, joissa automaattinen lepotila on käytössä, muuttuvat käyttämättömyystilaksi viiden minuutin kuluttua ilman liikennettä, ja ensimmäinen kutsu, joka herättää ne, aiheuttaa lyhyen viiveen. Haluat ehkä poistaa tämän ominaisuuden käytöstä tuotannon päätepisteissä.
Kyselymallin päätepisteistä reaaliaikaisia ennusteita varten
Mallien päätepisteet ovat käytettävissä pikatestaukseen vähäisellä koodatulla Fabric-käyttökokemuksella. Siirry aktiivisen päätepisteen sisältävään versioon ja valitse käyttöliittymän valintanauhasta Esikatsele ennusteita. Voit lähettää mallipyyntöjä päätepisteeseen – ja saada malliennusteita reaaliaikaisesti – käyttämällä lomakekenttiä, jotka vastaavat mallin syöteallekirjoitusta.
Jos haluat täyttää lomakekentät satunnaisilla malliarvoilla, valitse "Automaattinen täyttö". Voit lisätä lomakearvojoukkoja testataksesi päätepistettä useilla syötteillä. Lähetä mallipyyntösi päätepiste valitsemalla Hae ennusteet.
Jos haluat muotoilla mallipyyntöjä JSON-hyötykuormiksi, vaihda näkymää avattavan valikon valitsimella.
Mallin päätepisteiden aktivoinnin poistaminen
Voit poistaa mallin päätepisteiden aktivoinnin suoraan Fabric-liittymästä. Siirry versioon, jonka reaaliaikaisia ennusteita ei enää tarvitse antaa, ja valitse käyttöliittymän valintanauhasta Poista version päätepiste käytöstä.
Sanomassa näytetään, että Fabric purkaa aktiivisen käyttöönoton ja päätepisteen tila muuttuu arvoksi "Deactivating". Päätepiste ei enää pysty palvelemaan reaaliaikaisia ennusteita, ellet aktivoi sitä uudelleen.
Voit poistaa useiden versioiden päätepisteiden aktivoinnin kerralla mallin asetusruudusta. Valitse käyttöliittymän valintanauhasta Päätepisteiden hallinta ja valitse vähintään yksi aktiivinen päätepiste, jonka aktivoinnin voi poistaa.
Kulutusaste
Aktiivisten mallin päätepisteiden isännöinti kuluttaa Fabric Capacity Units (CU) -yksiköitä. Päätepisteet suoritetaan laskentasolmuissa ja voivat skaalata automaattisesti jopa kolmeen solmuun saapuvan liikenteen perusteella. Laskutus lasketaan solmukohtaisesti, kun päätepiste on aktiivinen. Alla olevassa taulukossa näkyy aktiivisen koneoppimismallin päätepisteen CU-kulutus.
| Toiminto | Operaation mittayksikkö | Kulutusaste |
|---|---|---|
| Mallin päätepiste | 1 mallin päätepiste (versio) sekunnissa solmua kohden | 5 CU-sekuntia |
Alla olevassa taulukossa on esimerkkiskenaarioita ja niitä vastaavia kulutusnopeuksia ja tuntikustannuksia.
| Skenaario | Description | Kulutusaste | Tuntikohtainen kustannus |
|---|---|---|---|
| Mallit, joissa on passiivisia päätepisteitä | Näissä malleissa ei ole aktiivisia versiopäätepisteitä eikä niihin liittyvää resurssien käyttöä. Niistä ei aiheudu lisäkustannuksia. | 0 CU-sekuntia | 0 CU-tunti |
| Mallit, joissa on aktiiviset mutta käyttämättömät päätepisteet | Näissä malleissa on yksi tai useampi aktiivisen version päätepiste, mutta ilman säännöllistä liikennettä kaikki ovat skaalautuneet nollaan, mikä vähentää kustannuksia automaattisesti. | 5 CU-sekuntia | 0.42 CU-tuntia |
| Mallit, joissa on 1 aktiivinen päätepiste ja jatkuva alhainen liikenne | Näissä malleissa on vain 1 aktiivinen version päätepiste, joka palvelee ennusteita, mutta ei tarpeeksi liikennettä täyden skaalauksen käynnistämiseksi. Yksi solmu voi palvella kaikkea liikennettä. Muut version päätepisteet voivat olla passiivisia tai käyttämättömiä. | 5 CU-sekuntia | 5 CU-tuntia |
| Mallit, joissa on 1 aktiivinen päätepiste ja jatkuva suuri liikenne | Näissä malleissa on vain 1 aktiivisen version päätepiste, joka palvelee ennusteita, ja liikennettä riittää käynnistämään täyden skaalauksen. Muut version päätepisteet voivat olla passiivisia tai käyttämättömiä. | 15 CU-sekuntia | 15 CU-tuntia |
| Mallit, joissa on 5 aktiivista päätepistettä ja jatkuva suuri liikenne | Näissä malleissa on 5 aktiivisen version päätepistettä (nykyinen raja), jotka palvelevat ennusteita, joista jokaisella on tarpeeksi liikennettä täyden skaalauksen käynnistämiseksi. | 75 CU-sekuntia | 75 CU-tuntia |
Fabric Capacity Metrics -sovellus näyttää mallin päätepistetoimintojen kapasiteetin kokonaiskäytön nimellä "Mallin päätepiste". Lisäksi käyttäjät voivat tarkastella yhteenvetoa mallin päätepisteen käytön laskutusmaksuistaan laskutuskohdassa "ML Model Endpoint Capacity Usage CU".
Mallin päätepistetoiminto luokitellaan taustatoiminnoiksi.
Kulutusluvut voivat muuttua milloin tahansa. Microsoft pyrkii kohtuullisesti antamaan ilmoituksen sähköpostitse tai tuotteen sisäisellä ilmoituksella. Muutokset ovat voimassa Microsoftin julkaisutiedoissa tai Microsoft Fabric -blogissa mainittuna päivänä. Jos Fabricin kulutusasteen mallin päätepisteen muutos lisää merkittävästi käytettäviä kapasiteettiyksiköitä (CU), asiakkaat voivat käyttää valitun maksutavan peruutusvaihtoehtoja.
Liittyvä sisältö
- Hallitse ja kyselyjen päätepisteitä ohjelmallisesti koneoppimismallin päätepisteen REST-ohjelmointirajapinnan avulla.
- Luo erän ennusteet Fabric-muistikirjojen
PREDICTfunktiolla . - Lue lisätietoja mallien harjoittamisesta ja kokeiluista Fabricissa.
- Jäikö tarvitsemasi ominaisuus väliin? Ehdota sitä Fabric Ideas -keskustelupalstalla.