Jaa


Reaaliaikaisten ennusteiden tarjoaminen koneoppimismallin päätepisteiden avulla (esikatselu)

Important

Tämä ominaisuus on esikatselutilassa.

Microsoft Fabricin avulla voit tarjota koneoppimismallien reaaliaikaisia ennusteita suojattujen, skaalattavien ja helppokäyttöisten online-päätepisteiden avulla. Nämä päätepisteet ovat saatavilla useimpien Fabric-mallien sisäänrakennettuina ominaisuutena, eikä niitä tarvitse määrittää täysin hallittujen reaaliaikaisten käyttöönottojen käynnistämiseksi.

Voit aktivoida, määrittää ja tehdä kyselyjä mallin päätepisteistä julkisella REST-ohjelmointirajapinnalla. Voit aloittaa myös suoraan Fabric-käyttöliittymästä ilman koodausta ja aktivoida mallin päätepisteet ja esikatsella ennusteita heti vähäisellä koodauksella.

Näyttökuva, jossa näkyy koneoppimismalli Fabricissa ja sisäinen päätepisteominaisuus reaaliaikaisten ennusteiden palvelemista varten.

Prerequisites

Limitations

  • Päätepisteet ovat tällä hetkellä saatavilla rajoitetulle määrälle koneoppimismallin makuja, kuten Keras, LightGBM, Sklearn ja XGBoost.
  • Päätepisteet eivät ole tällä hetkellä käytettävissä malleissa, joissa on tensoripohjaisia rakenteita tai ei rakenteita.

Aloita mallin päätepisteiden käyttäminen

Fabricin ml-mallit ovat valmiita verkkopäätepisteillä, joita voidaan käyttää reaaliaikaisten ennusteiden palvelemiseen. Jokaisella rekisteröidyllä malliversiolla on erillinen päätepisteen URL-osoite, joka löytyy Fabric-liittymän Päätepisteen tiedot -otsikon alareunasta. Tämän URL-osoitteen lopussa on alipolku, joka määrittää tietyn version (esimerkiksi /versions/1/score).

Näyttökuva, jossa näkyvät koneoppimismallin päätepisteen ominaisuudet, joita voidaan käyttää reaaliaikaisten ennusteiden palvelemiseen.

Mallin päätepisteillä on seuraavat ominaisuudet:

Property Description Default
Oletusversio Tämä ominaisuus (Yes tai No) ilmaisee, onko versio määritetty mallin oletukseksi reaaliennusteiden palvelemiselle. Voit mukauttaa oletusversiota mallin asetuksissa. No
Status Tämä ominaisuus ilmaisee, onko päätepiste valmis tekemään ennusteita. Tila voi olla Inactive, , ActivatingActive, Deactivating, tai Failed. Vain aktiiviset päätepisteet voivat palvella ennusteita. Inactive
Automaattinen lepotila Tämä ominaisuus (On tai Off) ilmaisee, tuleeko aktiivisena olevan päätepisteen skaalata kapasiteetin käyttö nollaan ilman liikennettä. Jos automaattinen uni on käytössä, päätepisteeseen tulee käyttämättömyystila viiden minuutin kuluttua ilman saapuvia pyyntöjä. Ensimmäinen kutsu, joka herättää tyhjän päätepisteen, sisältää lyhyen viiveen. On

Aktivoi mallin päätepisteet

Voit aktivoida mallin päätepisteet suoraan Fabric-käyttöliittymästä. Siirry versioon, jonka haluat antaa reaaliaikaisilla ennusteilla, ja valitse valintanauhasta Aktivoi version päätepiste.

Näyttökuva, jossa näytetään, miten koneoppimismallin päätepiste aktivoidaan Fabric-käyttöliittymästä.

Paahtoleipäviesti kertoo, että Fabric on valmistelemassa päätepistettäsi ennakoimaan ennusteita, ja päätepisteen tilaksi muuttuu "Aktivointi". Fabric pyörittää taustalla pohjana olevaa säilöinfrastruktuuria mallisi isännöimiseksi. Päätepiste on valmis ennakoimaan ennusteita muutaman minuutin kuluessa.

Näyttökuva, jossa näkyy koneoppimismallin päätepiste, joka aktivoi nyt.

Jokaisella päätepisteellä on tila, joka ilmaisee, onko se valmis suorittamaan reaaliaikaisia ennusteita:

Status Description
Inactive Päätepistettä ei ole aktivoitu reaaliaikaisten ennusteiden palvelemiseksi, eikä se käytä Fabric-kapasiteettia.
Activating Päätepistettä määritetään palvelemaan reaaliaikaisia ennusteita. Taustalla Fabric määrittää pohjana olevan säilöinfrastruktuurin mallin isännöimiseksi. Päätepiste on aktiivinen muutaman minuutin kuluessa.
Active Päätepiste on valmis reaaliaikaisten ennusteiden palvelemiseen. Taustalla Fabric hallitsee pohjana olevaa infrastruktuuria ja skaalaa resurssien käyttöä saapuvan liikenteen perusteella. Kun liikenne on suurempi, Fabric-kapasiteetin käyttö on suurempaa.
Deactivating Päätepistettä ollaan poistamasta käytöstä, jotta se ei enää käytä reaaliaikaisia ennusteita eikä käytä Fabric-kapasiteettia. Taustalla Fabric purkaa pohjana olevan säilöinfrastruktuurin.

Note

Koneoppimismallit voivat tukea aktiivisia päätepisteitä enintään viidelle versiolle kerralla. Jotta voit antaa ennusteita kuudennesta versiosta, aktiivisen päätepisteen aktivointi on ensin poistettava.

Mallien päätepisteiden hallinta

Saat yleiskatsauksen mallisi aktiivisista päätepisteistä valitsemalla Päätepisteiden hallinta -vaihtoehdon käyttöliittymän valintanauhasta. Jokaisella mallilla on mukautettava oletuspäätepiste, joka lähettää ennusteita valitsemastasi versiosta. Voit päivittää oletusversion asetukset-ruudun avattavan valikon valitsimella.

Näyttökuva, jossa näkyy koneoppimismallin oletusarvoinen päätepisteen URL-osoite, jonka voit määrittää palvelemaan tietyn version ennusteita.

Important

Muista määrittää oletusominaisuudeksi aktiivinen versio, jos aiot käyttää sitä. Jos oletusominaisuutta ei ole määritetty tai jos se on määritetty passiiviseksi versioksi, kutsut oletuspäätepisteeseen epäonnistuvat.

Kaikki aktiiviset päätepisteet sisältävät versiot luetellaan mallin päätepisteasetuksissa. Voit muokata kunkin päätepisteen automaattista lepotilaominaisuutta vaihtamalla valitsimen arvoksi "On" tai "Off".

Näyttökuva, jossa näytetään, miten voit muuttaa automaattianalyysipalveluiden mallin päätepisteiden automaattista lepotilaominaisuutta.

Tip

Aktiiviset päätepisteet, joissa automaattinen lepotila on käytössä, muuttuvat käyttämättömyystilaksi viiden minuutin kuluttua ilman liikennettä, ja ensimmäinen kutsu, joka herättää ne, aiheuttaa lyhyen viiveen. Haluat ehkä poistaa tämän ominaisuuden käytöstä tuotannon päätepisteissä.

Kyselymallin päätepisteistä reaaliaikaisia ennusteita varten

Mallien päätepisteet ovat käytettävissä pikatestaukseen vähäisellä koodatulla Fabric-käyttökokemuksella. Siirry aktiivisen päätepisteen sisältävään versioon ja valitse käyttöliittymän valintanauhasta Esikatsele ennusteita. Voit lähettää mallipyyntöjä päätepisteeseen – ja saada malliennusteita reaaliaikaisesti – käyttämällä lomakekenttiä, jotka vastaavat mallin syöteallekirjoitusta.

Näyttökuva, jossa näkyy sisäinen esikatselukokemus malliennusteiden hankkimiseksi aktiivisesta koneoppimismallin päätepisteestä.

Jos haluat täyttää lomakekentät satunnaisilla malliarvoilla, valitse "Automaattinen täyttö". Voit lisätä lomakearvojoukkoja testataksesi päätepistettä useilla syötteillä. Lähetä mallipyyntösi päätepiste valitsemalla Hae ennusteet.

Näyttökuva, jossa näkyy lomakepohjainen näkymä mallipyyntöjen lähettämiseksi aktiiviseen koneoppimismallin päätepisteeseen.

Jos haluat muotoilla mallipyyntöjä JSON-hyötykuormiksi, vaihda näkymää avattavan valikon valitsimella.

Näyttökuva, jossa näkyy JSON-pohjainen näkymä mallipyyntöjen lähettämiseksi aktiiviseen koneoppimismallin päätepisteeseen.

Mallin päätepisteiden aktivoinnin poistaminen

Voit poistaa mallin päätepisteiden aktivoinnin suoraan Fabric-liittymästä. Siirry versioon, jonka reaaliaikaisia ennusteita ei enää tarvitse antaa, ja valitse käyttöliittymän valintanauhasta Poista version päätepiste käytöstä.

Näyttökuva, jossa näytetään, miten koneoppimismallin päätepiste poistetaan Fabric-käyttöliittymästä.

Sanomassa näytetään, että Fabric purkaa aktiivisen käyttöönoton ja päätepisteen tila muuttuu arvoksi "Deactivating". Päätepiste ei enää pysty palvelemaan reaaliaikaisia ennusteita, ellet aktivoi sitä uudelleen.

Näyttökuva, jossa näkyy koneoppimismallin päätepiste, joka poistaa nyt käytöstä.

Voit poistaa useiden versioiden päätepisteiden aktivoinnin kerralla mallin asetusruudusta. Valitse käyttöliittymän valintanauhasta Päätepisteiden hallinta ja valitse vähintään yksi aktiivinen päätepiste, jonka aktivoinnin voi poistaa.

Näyttökuva, jossa näytetään, miten voit poistaa useita koneoppimisen mallin päätepisteitä kerralla Fabric-käyttöliittymästä.

Kulutusaste

Aktiivisten mallin päätepisteiden isännöinti kuluttaa Fabric Capacity Units (CU) -yksiköitä. Päätepisteet suoritetaan laskentasolmuissa ja voivat skaalata automaattisesti jopa kolmeen solmuun saapuvan liikenteen perusteella. Laskutus lasketaan solmukohtaisesti, kun päätepiste on aktiivinen. Alla olevassa taulukossa näkyy aktiivisen koneoppimismallin päätepisteen CU-kulutus.

Toiminto Operaation mittayksikkö Kulutusaste
Mallin päätepiste 1 mallin päätepiste (versio) sekunnissa solmua kohden 5 CU-sekuntia

Alla olevassa taulukossa on esimerkkiskenaarioita ja niitä vastaavia kulutusnopeuksia ja tuntikustannuksia.

Skenaario Description Kulutusaste Tuntikohtainen kustannus
Mallit, joissa on passiivisia päätepisteitä Näissä malleissa ei ole aktiivisia versiopäätepisteitä eikä niihin liittyvää resurssien käyttöä. Niistä ei aiheudu lisäkustannuksia. 0 CU-sekuntia 0 CU-tunti
Mallit, joissa on aktiiviset mutta käyttämättömät päätepisteet Näissä malleissa on yksi tai useampi aktiivisen version päätepiste, mutta ilman säännöllistä liikennettä kaikki ovat skaalautuneet nollaan, mikä vähentää kustannuksia automaattisesti. 5 CU-sekuntia 0.42 CU-tuntia
Mallit, joissa on 1 aktiivinen päätepiste ja jatkuva alhainen liikenne Näissä malleissa on vain 1 aktiivinen version päätepiste, joka palvelee ennusteita, mutta ei tarpeeksi liikennettä täyden skaalauksen käynnistämiseksi. Yksi solmu voi palvella kaikkea liikennettä. Muut version päätepisteet voivat olla passiivisia tai käyttämättömiä. 5 CU-sekuntia 5 CU-tuntia
Mallit, joissa on 1 aktiivinen päätepiste ja jatkuva suuri liikenne Näissä malleissa on vain 1 aktiivisen version päätepiste, joka palvelee ennusteita, ja liikennettä riittää käynnistämään täyden skaalauksen. Muut version päätepisteet voivat olla passiivisia tai käyttämättömiä. 15 CU-sekuntia 15 CU-tuntia
Mallit, joissa on 5 aktiivista päätepistettä ja jatkuva suuri liikenne Näissä malleissa on 5 aktiivisen version päätepistettä (nykyinen raja), jotka palvelevat ennusteita, joista jokaisella on tarpeeksi liikennettä täyden skaalauksen käynnistämiseksi. 75 CU-sekuntia 75 CU-tuntia

Fabric Capacity Metrics -sovellus näyttää mallin päätepistetoimintojen kapasiteetin kokonaiskäytön nimellä "Mallin päätepiste". Lisäksi käyttäjät voivat tarkastella yhteenvetoa mallin päätepisteen käytön laskutusmaksuistaan laskutuskohdassa "ML Model Endpoint Capacity Usage CU".

Mallin päätepistetoiminto luokitellaan taustatoiminnoiksi.

Kulutusluvut voivat muuttua milloin tahansa. Microsoft pyrkii kohtuullisesti antamaan ilmoituksen sähköpostitse tai tuotteen sisäisellä ilmoituksella. Muutokset ovat voimassa Microsoftin julkaisutiedoissa tai Microsoft Fabric -blogissa mainittuna päivänä. Jos Fabricin kulutusasteen mallin päätepisteen muutos lisää merkittävästi käytettäviä kapasiteettiyksiköitä (CU), asiakkaat voivat käyttää valitun maksutavan peruutusvaihtoehtoja.