Merk
Tilgang til denne siden krever autorisasjon. Du kan prøve å logge på eller endre kataloger.
Tilgang til denne siden krever autorisasjon. Du kan prøve å endre kataloger.
Important
Denne funksjonen er i forhåndsvisning.
Microsoft Fabric lar deg servere sanntidsprognoser fra ML-modeller med sikre, skalerbare og brukervennlige nettbaserte endepunkter. Disse endepunktene er tilgjengelige som innebygde egenskaper for de fleste Fabric-modeller, og de krever ingen oppsett for å starte fullstendig administrerte sanntidsdistribusjoner.
Du kan aktivere, konfigurere og spørre etter modellendepunkter med en offentlig REST-API. Du kan også komme i gang direkte fra Stoff-grensesnittet ved hjelp av en lavkodeopplevelse for å aktivere modellendepunkter og forhåndsvise prognoser umiddelbart.
Prerequisites
- Administratoren må aktivere leierbryteren for ML-modellendepunkter i administrasjonsportalen for Fabric for å tjene prognoser i sanntid.
Limitations
- Endepunkter er for øyeblikket tilgjengelige for et begrenset sett med ML-modellsmaker, inkludert Keras, LightGBM, Sklearn og XGBoost.
- Endepunkter er for øyeblikket ikke tilgjengelige for modeller med tensorbaserte skjemaer eller ingen skjemaer.
Komme i gang med modellendepunkter
ML-modeller i Fabric kommer forhåndsbygd med online endepunkter som kan brukes til å tjene sanntidsprognoser. Hver registrerte modellversjon har en dedikert URL-adresse for endepunkt, som du finner under overskriften «Endepunktdetaljer» i Stoff-grensesnittet. Denne URL-adressen avsluttes med en underbane som angir den bestemte versjonen (for eksempel /versions/1/score).
Modellendepunkter har følgende egenskaper:
| Property | Description | Default |
|---|---|---|
| Standard versjon | Denne egenskapen (Yes eller No) angir om versjonen er angitt som modellens standard for å betjene reelle prognoser. Du kan tilpasse standardversjonen i modellens innstillinger. |
No |
| Status | Denne egenskapen angir om endepunktet er klart til å betjene prognoser. Statusen kan være Inactive, Activating, Active, Deactivatingeller Failed. Bare aktive endepunkter kan tjene prognoser. |
Inactive |
| Automatisk hvilemodus | Denne egenskapen (On eller Off) angir om endepunktet, når det er aktivt, skal skalere ned kapasitetsbruken til null i fravær av trafikk. Hvis automatisk hvilemodus er aktivert, angir endepunktet en inaktiv tilstand etter fem minutter uten innkommende forespørsler. Det første kallet for å vekke et inaktivt endepunkt innebærer en kort forsinkelse. |
On |
Aktivere modellendepunkter
Du kan aktivere modellendepunkter direkte fra Stoff-grensesnittet. Gå til versjonen du vil bruke til å tjene prognoser i sanntid, og velg Aktiver versjonsendepunkt fra båndet.
En toast-melding viser at Fabric gjør endepunktet klart til å tjene prognoser, og statusen for endepunktet endres til Aktivering. Bak kulissene spinner Fabric opp den underliggende beholderinfrastrukturen for å være vert for modellen din. I løpet av noen få minutter er endepunktet klart til å tjene prognoser.
Hvert endepunkt har en status som angir om det er klart til å tjene sanntidsprognoser:
| Status | Description |
|---|---|
Inactive |
Endepunktet er ikke aktivert for å tjene sanntidsprognoser, og det bruker ikke Fabric-kapasitet. |
Activating |
Endepunktet konfigureres til å tjene prognoser i sanntid. Bak kulissene setter Fabric opp den underliggende containerinfrastrukturen for å være vert for modellen. I løpet av noen få minutter er endepunktet aktivt. |
Active |
Endepunktet er klart til å tjene sanntidsprognoser. Bak kulissene administrerer Fabric den underliggende infrastrukturen, og skalerer opp ressursbruken basert på innkommende trafikk. Høyere trafikk fører til høyere bruk av stoffkapasitet. |
Deactivating |
Endepunktet deaktiveres, slik at det ikke lenger tjener sanntidsprognoser eller bruker Fabric-kapasitet. Bak kulissene demonterer Fabric den underliggende containerinfrastrukturen. |
Note
ML-modeller kan støtte aktive endepunkter for opptil fem versjoner samtidig. Hvis du vil betjene prognoser fra en sjette versjon, må du først deaktivere et aktivt endepunkt.
Behandle modellendepunkter
Hvis du vil ha en oversikt over modellens aktive endepunkter, velger du Behandle endepunkter fra båndet i grensesnittet. Hver modell har et tilpassbart standard endepunkt, som serverer prognoser fra en versjon du velger. Du kan oppdatere standardversjonen ved hjelp av rullegardinvelgeren i innstillingsruten.
Important
Pass på at du angir standardegenskapen til en aktiv versjon hvis du har tenkt å bruke den. Hvis standardegenskapen ikke er angitt, eller er satt til en inaktiv versjon, mislykkes kall til standard endepunkt.
Alle versjoner med aktive endepunkter er oppført under modellens endepunktinnstillinger. Du kan endre egenskapen for automatisk hvilemodus for hvert endepunkt ved å veksle bryteren til å være «På» eller «Av».
Tip
Aktive endepunkter med automatisk hvilemodus aktivert, angir en inaktiv tilstand etter fem minutter uten trafikk, og det første kallet for å vekke dem, innebærer en kort forsinkelse. Det kan være lurt å deaktivere denne egenskapen for endepunkter i produksjon.
Spørringsmodellendepunkter for sanntidsprognoser
Modellendepunkter er tilgjengelige for umiddelbar testing med en lavkodeopplevelse i Fabric. Gå til en versjon med et aktivt endepunkt, og velg Forhåndsvis prognoser fra båndet i grensesnittet. Du kan sende eksempelforespørsler til endepunktet og få eksempelprognoser i sanntid ved hjelp av skjemafelt som samsvarer med modellens inndatasignatur.
Hvis du vil fylle ut skjemafeltene med tilfeldige eksempelverdier, velger du «Autofyll». Du kan legge til flere sett med skjemaverdier for å teste endepunktet med flere inndata. Velg Hent prognoser for å sende endepunktet til eksempelforespørselen.
Hvis du foretrekker å formatere eksempelforespørsler som JSON-nyttelaster, kan du bruke rullegardinvelgeren til å endre visningen.
Deaktivere modellendepunkter
Du kan deaktivere modellendepunkter direkte fra Stoff-grensesnittet. Gå til en versjon som du ikke lenger trenger for å tjene prognoser i sanntid, og velg «Deaktiver versjonsendepunkt» fra båndet i grensesnittet.
En toast-melding viser at Fabric demonterer den aktive distribusjonen, og statusen for endepunktet endres til «Deaktivering». Endepunktet er ikke lenger i stand til å tjene sanntidsprognoser med mindre du aktiverer det på nytt.
Du kan deaktivere endepunkter for flere versjoner samtidig fra innstillingsruten for modellen. Velg Behandle endepunkter fra båndet i grensesnittet, og velg ett eller flere aktive endepunkter som skal deaktiveres.
Forbrukssats
Drifting av aktive modellendepunkter bruker Fabric Capacity Units (CU-er). Endepunkter kjører på databehandlingsnoder og kan automatisk skalere opptil tre noder basert på innkommende trafikk. Fakturering beregnes per node mens et endepunkt er aktivt. Tabellen nedenfor viser CU-forbruket for et aktivt Machine Learning-modellendepunkt.
| Operasjon | operasjonsenhet | forbrukssats |
|---|---|---|
| Modellens endepunkt | 1 modellendepunkt (versjon) per sekund per node | 5 CU sekunder |
Tabellen nedenfor viser eksempelscenarier og deres tilsvarende forbrukssatser og timekostnader.
| scenario | Description | forbrukssats | Timekostnad |
|---|---|---|---|
| Modeller med inaktive endepunkter | Disse modellene har ingen aktive versjonsendepunkter og ingen tilknyttet ressursutnyttelse. De innebærer ingen ekstra kostnader. | 0 CU sekunder | 0 CU time |
| Modeller med aktive, men inaktive endepunkter | Disse modellene har ett eller flere aktive versjonsendepunkter, men uten vanlig trafikk har alle skalert til null, noe som reduserer kostnadene automatisk. | 5 CU sekunder | 0.42 CU timer |
| Modeller med 1 aktivt endepunkt og konstant lav trafikk | Disse modellene har bare 1 aktivt versjonsendepunkt som betjener prediksjoner, men uten nok trafikk til å utløse en fullstendig utskalering. Én node kan betjene all trafikken. Andre versjonsendepunkter kan være inaktive eller inaktive. | 5 CU sekunder | 5 CU timer |
| Modeller med 1 aktivt endepunkt og konstant høy trafikk | Disse modellene har bare 1 aktivt versjonsendepunkt som betjener prediksjoner, med nok trafikk til å utløse en fullstendig utskalering. Andre versjonsendepunkter kan være inaktive eller inaktive. | 15 CU sekunder | 15 CU timer |
| Modeller med 5 aktive endepunkter og konstant høy trafikk | Disse modellene har 5 aktive versjonsendepunkter (gjeldende grense) som betjener prediksjoner, hver med nok trafikk til å utløse en fullstendig utskalering. | 75 CU sekunder | 75 CU timer |
Appen Strukturkapasitetsmåledata viser den totale kapasitetsbruken for modellendepunktoperasjoner under navnet «Modellendepunkt». I tillegg kan brukere vise et sammendrag av faktureringskostnadene for bruk av modellendepunkt under faktureringselementet «ML Model Endpoint Capacity Usage CU».
Operasjon for modellendepunkt klassifiseres som bakgrunnsoperasjoner.
Forbrukssatser kan endres når som helst. Microsoft bruker rimelig innsats for å varsle via e-post eller via varsling i produktet. Endringene trer i kraft på datoen som er angitt i Microsoft-produktmerknadene eller Microsoft Fabric-bloggen. Hvis en endring i modellendepunktet i Fabric Consumption Rate vesentlig øker kapasitetsenhetene (CU) som kreves for å bruke, kan kundene bruke kanselleringsalternativene som er tilgjengelige for den valgte betalingsmåten.
Relatert innhold
- Behandle og spørre endepunkter programmatisk med ML-modellendepunktet REST API.
- Generer satsvise prognoser med
PREDICTfunksjonen i Fabric-notatblokker. - Lær mer om modellopplæring og eksperimentering i Fabric.
- Gikk vi glipp av en funksjon du trenger? Foreslå det på Fabric Ideas-forumet.