Share via


Realtime voorspellingen uitvoeren met ML-modeleindpunten (preview)

Belangrijk

Deze functie is beschikbaar als preview-versie.

Met Microsoft Fabric kunt u realtime voorspellingen uitvoeren van ML-modellen met veilige, schaalbare en gebruiksvriendelijke online-eindpunten. Deze eindpunten zijn beschikbaar als ingebouwde eigenschappen van de meeste Fabric-modellen. Hiervoor is geen installatie vereist om volledig beheerde realtime implementaties te starten.

U kunt eindpunten van modellen activeren, configureren en er query's op uitvoeren met een openbare REST API. U kunt ook rechtstreeks vanuit de Fabric-interface aan de slag gaan met behulp van een ervaring met weinig code om modeleindpunten en preview-voorspellingen direct te activeren.

Schermopname van een ML-model in Fabric met een ingebouwde eindpunteigenschap voor het leveren van realtime voorspellingen.

Vereiste voorwaarden

Beperkingen

  • Eindpunten zijn momenteel beschikbaar voor een beperkte set ML-model flavors, waaronder Keras, LightGBM, Sklearn en XGBoost.
  • Eindpunten zijn momenteel niet beschikbaar voor modellen met op tensor gebaseerde schema's of geen schema's.

Aan de slag met modeleindpunten

ML-modellen in Fabric zijn vooraf samengesteld met online-eindpunten die kunnen worden gebruikt voor realtime voorspellingen. Elke geregistreerde modelversie heeft een toegewezen eindpunt-URL, die u kunt vinden onder de kop Eindpuntgegevens in de fabric-interface. Deze URL eindigt met een subpad dat die specifieke versie aanwijzen (bijvoorbeeld /versions/1/score).

Schermopname van de eigenschappen van een ML-modeleindpunt, dat kan worden gebruikt voor realtime voorspellingen.

Modeleindpunten hebben de volgende eigenschappen:

Eigenschappen Beschrijving standaard
Standaardversie Deze eigenschap (Yes of No) geeft aan of de versie is ingesteld als de standaardwaarde van het model voor het leveren van echte voorspellingen. U kunt de standaardversie aanpassen in de instellingen van het model. No
Status Deze eigenschap geeft aan of het eindpunt gereed is voor voorspellingen. De status kan zijnInactive, Activating, Active, of DeactivatingFailed. Alleen actieve eindpunten kunnen voorspellingen leveren. Inactive
Automatische slaapstand Met deze eigenschap (On of Off) wordt aangegeven of het eindpunt, zodra actief, het capaciteitsgebruik omlaag moet schalen naar nul bij afwezigheid van verkeer. Als de automatische slaapstand is ingeschakeld, voert het eindpunt na vijf minuten zonder binnenkomende aanvragen een niet-actieve status in. De eerste aanroep om een niet-actief eindpunt wakker te maken, heeft een korte vertraging. On

Modeleindpunten activeren

U kunt modeleindpunten rechtstreeks vanuit de Fabric-interface activeren. Navigeer naar de versie die u wilt gebruiken om realtime voorspellingen te verstrekken en selecteer ‘Versie-eindpunt activeren’ op de werkbalk.

Schermopname die laat zien hoe u een ML-modeleindpunt activeert vanuit de Fabric-interface.

Een melding laat zien dat Fabric uw eindpunt klaarmaakt om voorspellingen te leveren en dat de status van het eindpunt verandert in "Activating." In de achtergrond zet Fabric de onderliggende containerinfrastructuur op om uw model te hosten. Binnen een paar minuten is uw eindpunt klaar om voorspellingen te leveren.

Schermopname van een ML-modeleindpunt dat nu wordt geactiveerd.

Elk eindpunt heeft een status die aangeeft of het gereed is voor realtime voorspellingen:

Status Beschrijving
Inactive Het eindpunt is niet geactiveerd voor het leveren van realtime voorspellingen en er wordt geen Fabric-capaciteit verbruikt.
Activating Het eindpunt wordt geconfigureerd voor realtime voorspellingen. Achter de schermen stelt Fabric de onderliggende containerinfrastructuur in om het model te hosten. Binnen een paar minuten is het eindpunt actief.
Active Het eindpunt is klaar om realtime voorspellingen te leveren. Achter de schermen beheert Fabric de onderliggende infrastructuur, waarbij het resourcegebruik wordt opgeschaald op basis van inkomend verkeer. Een hoger verkeer resulteert in een hoger capaciteitsgebruik van fabric.
Deactivating Het eindpunt wordt gedeactiveerd, zodat het geen realtime voorspellingen meer doet of Fabric-capaciteit verbruikt. Achter de schermen wordt de onderliggende containerinfrastructuur door Fabric gedemonteerd.

Opmerking

ML-modellen kunnen actieve eindpunten ondersteunen voor maximaal vijf versies tegelijk. Als u voorspellingen van een zesde versie wilt uitvoeren, moet u eerst een actief eindpunt deactiveren.

Modeleindpunten beheren

Selecteer Eindpunten beheren op het lint in de interface voor een overzicht van de actieve eindpunten van uw model. Elk model heeft een aanpasbaar standaardeindpunt, dat voorspellingen levert van een versie die u kiest. U kunt de standaardversie bijwerken met behulp van de vervolgkeuzelijstkiezer in het deelvenster Instellingen.

Schermopname van de standaard-URL van het ML-modeleindpunt, die u kunt configureren voor voorspellingen van een specifieke versie.

Belangrijk

Zorg ervoor dat u de standaardeigenschap instelt op een actieve versie als u deze wilt gebruiken. Als de standaardeigenschap niet is ingesteld of is ingesteld op een inactieve versie, mislukt het aanroepen van het standaardeindpunt.

Alle versies met actieve eindpunten worden vermeld onder de eindpuntinstellingen van het model. U kunt de eigenschap voor automatische slaapstand van elk eindpunt wijzigen door de schakelaar in te schakelen op 'Aan' of 'Uit'.

Schermopname van het wijzigen van de eigenschap voor automatische slaapstand op ML-modeleindpunten.

Aanbeveling

Actieve eindpunten met automatische slaapstand ingeschakeld, voeren na vijf minuten zonder verkeer een niet-actieve status in en de eerste aanroep om ze wakker te maken, heeft een korte vertraging. U kunt deze eigenschap uitschakelen voor eindpunten in productie.

Querymodeleindpunten voor realtime voorspellingen

Modeleindpunten zijn beschikbaar voor direct testen met een ervaring met weinig code in Fabric. Navigeer naar een versie met een actief eindpunt en selecteer Preview-voorspellingen op het lint in de interface. U kunt voorbeeldaanvragen verzenden naar het eindpunt en voorbeeldvoorspellingen in realtime ophalen met behulp van formuliervelden die overeenkomen met de invoerhandtekening van het model.

Schermopname van de ingebouwde preview-ervaring voor het ophalen van voorbeeldvoorspellingen van een actief ML-modeleindpunt.

Als u de formuliervelden met willekeurige voorbeeldwaarden wilt vullen, selecteert u Automatisch doorvoeren. U kunt meer sets formulierwaarden toevoegen om het eindpunt te testen met meerdere invoerwaarden. Selecteer Voorspellingen ophalen om het eindpunt van uw voorbeeldaanvraag te verzenden.

Schermopname van de formulierweergave voor het verzenden van voorbeeldaanvragen naar een actief ML-modeleindpunt.

Als u liever voorbeeldaanvragen opmaakt als JSON-nettoladingen, gebruikt u de vervolgkeuzelijstkiezer om de weergave te wijzigen.

Schermopname van de weergave op basis van JSON voor het verzenden van voorbeeldaanvragen naar een actief ML-modeleindpunt.

Modeleindpunten deactiveren

U kunt modeleindpunten rechtstreeks vanuit de Fabric-interface deactiveren. Navigeer naar een versie die u niet meer nodig hebt om realtime voorspellingen te leveren en selecteer "Deactiveer versie-eindpunt" in de werkbalk van de interface.

Schermopname van het deactiveren van een ML-modeleindpunt vanuit de Fabric-interface.

Een toastbericht laat zien dat Fabric uw actieve implementatie aan het afbreken is en dat de status van het eindpunt verandert in 'Deactiveren'. Het eindpunt kan geen realtime voorspellingen meer leveren, tenzij u het opnieuw activeert.

Schermopname van een ML-modeleindpunt dat nu wordt gedeactiveert.

U kunt eindpunten voor meerdere versies tegelijk deactiveren vanuit het deelvenster met instellingen van het model. Selecteer Eindpunten beheren op het lint in de interface en kies een of meer actieve eindpunten die u wilt deactiveren.

Schermopname die laat zien hoe u meerdere ML-modeleindpunten tegelijk kunt deactiveren vanuit de Fabric-interface.

Verbruikstarief

Het hosten van actieve modeleindpunten verbruikt fabriccapaciteitseenheden (CA's). Eindpunten worden uitgevoerd op rekenknooppunten en kunnen automatisch worden geschaald tot drie knooppunten op basis van inkomend verkeer. Facturering wordt per knooppunt berekend terwijl een eindpunt actief is. In de onderstaande tabel ziet u het CU-verbruik voor een actief Machine Learning-modeleindpunt.

Operatie Bewerkingseenheid van meting Verbruikstarief
modeleindpunt 1 modeleindpunt (versie) per seconde per knooppunt 5 CU seconden

In de onderstaande tabel ziet u voorbeeldscenario's en de bijbehorende verbruikstarieven en de kosten per uur.

Scenario Beschrijving Verbruikstarief Kosten per uur
Modellen met inactieve eindpunten Deze modellen hebben geen actieve versie-eindpunten en geen gekoppeld resourcegebruik. Er zijn geen extra kosten verbonden. 0 CU seconden 0 CU-uur
Modellen met actieve maar niet-actieve eindpunten Deze modellen hebben een of meer actieve versie-eindpunten, maar zonder regelmatig verkeer zijn allemaal geschaald naar nul, waardoor de kosten automatisch worden verlaagd. 5 CU seconden 0,42 CU-uren
Modellen met 1 actief eindpunt en constant weinig verkeer Deze modellen hebben slechts één actief versie-eindpunt dat voorspellingen biedt, maar zonder voldoende verkeer om opschaling volledig te starten. Eén knooppunt kan al het verkeer verwerken. Andere versie-eindpunten kunnen inactief of stilstaand zijn. 5 CU seconden 5 CU-uren
Modellen met 1 actief eindpunt en constant hoog verkeer Deze modellen hebben slechts één actief versie-eindpunt dat voorspellingen biedt, met voldoende verkeer om een volledige uitschaal te activeren. Andere versie-eindpunten kunnen inactief of in ruststand zijn. 15 CU seconden 15 CU-uren
Modellen met 5 actieve eindpunten en constant hoog verkeer Deze modellen hebben vijf actieve versie-eindpunten (de huidige limiet) die voorspellingen leveren, elk met voldoende verkeer om een volledige uitschaal te activeren. 75 CU seconden 75 CU-uren

De Fabric Capaciteitsmetriek-app geeft het totale capaciteitsgebruik weer voor model-eindpuntbewerkingen onder de naam 'Model-eindpunt'. Daarnaast kunnen gebruikers een overzicht bekijken van hun factureringskosten voor modeleindpuntgebruik onder het factureringsitem 'CU voor ml-modeleindpuntcapaciteitsgebruik'.

De eindpuntbewerking van het model wordt geclassificeerd als achtergrondbewerkingen.

Verbruikstarieven kunnen op elk gewenst moment worden gewijzigd. Microsoft gebruikt redelijke inspanningen om kennisgeving via e-mail of via een melding in het product te verstrekken. Wijzigingen zijn van kracht op de datum die wordt vermeld in de opmerkingen bij de Microsoft-release of het Microsoft Fabric-blog. Als een wijziging in het model-eindpunt in het verbruikstarief voor Fabric de benodigde capaciteitseenheden (CU) aanzienlijk verhoogt, kunnen klanten de opzegmogelijkheden gebruiken die beschikbaar zijn voor de gekozen betaalmethode.