Delen via


Belang van permutatiefunctie

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Berekent de belangsscores van de permutatiefunctie van functievariabelen op basis van een getraind model en een test-gegevensset

Categorie: Functieselectiemodules

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Belang van permutatiefunctie in Machine Learning Studio (klassiek) gebruikt om een set score voor functie-belang voor uw gegevensset te berekenen. U gebruikt deze scores om u te helpen bepalen welke functies het beste in een model moeten worden gebruikt.

In deze module worden functiewaarden willekeurig in willekeurige volgorde geplaatst, één kolom tegelijk en worden de prestaties van het model vóór en na gemeten. U kunt een van de standaard metrische gegevens kiezen om de prestaties te meten.

De scores die de module retourneert, vertegenwoordigen de wijziging in de prestaties van een getraind model, na permutatie. Belangrijke functies zijn doorgaans gevoeliger voor het shuffling-proces en leiden dus tot scores met een hoger belang.

Dit artikel biedt een goed algemeen overzicht van het belang van permutatiefunctie, de theoretische basis en de toepassingen ervan in machine learning: Belang van permutatiefunctie

Belang van permutatiefunctie gebruiken

Als u een set functiescores wilt genereren, moet u een al getraind model en een testset hebben.

  1. Voeg de module Belang van permutatiefunctie toe aan uw experiment. U vindt deze module in de categorie Functieselectie .

  2. Verbinding maken getraind model aan de linkerkant. Het model moet een regressiemodel of classificatiemodel zijn.

  3. Koppel aan de rechterinvoer een gegevensset, bij voorkeur een gegevensset die verschilt van de gegevensset die wordt gebruikt voor het trainen van het model. Deze gegevensset wordt gebruikt om te scoren op basis van het getrainde model en om het model te evalueren nadat de functiewaarden zijn gewijzigd.

  4. Voor Willekeurige seed typt u een waarde die moet worden gebruikt als seed voor randomisatie. Als u 0 opgeeft (de standaardinstelling), wordt er een getal gegenereerd op basis van de systeemklok.

    Een seed-waarde is optioneel, maar u moet een waarde geven als u reproduceerbaarheid wilt tussen de runs van hetzelfde experiment.

  5. Voor Metrische gegevens voor het meten van prestaties selecteert u één metrische gegevens die moeten worden gebruikt bij het berekenen van de kwaliteit van het model na permutatie.

    Machine Learning Studio (klassiek) ondersteunt de volgende metrische gegevens, afhankelijk van of u een classificatie- of regressiemodel evalueert:

    • Classificatie

      Nauwkeurigheid, precisie, terughalen, gemiddeld logboekverlies

    • Regressie

      Precision, Recall, Mean Absolute Error , Root Mean Squared Error, Relative Absolute Error, Relative Squared Error, Coefficient of Determination

    Zie Evalueren voor een gedetailleerde beschrijving van deze metrische evaluatiegegevens en hoe deze worden berekend.

  6. Voer het experiment uit.

  7. De module geeft een lijst met functiekolommen en de bijbehorende scores weer, gerangschikt op volgorde van de scores, aflopend.

Voorbeelden

Bekijk deze voorbeeldexperimenten in de Azure AI Gallery:

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Hoe verhoudt dit zich tot andere methoden voor het selecteren van functies?

Het belang van permutatiefunctie werkt door de waarden van elke functiekolom, één kolom tegelijk, willekeurig te wijzigen en vervolgens het model te evalueren.

De classificaties die worden geboden door het belang van de permutatiefunctie verschillen vaak van de classificaties die u krijgt van Filter Based Feature Selection, waarmee scores worden berekend voordat een model wordt gemaakt.

Dit komt doordat het belang van permutatiefunctie niet de associatie meet tussen een functie en een doelwaarde, maar in plaats daarvan vast legt hoeveel invloed elke functie heeft op voorspellingen van het model.

Verwachte invoer

Naam Type Description
Getraind model ILearner-interface Een getraind classificatie- of regressiemodel
Testgegevens Gegevenstabel Test de gegevensset voor het scoren en evalueren van een model na het permuteren van functiewaarden

Moduleparameters

Naam Type Bereik Optioneel Standaard Beschrijving
Willekeurige seed Geheel getal >= 0 Vereist 0 Seed-waarde van generator voor willekeurige getallen
Metrische gegevens voor het meten van prestaties EvaluationMetricType selecteren in de lijst Vereist Classificatie - nauwkeurigheid Selecteer de metrische gegevens die moeten worden gebruikt bij het evalueren van de variabiliteit van het model na permutaties

Uitvoerwaarden

Naam Type Description
Functie-urgentie Gegevenstabel Een gegevensset met de resultaten van het belang van de functie, op basis van de geselecteerde metrische waarde

Uitzonderingen

Uitzondering Description
Fout 0062 Er treedt een uitzondering op bij het vergelijken van twee modellen met verschillende typen studenten.
Fout 0024 Uitzondering treedt op als de gegevensset geen labelkolom bevat.
Fout 0105 Wordt opgeslagen wanneer een moduledefinitiebestand een parametertype definieert dat niet is gesuporteerd
Fout 0021 Uitzondering treedt op als het aantal rijen in sommige gegevenssets dat aan de module wordt doorgegeven te klein is.

Zie ook

Functieselectie
Functieselectie op basis van filters
Analyse van hoofdcomponenten