Het verantwoordelijke AI-dashboard gebruiken in Azure Machine Learning-studio

Verantwoorde AI-dashboards zijn gekoppeld aan uw geregistreerde modellen. Als u uw verantwoordelijke AI-dashboard wilt bekijken, gaat u naar het modelregister en selecteert u het geregistreerde model waarvoor u een verantwoordelijk AI-dashboard hebt gegenereerd. Selecteer vervolgens het tabblad Verantwoorde AI om een lijst met gegenereerde dashboards weer te geven.

Screenshot of the model details pane in Azure Machine Learning studio, with the 'Responsible AI' tab highlighted.

U kunt meerdere dashboards configureren en deze koppelen aan uw geregistreerde model. Verschillende combinaties van onderdelen (interpreteerbaarheid, foutanalyse, causale analyse, enzovoort) kunnen worden gekoppeld aan elk verantwoordelijk AI-dashboard. In de volgende afbeelding ziet u de aanpassing van een dashboard en de onderdelen die erin zijn gegenereerd. In elk dashboard kunt u verschillende onderdelen in de gebruikersinterface van het dashboard zelf weergeven of verbergen.

Screenshot of Responsible AI tab with a dashboard name highlighted.

Selecteer de naam van het dashboard om het te openen in een volledige weergave in uw browser. Als u wilt terugkeren naar uw lijst met dashboards, kunt u op elk gewenst moment Terug naar modeldetails selecteren.

Screenshot of a Responsible AI dashboard with the 'Back to model details' button highlighted.

Volledige functionaliteit met geïntegreerde rekenresource

Voor sommige functies van het verantwoordelijke AI-dashboard zijn dynamische, on-the-fly- en realtimeberekeningen vereist (bijvoorbeeld wat-als-analyse). Tenzij u een rekenresource verbindt met het dashboard, ontbreekt er mogelijk een aantal functies. Wanneer u verbinding maakt met een rekenresource, schakelt u de volledige functionaliteit van uw Responsible AI-dashboard in voor de volgende onderdelen:

  • Foutenanalyse
    • Als u uw globale-gegevenshort instelt op een cohort van belang, wordt de foutstructuur bijgewerkt in plaats dat deze wordt uitgeschakeld.
    • Het selecteren van andere metrische fout- of prestatiegegevens wordt ondersteund.
    • Het selecteren van een subset van functies voor de training van de foutstructuurkaart wordt ondersteund.
    • Het wijzigen van het minimale aantal vereiste steekproeven per bladknooppunt en diepte van de foutstructuur wordt ondersteund.
    • Dynamisch bijwerken van de heatmap voor maximaal twee functies wordt ondersteund.
  • Urgentie van functies
    • Een afzonderlijke voorwaardelijke verwachting (ICE) plot op het tabblad met het belang van afzonderlijke functies wordt ondersteund.
  • Contrafactuele what-if
    • Het genereren van een nieuw what-if contrafactual gegevenspunt om inzicht te krijgen in de minimale wijziging die vereist is voor een gewenst resultaat wordt ondersteund.
  • Causale analyse
    • Het selecteren van een afzonderlijk gegevenspunt, het verstoren van de behandelingsfuncties en het zien van het verwachte causale resultaat van causaal wat-als wordt ondersteund (alleen voor regressie-machine learning-scenario's).

U kunt deze informatie ook vinden op de pagina Verantwoordelijke AI-dashboard door het pictogram Informatie te selecteren, zoals wordt weergegeven in de volgende afbeelding:

Screenshot of the 'Information' icon on the Responsible AI dashboard.

Volledige functionaliteit van het verantwoordelijke AI-dashboard inschakelen

  1. Selecteer een actief rekenproces in de vervolgkeuzelijst Compute boven aan het dashboard. Als u geen actieve berekening hebt, maakt u een nieuw rekenproces door het plusteken (+) naast de vervolgkeuzelijst te selecteren. U kunt ook de knop Rekenproces starten selecteren om een gestopt rekenproces te starten. Het maken of starten van een rekenproces kan enkele minuten duren.

    Screenshot of the 'Compute' dropdown box for selecting a running compute instance.

  2. Wanneer een berekening de status Actief heeft, begint uw verantwoordelijke AI-dashboard verbinding te maken met het rekenproces. Hiervoor wordt een terminalproces gemaakt op het geselecteerde rekenproces en wordt er een verantwoordelijk AI-eindpunt gestart in de terminal. Selecteer Terminaluitvoer weergeven om het huidige terminalproces weer te geven.

    Screenshot showing that the responsible AI dashboard is connecting to a compute resource.

  3. Wanneer uw verantwoordelijke AI-dashboard is verbonden met het rekenproces, ziet u een groene berichtenbalk en is het dashboard nu volledig functioneel.

    Screenshot showing that the dashboard is connected to the compute instance.

  4. Als het proces enige tijd duurt en uw verantwoordelijke AI-dashboard nog steeds niet is verbonden met het rekenproces of als er een rode foutberichtsbalk wordt weergegeven, betekent dit dat er problemen zijn met het starten van uw verantwoordelijke AI-eindpunt. Selecteer Terminal-uitvoer weergeven en schuif omlaag naar beneden om het foutbericht weer te geven.

    Screenshot of an error connecting to a compute.

    Als u problemen ondervindt bij het oplossen van het probleem 'Kan geen verbinding maken met rekenproces', selecteert u het pictogram Glimlach rechtsboven. Stuur feedback naar ons over eventuele fouten of problemen die u ondervindt. U kunt een schermopname en uw e-mailadres opnemen in het feedbackformulier.

Overzicht van de gebruikersinterface van het verantwoordelijke AI-dashboard

Het verantwoordelijke AI-dashboard bevat een robuuste, uitgebreide set visualisaties en functionaliteit om u te helpen bij het analyseren van uw machine learning-model of het nemen van zakelijke beslissingen op basis van gegevens:

Algemene besturingselementen

Boven aan het dashboard kunt u cohorten maken (subgroepen van gegevenspunten die opgegeven kenmerken delen) om uw analyse van elk onderdeel te concentreren. De naam van het cohort dat momenteel op het dashboard wordt toegepast, wordt altijd linksboven in het dashboard weergegeven. De standaardweergave in uw dashboard is uw hele gegevensset met de titel Alle gegevens (standaard).

Screenshot of a responsible AI dashboard showing all data.

  1. Cohortinstellingen: hiermee kunt u de details van elk cohort in een zijpaneel weergeven en wijzigen.
  2. Dashboardconfiguratie: Hiermee kunt u de indeling van het algehele dashboard in een zijpaneel weergeven en wijzigen.
  3. Ander cohort: hiermee kunt u een ander cohort selecteren en de statistieken ervan weergeven in een pop-upvenster.
  4. Nieuw cohort: hiermee kunt u een nieuw cohort maken en toevoegen aan uw dashboard.

Selecteer Cohortinstellingen om een deelvenster te openen met een lijst met uw cohorten, waar u ze kunt maken, bewerken, dupliceren of verwijderen.

Screenshot showing the cohort settings on the dashboard.

Selecteer Nieuw cohort boven aan het dashboard of in de cohortinstellingen om een nieuw deelvenster te openen met opties om op het volgende te filteren:

  1. Index: filtert op de positie van het gegevenspunt in de volledige gegevensset.
  2. Gegevensset: Filtert op de waarde van een bepaalde functie in de gegevensset.
  3. Voorspelde Y: Filters op basis van de voorspelling van het model.
  4. True Y: Filtert op de werkelijke waarde van de doelfunctie.
  5. Fout (regressie): filters op fout (of classificatieresultaat (classificatie): filters op type en nauwkeurigheid van classificatie).
  6. Categorische waarden: Filter op een lijst met waarden die moeten worden opgenomen.
  7. Numerieke waarden: Filter op een Booleaanse bewerking boven de waarden (selecteer bijvoorbeeld gegevenspunten waarbij leeftijd 64 is < ).

Screenshot of making multiple new cohorts.

U kunt het nieuwe cohort van de gegevensset een naam geven, filter toevoegen selecteren om elk filter toe te voegen dat u wilt gebruiken en vervolgens een van de volgende handelingen uitvoeren:

  • Selecteer Opslaan om het nieuwe cohort op te slaan in uw cohortlijst.
  • Selecteer Opslaan en overschakelen om het globale cohort van het dashboard op te slaan en onmiddellijk over te schakelen naar het zojuist gemaakte cohort.

Screenshot of making a new cohort in the dashboard.

Selecteer Dashboardconfiguratie om een deelvenster te openen met een lijst met de onderdelen die u hebt geconfigureerd op uw dashboard. U kunt onderdelen op uw dashboard verbergen door het prullenbakpictogram te selecteren, zoals wordt weergegeven in de volgende afbeelding:

Screenshot showing the dashboard configuration.

U kunt onderdelen weer toevoegen aan uw dashboard via het blauwe cirkelvormige plusteken (+) in de scheidingslijn tussen elk onderdeel, zoals wordt weergegeven in de volgende afbeelding:

Screenshot of adding a component to the dashboard.

Foutenanalyse

In de volgende secties wordt beschreven hoe u foutstructuurkaarten en heatmaps interpreteert en gebruikt.

Structuurkaart van fout

Het eerste deelvenster van het onderdeel voor foutanalyse is een structuurkaart, die laat zien hoe modelfouten worden verdeeld over verschillende cohorten met een structuurvisualisatie. Selecteer een knooppunt om het voorspellingspad op uw functies te zien waar een fout is gevonden.

Screenshot of the dashboard showing an error analysis on the tree map pane.

  1. Heatmapweergave: Schakelt over naar heatmapvisualisatie van foutdistributie.
  2. Functielijst: Hiermee kunt u de functies wijzigen die in de heatmap worden gebruikt met behulp van een zijpaneel.
  3. Foutdekking: geeft het percentage weer van alle fouten in de gegevensset die is geconcentreerd in het geselecteerde knooppunt.
  4. Fout (regressie) of foutpercentage (classificatie): geeft de fout of het percentage fouten van alle gegevenspunten in het geselecteerde knooppunt weer.
  5. Knooppunt: Vertegenwoordigt een cohort van de gegevensset, mogelijk met toegepaste filters en het aantal fouten uit het totale aantal gegevenspunten in het cohort.
  6. Opvullijn: Visualiseert de verdeling van gegevenspunten in onderliggende cohorten op basis van filters, met het aantal gegevenspunten dat wordt weergegeven via lijndikte.
  7. Selectiegegevens: Bevat informatie over het geselecteerde knooppunt in een zijpaneel.
  8. Opslaan als een nieuw cohort: hiermee maakt u een nieuw cohort met de opgegeven filters.
  9. Exemplaren in het basiscohort: geeft het totale aantal punten in de volledige gegevensset weer en het aantal correct en onjuist voorspelde punten.
  10. Exemplaren in het geselecteerde cohort: geeft het totale aantal punten in het geselecteerde knooppunt weer en het aantal correct en onjuist voorspelde punten.
  11. Voorspellingspad (filters): geeft een lijst weer van de filters die worden geplaatst over de volledige gegevensset om dit kleinere cohort te maken.

Selecteer de knop Lijst met functies om een zijpaneel te openen, waaruit u de foutstructuur opnieuw kunt trainen voor specifieke functies.

Screenshot of the dashboard side panel, which lists selectable features of an error analysis tree map.

  1. Zoekfuncties: Hiermee kunt u specifieke functies vinden in de gegevensset.
  2. Functies: Geeft de naam van de functie in de gegevensset weer.
  3. Urgenties: Een richtlijn voor de relatie tussen de functie en de fout. Berekend via de score voor wederzijdse informatie tussen de functie en de fout op de labels. U kunt deze score gebruiken om te bepalen welke functies u wilt kiezen in de foutanalyse.
  4. Vinkje: Hiermee kunt u de functie toevoegen aan of verwijderen uit de structuurkaart.
  5. Maximale diepte: De maximale diepte van de surrogaatboom die is getraind op fouten.
  6. Aantal bladeren: het aantal bladeren van de surrogaatboom die is getraind op fouten.
  7. Minimaal aantal steekproeven in één blad: de minimale hoeveelheid gegevens die nodig is om één blad te maken.

Fout heatmap

Selecteer het tabblad Heatmap om over te schakelen naar een andere weergave van de fout in de gegevensset. U kunt een of meer heatmapcellen selecteren en nieuwe cohorten maken. U kunt maximaal twee functies kiezen om een heatmap te maken.

Screenshot of the dashboard, showing an error analysis heat map and list of features to compare.

  1. Cellen: Geeft het aantal geselecteerde cellen weer.
  2. Foutdekking: geeft het percentage van alle fouten weer die zijn geconcentreerd in de geselecteerde cel(en).
  3. Foutpercentage: geeft het percentage fouten van alle gegevenspunten in de geselecteerde cel(en) weer.
  4. Asfuncties: Hiermee selecteert u het snijpunt van functies die u wilt weergeven in de heatmap.
  5. Cellen: Vertegenwoordigt een cohort van de gegevensset, waarbij filters zijn toegepast en het percentage fouten uit het totale aantal gegevenspunten in het cohort. Een blauwe omtrek geeft geselecteerde cellen aan en de duisternis van rood vertegenwoordigt de concentratie van storingen.
  6. Voorspellingspad (filters): geeft een lijst weer van de filters die worden geplaatst over de volledige gegevensset voor elk geselecteerd cohort.

Overzicht van modellen en metrische gegevens voor redelijkheid

Het onderdeel overzicht van het model biedt een uitgebreide set metrische gegevens over prestaties en redelijkheid voor het evalueren van uw model, samen met belangrijke metrische gegevens over de prestaties die verschillen tussen de prestaties en de opgegeven functies en cohorten van gegevenssets.

Cohorten van gegevenssets

In het deelvenster Cohorten van gegevenssets kunt u uw model onderzoeken door de modelprestaties van verschillende door de gebruiker opgegeven cohorten van gegevenssets te vergelijken (toegankelijk via het pictogram Cohortinstellingen in de rechterbovenhoek van het dashboard).

Screenshot of the 'Model overview' pane, showing the 'Dataset cohorts' tab.

  1. Help me metrische gegevens te kiezen: selecteer dit pictogram om een deelvenster te openen met meer informatie over welke metrische gegevens voor modelprestaties beschikbaar zijn om in de tabel te worden weergegeven. U kunt eenvoudig aanpassen welke metrische gegevens u wilt weergeven met behulp van de vervolgkeuzelijst met meerdere selecties om metrische prestatiegegevens te selecteren en deselecteren.
  2. Heatmap weergeven: In- en uitschakelen om heatmapvisualisatie in de tabel weer te geven of te verbergen. De kleurovergang van de heatmap komt overeen met het bereik dat is genormaliseerd tussen de laagste waarde en de hoogste waarde in elke kolom.
  3. Tabel met metrische gegevens voor elk cohort van de gegevensset: kolommen van gegevenssetcohorten weergeven, de steekproefgrootte van elk cohort en de geselecteerde metrische gegevens over modelprestaties voor elk cohort.
  4. Staafdiagram waarin afzonderlijke metrische gegevens worden gevisualiseerd: Weergave betekent absolute fout in de cohorten voor eenvoudige vergelijking.
  5. Kies metrische waarde (x-as):selecteer deze knop om te kiezen welke metrische gegevens u wilt weergeven in het staafdiagram.
  6. Kies cohorten (y-as): selecteer deze knop om te kiezen welke cohorten u wilt weergeven in het staafdiagram. Functiecohortselectie kan worden uitgeschakeld, tenzij u eerst de gewenste functies opgeeft op het tabblad Functiecohort van het onderdeel.

Selecteer Help bij het kiezen van metrische gegevens om een deelvenster te openen met een lijst met metrische gegevens over modelprestaties en de bijbehorende definities, zodat u de juiste metrische gegevens kunt selecteren om weer te geven.

Machine learning-scenario Metrische gegevens voor
Regressie Gemiddelde absolute fout, gemiddelde kwadratische fout, R-kwadraat, gemiddelde voorspelling.
Classificatie Nauwkeurigheid, precisie, relevante overeenkomsten, F1-score, fout-positieve snelheid, fout-negatieve rente, selectiefrequentie.

Functiecohorten

In het deelvenster Functiecohorten kunt u uw model onderzoeken door modelprestaties te vergelijken met door de gebruiker opgegeven gevoelige en niet-gevoelige functies (bijvoorbeeld prestaties voor verschillende cohorten op geslacht, ras en inkomensniveau).

Screenshot of the dashboard 'Model overview' pane, showing the 'Feature cohorts' tab.

  1. Help mij metrische gegevens te kiezen: selecteer dit pictogram om een deelvenster te openen met meer informatie over welke metrische gegevens beschikbaar zijn om in de tabel te worden weergegeven. U kunt eenvoudig aanpassen welke metrische gegevens u wilt weergeven met behulp van de vervolgkeuzelijst met meerdere selecties om metrische prestatiegegevens te selecteren en deselecteren.

  2. Help me functies te kiezen: selecteer dit pictogram om een deelvenster te openen met meer informatie over welke functies beschikbaar zijn om te worden weergegeven in de tabel, met descriptors van elke functie en hun binning-mogelijkheid (zie hieronder). U kunt eenvoudig aanpassen welke functies u wilt weergeven met behulp van de vervolgkeuzelijst met meerdere selecties om ze te selecteren en de selectie ervan op te heffen.

    Screenshot of the dashboard 'Model overview' pane, showing how to choose features.

  3. Heatmap weergeven: In- en uitschakelen om een heatmapvisualisatie weer te geven. De kleurovergang van de heatmap komt overeen met het bereik dat is genormaliseerd tussen de laagste waarde en de hoogste waarde in elke kolom.

  4. Tabel met metrische gegevens voor elk functiecohort: een tabel met kolommen voor functiecohorten (subcohort van uw geselecteerde functie), steekproefgrootte van elk cohort en de geselecteerde metrische gegevens voor modelprestaties voor elk functiecohort.

  5. Fairness metrics/disparity metrics: een tabel die overeenkomt met de tabel met metrische gegevens en toont het maximale verschil of de maximale verhouding in prestatiescores tussen twee functiecohorten.

  6. Staafdiagram waarin afzonderlijke metrische gegevens worden gevisualiseerd: Weergave betekent absolute fout in de cohorten voor eenvoudige vergelijking.

  7. Kies cohorten (y-as): selecteer deze knop om te kiezen welke cohorten u wilt weergeven in het staafdiagram.

    Als u Cohorten kiezen selecteert, wordt een deelvenster geopend met een optie om een vergelijking weer te geven van geselecteerde gegevensset cohorten of functiecohorten, afhankelijk van wat u selecteert in de vervolgkeuzelijst met meerdere selecties eronder. Selecteer Bevestigen om de wijzigingen op te slaan in de staafdiagramweergave.

    Screenshot of the dashboard 'Model overview' pane, showing how to choose cohorts.

  8. Kies metrische waarde (x-as):selecteer deze knop om te kiezen welke metrische waarde u wilt weergeven in het staafdiagram.

Gegevensanalyse

Met het onderdeel gegevensanalyse ziet u in het deelvenster Tabelweergave een tabelweergave van uw gegevensset voor alle functies en rijen.

In het deelvenster Grafiekweergave ziet u aggregaties en afzonderlijke diagrammen van gegevenspunten. U kunt gegevensstatistieken langs de x-as en y-as analyseren met behulp van filters zoals voorspeld resultaat, gegevenssetfuncties en foutgroepen. Deze weergave helpt u inzicht te hebben in oververtegenwoordigdheid en ondervertegenwoordigdheid in uw gegevensset.

Screenshot of the dashboard, showing the data analysis.

  1. Selecteer een cohort van een gegevensset om te verkennen: geef op voor welke gegevensset u gegevensstatistieken wilt weergeven in de lijst met cohorten waarvoor u gegevensstatistieken wilt weergeven.

  2. X-as: Geeft het type waarde weer dat horizontaal wordt weergegeven. Wijzig de waarden door de knop te selecteren om een zijpaneel te openen.

  3. Y-as: Geeft het type waarde weer dat verticaal wordt weergegeven. Wijzig de waarden door de knop te selecteren om een zijpaneel te openen.

  4. Grafiektype: Hiermee geeft u het grafiektype op. Kies tussen aggregaties (staafdiagrammen) of afzonderlijke gegevenspunten (spreidingsplot).

    Door de optie Afzonderlijke gegevenspunten onder Grafiektype te selecteren, kunt u overschakelen naar een niet-samengevoegde weergave van de gegevens met de beschikbaarheid van een kleuras.

Screenshot of the dashboard, showing the data analysis with the 'Individual data points' option selected.

Functiebelangen (modeluitleg)

Met behulp van het onderdeel modeluitleg kunt u zien welke functies het belangrijkst waren in de voorspellingen van uw model. U kunt bekijken welke functies van invloed zijn op de voorspelling van uw model in het deelvenster Urgentie van statistische functies of het weergeven van de urgentie van functies voor afzonderlijke gegevenspunten in het deelvenster Prioriteit van afzonderlijke functies.

Belangrijke functies aggregeren (globale uitleg)

Screenshot of the dashboard, showing aggregate feature importances on the 'Feature importances' pane.

  1. Top k-functies: bevat de belangrijkste globale functies voor een voorspelling en stelt u in staat om deze te wijzigen met behulp van een schuifregelaar.

  2. Het belang van een statistische functie: visualiseert het gewicht van elke functie bij het beïnvloeden van modelbeslissingen voor alle voorspellingen.

  3. Sorteren op: Hiermee kunt u selecteren op welk cohort de urgentiegrafiek van de statistische functie moet worden gesorteerd.

  4. Grafiektype: Hiermee kunt u kiezen tussen een staafdiagramweergave van gemiddelde urgenties voor elke functie en een boxplot met urgenties voor alle gegevens.

    Wanneer u een van de functies in het staafdiagram selecteert, wordt de afhankelijkheidsplot gevuld, zoals wordt weergegeven in de volgende afbeelding. In het afhankelijkheidsplot ziet u de relatie tussen de waarden van een functie en de bijbehorende waarde voor functiebelang, die van invloed zijn op de voorspelling van het model.

    Screenshot of the dashboard, showing a populated dependence plot on the 'Aggregate feature importances' pane.

  5. Functiebelang van [functie] (regressie) of functiebelang van [functie] op [voorspelde klasse] (classificatie): hiermee wordt het belang van een bepaalde functie in de voorspellingen uitgezet. Voor regressiescenario's zijn de urgentiewaarden in termen van de uitvoer, dus positief kenmerkbelang betekent dat het positief heeft bijgedragen aan de uitvoer. Het tegenovergestelde is van toepassing op het belang van negatieve functies. Voor classificatiescenario's betekenen positieve functiebelangen dat de functiewaarde bijdraagt aan de voorspelde klasse die wordt aangegeven in de titel van de y-as. Negatieve functiebelang betekent dat deze bijdraagt aan de voorspelde klasse.

  6. Bekijk de afhankelijkheidsplot voor: Selecteert de functie waarvan u de urgenties wilt uitzetten.

  7. Selecteer een cohort van een gegevensset: selecteert het cohort waarvan u de urgenties wilt uitzetten.

Belang van afzonderlijke functies (lokale uitleg)

In de volgende afbeelding ziet u hoe functies van invloed zijn op de voorspellingen die zijn gedaan op specifieke gegevenspunten. U kunt maximaal vijf gegevenspunten kiezen om de urgentie van functies te vergelijken.

Screenshot of the dashboard, showing the 'Individual feature importances' pane.

Puntselectietabel: bekijk uw gegevenspunten en selecteer maximaal vijf punten om weer te geven in de functiebelangplot of de ICE-plot onder de tabel.

Screenshot of the dashboard, showing a bar plot on the 'Individual feature importances' pane.

Belangrijke tekenfunctie: een staafdiagram van het belang van elke functie voor de voorspelling van het model op de geselecteerde gegevenspunten.

  1. Top k-functies: hiermee kunt u het aantal functies opgeven waarvoor u urgenties wilt weergeven met behulp van een schuifregelaar.
  2. Sorteren op: Hiermee kunt u het punt selecteren (van de punten die hierboven zijn gecontroleerd) waarvan de urgenties van functies in aflopende volgorde worden weergegeven in de grafiek met het belang van de functie.
  3. Absolute waarden weergeven: schakel deze optie in om het staafdiagram te sorteren op de absolute waarden. Hierdoor kunt u de meest impactvolle functies zien, ongeacht hun positieve of negatieve richting.
  4. Staafdiagram: Geeft het belang weer van elke functie in de gegevensset voor de modelvoorspelling van de geselecteerde gegevenspunten.

Afzonderlijke voorwaardelijke verwachting (ICE): schakelt over naar de ICE-plot, waarin modelvoorspellingen worden weergegeven voor een bereik van waarden van een bepaalde functie.

Screenshot of the dashboard, showing an ICE plot on the 'Individual feature importances' pane.

  • Min (numerieke kenmerken): hiermee geeft u de ondergrens op van het bereik van voorspellingen in de ICE-plot.
  • Max (numerieke kenmerken): Hiermee geeft u de bovengrens van het bereik van voorspellingen in de ICE-plot.
  • Stappen (numerieke functies): hiermee geeft u het aantal punten op om voorspellingen voor binnen het interval weer te geven.
  • Functiewaarden (categorische functies): hiermee geeft u op voor welke categorische functiewaarden voorspellingen moeten worden weergegeven.
  • Functie: Hiermee geeft u de functie op waarvoor u voorspellingen moet doen.

Contrafactuele what-if

Contrafactuele analyse biedt een diverse set wat-als-voorbeelden die worden gegenereerd door het wijzigen van de waarden van functies minimaal om de gewenste voorspellingsklasse (classificatie) of het gewenste bereik (regressie) te produceren.

Screenshot of the dashboard, showing counterfactuals.

  1. Puntselectie: Hiermee selecteert u het punt om een contrafactueel item te maken en weer te geven in de grafiek met de bovenste classificatiefuncties eronder.

    Screenshot of the dashboard, showing a top ranked features plot.

    Meest gerangschikte functiesplot: Geeft, in aflopende volgorde van gemiddelde frequentie, de functies te verstoren om een diverse set contrafactuals van de gewenste klasse te maken. U moet ten minste 10 verschillende contrafactuals per gegevenspunt genereren om deze grafiek in te schakelen, omdat er een gebrek aan nauwkeurigheid is met een kleiner aantal contrafactuals.

  2. Geselecteerd gegevenspunt: hiermee wordt dezelfde actie uitgevoerd als de puntselectie in de tabel, behalve in een vervolgkeuzelijst.

  3. Gewenste klasse voor counterfactual(s): hiermee geeft u de klasse of het bereik op waarvoor contrafactuals moeten worden gegenereerd.

  4. What-if contrafactual maken: hiermee opent u een deelvenster voor het maken van een contrafactueel wat-als-gegevenspunt.

    Selecteer de knop Wat-als-items maken om een volledig venstervenster te openen.

    Screenshot of the dashboard, showing what-if counterfactuals.

  5. Zoekfuncties: hiermee vindt u functies om waarden te bekijken en te wijzigen.

  6. Sorteer contrafactueel op gerangschikte functies: sorteert contrafactuele voorbeelden in volgorde van verstoringseffect. (Zie ookMeest gerangschikte functies plot, eerder besproken.)

  7. Contrafactuele voorbeelden: een lijst met functiewaarden van voorbeeldtellers met de gewenste klasse of het gewenste bereik. De eerste rij is het oorspronkelijke referentiegegevenspunt. Selecteer Waarde instellen om alle waarden van uw eigen contrafactuele gegevenspunt in de onderste rij in te stellen met de waarden van het vooraf gegenereerde contrafactuele voorbeeld.

  8. Voorspelde waarde of klasse: geeft een lijst weer van de modelvoorspelling van de klasse van een contrafactual op basis van deze gewijzigde functies.

  9. Maak uw eigen contrafactual: hiermee kunt u uw eigen functies verstoren om de contrafactual te wijzigen. Functies die zijn gewijzigd van de oorspronkelijke functiewaarde, worden aangegeven door de titel vetgedrukt (bijvoorbeeld werkgever en programmeertaal). Selecteer Voorspellingsverschillen weergeven om het verschil in de nieuwe voorspellingswaarde van het oorspronkelijke gegevenspunt weer te geven.

  10. Wat-als-contrafactuele naam: Hiermee kunt u de contrafactueel unieke naam geven.

  11. Opslaan als nieuw gegevenspunt: slaat het contrafactueel op dat u hebt gemaakt.

Causale analyse

In de volgende secties wordt beschreven hoe u de causale analyse voor uw gegevensset kunt lezen over bepaalde door de gebruiker opgegeven behandelingen.

Causale effecten aggregeren

Selecteer het tabblad Causale effecten aggregeren van het causale analyseonderdeel om de gemiddelde causale effecten voor vooraf gedefinieerde behandelfuncties weer te geven (de functies die u wilt behandelen om uw resultaat te optimaliseren).

Notitie

Globale cohortfunctionaliteit wordt niet ondersteund voor het causale analyseonderdeel.

Screenshot of the dashboard, showing causal analysis on the 'Aggregate causal effects' pane.

  1. Directe tabel met causaal effect: geeft het causale effect weer van elke functie die is samengevoegd op de volledige gegevensset en de bijbehorende betrouwbaarheidsstatistieken.

    • Continue behandelingen: Gemiddeld zal het verhogen van deze functie met één eenheid ertoe leiden dat de waarschijnlijkheid van klasse toeneemt met X-eenheden, waarbij X het causale effect is.
    • Binaire behandelingen: Gemiddeld in dit voorbeeld zorgt het inschakelen van deze functie ervoor dat de waarschijnlijkheid van klasse toeneemt met X-eenheden, waarbij X het oorzakelijke effect is.
  2. Direct aggregate causal effect whisker plot: visualiseert de causale effecten en betrouwbaarheidsintervallen van de punten in de tabel.

Individuele causale effecten en causale what-if

Als u een gedetailleerd overzicht wilt krijgen van causale effecten op een afzonderlijk gegevenspunt, schakelt u over naar het afzonderlijke causale what-if-tabblad .

Screenshot of the dashboard showing causal analysis on the individual causal what-if tab.

  1. X-as: Hiermee selecteert u de functie die u wilt uitzetten op de x-as.
  2. Y-as: Hiermee selecteert u de functie die u wilt uitzetten op de y-as.
  3. Afzonderlijk causaal spreidingsplot: visualiseert punten in de tabel als een spreidingsplot om gegevenspunten te selecteren voor het analyseren van causale wat-als en het bekijken van de afzonderlijke causale effecten eronder.
  4. Nieuwe behandelingswaarde instellen:
    • (numeriek): toont een schuifregelaar om de waarde van de numerieke functie te wijzigen als een echte interventie.
    • (categorisch): Toont een vervolgkeuzelijst om de waarde van de categorische functie te selecteren.

Behandelingsbeleid

Selecteer het tabblad Behandelingsbeleid om over te schakelen naar een weergave om te helpen bij het bepalen van echte interventies en het weergeven van behandelingen die moeten worden toegepast om een bepaald resultaat te bereiken.

Screenshot of the dashboard, showing causal analysis on the 'Treatment policy' pane.

  1. Behandelfunctie instellen: Selecteert een functie die u wilt wijzigen als een echte interventie.

  2. Aanbevolen globaal behandelingsbeleid: geeft aanbevolen interventies weer voor gegevenscohorten om de doelfunctiewaarde te verbeteren. De tabel kan van links naar rechts worden gelezen, waarbij de segmentatie van de gegevensset eerst in rijen en vervolgens in kolommen staat. Voor bijvoorbeeld 658 personen waarvan de werkgever geen Snapchat is en waarvan de programmeertaal niet JavaScript is, is het aanbevolen behandelbeleid om het aantal GitHub-opslagplaatsen te verhogen waaraan is bijgedragen.

    Gemiddelde winsten van alternatief beleid ten opzichte van het altijd toepassen van een behandeling: zet de doelfunctiewaarde in een staafdiagram van de gemiddelde winst in uw resultaat voor het bovenstaande aanbevolen behandelingsbeleid versus het altijd toepassen van een behandeling.

    Screenshot of the dashboard showing a bar chart of the average gains of alternative policies over always applying treatment on the treatment policy tab.

    Aanbevolen individueel behandelingsbeleid:

    Screenshot of the dashboard showing a recommended individual treatment policy table on the treatment policy tab.

  3. Top k-gegevenspuntmonsters weergeven die zijn gerangschikt op causale effecten voor aanbevolen behandelingsfuncties: Selecteert het aantal gegevenspunten dat in de tabel moet worden weergegeven.

  4. Aanbevolen tabel voor individueel behandelingsbeleid: Lijsten, in aflopende volgorde van causaal effect, de gegevenspunten waarvan de doelfuncties het meest zouden worden verbeterd door een interventie.

Volgende stappen