Delen via


Tabelparameters aantal wijzigen

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Wijzigt de parameters die worden gebruikt om functies te maken op basis van tellingen

Categorie: Learning met tellingen

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Modify Count Table Parameters in Machine Learning Studio (klassiek) gebruikt om de manier te wijzigen waarop functies worden gegenereerd op basis van een count-tabel.

Als u functies op basis van tellingen wilt maken, gebruikt u Build Count Transform om een gegevensset te verwerken en een teltabel te maken. Op basis van die tellingstabel genereert u een nieuwe set functies.

Als u echter al een count-tabel hebt gemaakt, kunt u de module Modify Count Table Parameters gebruiken om de definitie te bewerken van hoe de count-gegevens worden verwerkt. Hiermee kunt u een andere set statistieken op basis van tellingen maken op basis van de bestaande gegevens, zonder dat u de gegevensset opnieuw moet analyseren.

Parameters voor aantal wijzigen configureren

  1. Zoek de transformatie die u wilt wijzigen in de groep Transformaties en voeg deze toe aan uw experiment.

    U moet eerder een experiment hebben uitgevoerd dat een teltransformatie heeft gemaakt.

    • Een opgeslagen transformatie wijzigen: zoek de transformatie in de groep Transformaties en voeg deze toe aan uw experiment.

    • Een teltransformatie wijzigen die in hetzelfde experiment is gemaakt: als de transformatie niet is opgeslagen, maar beschikbaar is als uitvoer in het huidige experiment (bijvoorbeeld de uitvoer van de module Build Count Transform controleren), kunt u deze rechtstreeks gebruiken door de modules te verbinden.

  2. Voeg de module Parameters voor aantal tabel wijzigen toe en verbind de transformatie als invoer.

  3. Typ in het deelvenster Eigenschappen van de module Parameters voor aantal tabel wijzigen een waarde die moet worden gebruikt als de drempelwaarde voor de binGaraanse waarde.

    Deze waarde geeft het minimale aantal exemplaren aan dat voor elke functiewaarde moet worden gevonden om tellingen te kunnen gebruiken. Als de frequentie van de waarde lager is dan de drempelwaarde voor de prullenbak, wordt het waardelabelpaar niet geteld als een afzonderlijk item; In plaats daarvan worden alle items met tellingen lager dan de drempelwaarde in één 'garbage bin' geplaatst.

    Als u een kleine gegevensset gebruikt en u dezelfde gegevens telt en traint, is een goede beginwaarde 1.

  4. Voor aanvullende eerdere pseudovoorbeelden typt u een getal dat het aantal extra pseudovoorbeelden aangeeft dat moet worden op te nemen. U hoeft deze voorbeelden niet op te geven; de pseudovoorbeelden worden gegenereerd op basis van de eerdere distributie.

  5. Voor de schaal van Lapian-ruis typt u een positieve drijvende-puntwaarde die de schaal vertegenwoordigt die wordt gebruikt voor het introduceren van ruis die is genomen van een Lapianische distributie. Wanneer u een schaalwaarde in stelt, wordt een aanvaardbaar ruisniveau opgenomen in het model, zodat het model minder waarschijnlijk wordt beïnvloed door niet-beveiligde waarden in gegevens.

  6. Kies in Uitvoerfuncties opnemen de methode die moet worden gebruikt bij het maken van functies op basis van tellingen voor opname in de transformatie.

    • CountsOnly: maak functies met behulp van tellingen.

    • LogOddsOnly: maak functies met behulp van het logboek van de ratio.

    • BothCountsAndLogOdds: maak functies met behulp van tellingen en logboeken.

  7. Selecteer de optie Kolom negeren uit als u de vlag in de uitvoer wilt overschrijven IsBackOff bij het maken van functies. Wanneer u deze optie selecteert, worden functies op basis van tellingen gemaakt, zelfs als de kolom geen significante tellingswaarden bevat.

  8. Voer het experiment uit. U kunt de uitvoer van Parameters voor tabel wijzigen vervolgens desgewenst opslaan als een nieuwe transformatie.

Voorbeelden

Zie de volgende voorbeelden van hoe deze module Azure AI Gallery:

  • Learning met tellingen: binaire classificatie: demonstreert hoe u de leermodules met tellingen gebruikt om functies te genereren op basis van kolommen met categorische waarden voor een binair classificatiemodel.

  • Learning met tellingen: classificatie met meerdere klassen met NYC-taxigegevens:voorbeeld Demonstreert hoe u de module Learning with Counts gebruikt voor het uitvoeren van classificatie met meerdere klassen op de openbaar beschikbare NYC-taxigegevensset. In het voorbeeld wordt een logistieke regressieleerder met meerdere klasses gebruikt om dit probleem te modelleren.

  • Learning counts: binaire classificatie met NYC-taxigegevens: demonstreert hoe u de leermodules met tellingen gebruikt voor het uitvoeren van binaire classificatie op de openbaar beschikbare NYC-taxigegevensset. In het voorbeeld wordt een logistieke regressieleerder met twee klassen gebruikt om dit probleem te modelleren.

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Het is statistisch veilig om dezelfde gegevensset te tellen en te trainen als u de parameter Lapian noise scale in stelt.

Verwachte invoer

Naam Type Description
Transformatie tellen ITransform-interface De toe te passen teltransformator

Moduleparameters

Naam Type Bereik Optioneel Standaard Beschrijving
Drempelwaarde voor prullenbak Float >= 0,0f Vereist 10.0f De drempelwaarde waaronder een kolomwaarde wordt gebruikt voor de prullenbak
Aanvullende eerdere pseudovoorbeelden Float >= 0,0f Vereist 42.0f De aanvullende pseudovoorbeelden na eerdere distributies die moeten worden opgenomen
Schaal van lapianische ruis Float >= 0,0f Vereist 0.0f De schaal van de Lapianische distributie van waaruit ruis wordt genomen
Uitvoerfuncties zijn onder andere OutputFeatureType Vereist BothCountsAndLogOdds De functies die moeten worden uitgevoerd
Kolom voor terug-uit-kolom negeren Booleaans Vereist onjuist Of de kolom IsBackOff in de uitvoer moet worden genegeerd

Uitvoerwaarden

Naam Type Description
Gewijzigde transformatie ITransform-interface De gewijzigde transformatie

Uitzonderingen

Uitzondering Description
Fout 0003 Uitzondering treedt op als een of meer invoer null of leeg zijn.
Fout 0086 Uitzondering treedt op wanneer een teltransformator ongeldig is.

Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).

Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.

Zie ook

Learning aantal