Wiskundige bewerking toepassen
In dit artikel wordt een onderdeel van de Azure Machine Learning-ontwerpfunctie beschreven.
Gebruik de bewerking Wiskunde toepassen om berekeningen te maken die worden toegepast op numerieke kolommen in de invoergegevensset.
Wiskundige bewerkingen omvatten rekenkundige functies, trigonometrische functies, afrondingsfuncties en speciale functies die worden gebruikt in gegevenswetenschap, zoals gamma- en foutfuncties.
Nadat u een bewerking hebt gedefinieerd en de pijplijn hebt uitgevoerd, worden de waarden toegevoegd aan uw gegevensset. Afhankelijk van hoe u het onderdeel configureert, kunt u het volgende doen:
- Voeg de resultaten toe aan uw gegevensset (handig bij het verifiëren van het resultaat van de bewerking).
- Vervang kolomwaarden door de nieuwe, berekende waarden.
- Genereer een nieuwe kolom voor resultaten en geef de oorspronkelijke gegevens niet weer.
Zoek in deze categorieën naar de bewerking die u nodig hebt:
-
De functies in de categorie Basis kunnen worden gebruikt om één waarde of kolom met waarden te bewerken. U kunt bijvoorbeeld de absolute waarde van alle getallen in een kolom ophalen of de vierkantswortel van elke waarde in een kolom berekenen.
-
De functies in de categorie Vergelijken worden allemaal gebruikt voor vergelijking: u kunt de waarden in twee kolommen koppelen of u kunt elke waarde in een kolom vergelijken met een opgegeven constante. U kunt bijvoorbeeld kolommen vergelijken om te bepalen of de waarden in twee gegevenssets hetzelfde waren. Of u kunt een constante, zoals een maximaal toegestane waarde, gebruiken om uitbijters in een numerieke kolom te achterhalen.
-
De categorie Bewerkingen bevat wiskundige basisfuncties: optellen, aftrekken, vermenigvuldigen en delen. U kunt werken met kolommen of constanten. U kunt bijvoorbeeld de waarde in kolom A toevoegen aan de waarde in kolom B. Of u kunt een constante, zoals een eerder berekend gemiddelde, aftrekken van elke waarde in kolom A.
-
De categorie Afronding omvat diverse functies voor het uitvoeren van bewerkingen zoals afronden, plafond, vloer en afkappen tot verschillende precisieniveaus. U kunt het precisieniveau voor zowel decimale als gehele getallen opgeven.
-
De categorie Speciaal bevat wiskundige functies die met name worden gebruikt in gegevenswetenschap, zoals elliptische integralen en de Gaussiaanse foutfunctie.
-
De categorie Trigonometrisch omvat alle standaard trigonometrische functies. U kunt bijvoorbeeld radialen converteren naar graden of rekenfuncties zoals tangens in radialen of graden. Deze functies zijn unair, wat betekent dat ze één kolom met waarden als invoer gebruiken, de trigonometrische functie toepassen en als resultaat een kolom met waarden retourneren. Zorg ervoor dat de invoerkolom het juiste type is en het juiste type waarden bevat voor de opgegeven bewerking.
Wiskundige bewerking toepassen configureren
Voor het onderdeel Wiskundige bewerking toepassen is een gegevensset vereist die ten minste één kolom bevat die alleen getallen bevat. De getallen kunnen afzonderlijk of doorlopend zijn, maar moeten van een numeriek gegevenstype zijn, niet van een tekenreeks.
U kunt dezelfde bewerking toepassen op meerdere numerieke kolommen, maar alle kolommen moeten zich in dezelfde gegevensset bevinden.
Elk exemplaar van dit onderdeel kan slechts één type bewerking tegelijk uitvoeren. Als u complexe wiskundige bewerkingen wilt uitvoeren, moet u mogelijk meerdere exemplaren van het onderdeel Wiskundige bewerking toepassen aan elkaar koppelen.
Voeg het onderdeel Wiskundige bewerking toepassen toe aan uw pijplijn.
Een gegevensset verbinden die ten minste één numerieke kolom bevat.
Selecteer een of meer bronkolommen waarop u de berekening wilt uitvoeren.
- Elke kolom die u kiest, moet een numeriek gegevenstype zijn.
- Het gegevensbereik moet geldig zijn voor de geselecteerde wiskundige bewerking. Anders kan er een fout of NaN -resultaat (geen getal) optreden. Ln(-1.0) is bijvoorbeeld een ongeldige bewerking en resulteert in een waarde van
NaN
.
Selecteer Categorie om het type wiskundige bewerking te selecteren dat moet worden uitgevoerd.
Kies een specifieke bewerking in de lijst in die categorie.
Stel aanvullende parameters in die vereist zijn voor elk type bewerking.
Gebruik de optie Uitvoermodus om aan te geven hoe de wiskundige bewerking moet worden gegenereerd:
- Toevoegen. Alle kolommen die als invoer worden gebruikt, worden opgenomen in de uitvoergegevensset, plus een extra kolom die de resultaten van de wiskundige bewerking bevat.
- Inplace. De waarden in de kolommen die als invoer worden gebruikt, worden vervangen door de nieuwe berekende waarden.
- ResultOnly. Er wordt één kolom geretourneerd met de resultaten van de wiskundige bewerking.
Verzend de pijplijn.
Resultaten
Als u de resultaten genereert met behulp van de opties Toevoegen of ResultOnly , geven de kolomkoppen van de geretourneerde gegevensset de bewerking en de kolommen aan die zijn gebruikt. Als u bijvoorbeeld twee kolommen vergelijkt met behulp van de operator Equals , zien de resultaten er als volgt uit:
- Is gelijk aan(Col2_Col1), waarmee wordt aangegeven dat u Col2 hebt getest op basis van Col1.
- Is gelijk aan(Col2_$10), wat aangeeft dat u kolom 2 hebt vergeleken met de constante 10.
Zelfs als u de optie Ter plaatse gebruikt, worden de brongegevens niet verwijderd of gewijzigd; de kolom in de oorspronkelijke gegevensset is nog steeds beschikbaar in de ontwerpfunctie. Als u de oorspronkelijke gegevens wilt weergeven, kunt u het onderdeel Kolommen toevoegen verbinden en koppelen aan de uitvoer van Wiskundige bewerking toepassen.
Eenvoudige wiskundige bewerkingen
De functies in de categorie Basis nemen meestal één waarde uit een kolom, voeren de vooraf gedefinieerde bewerking uit en retourneren één waarde. Voor sommige functies kunt u een constante of een kolomset opgeven als een tweede argument.
Azure Machine Learning ondersteunt de volgende functies in de categorie Basic :
Abs
Retourneert de absolute waarde van de geselecteerde kolommen.
Atan2
Retourneert een vierkwadrant inverse tangens.
Selecteer de kolommen die de puntcoördinaten bevatten. Voor het tweede argument, dat overeenkomt met de x-coördinaat, kunt u ook een constante opgeven.
Komt overeen met de functie ATAN2 in MATLAB.
Conj
Retourneert de conjugaat voor de waarden in de geselecteerde kolom.
Kubushoofdmap
Berekent de kubushoofdmap voor de waarden in de geselecteerde kolom.
DoubleFactorial
Berekent de dubbele factorial voor waarden in de geselecteerde kolom. De dubbele factorial is een uitbreiding van de normale factoriële functie en wordt aangeduid als x!!
.
Eps
Berekent de grootte van de tussenruimte tussen de huidige waarde en het eerstvolgende hoogste getal met dubbele precisie. Komt overeen met de functie EPS in MATLAB.
Exp
Retourneert e verhoogd tot de macht van de waarde in de geselecteerde kolom. Deze functie is hetzelfde als de Excel EXP-functie.
Exp2
Retourneert de exponentiële basis-2 van de argumenten, waarbij wordt opgelost voor y = x * 2t , waarbij t een kolom met waarden is die exponenten bevat.
Selecteer in Kolomset de kolom met de exponentwaarden t.
Voor Exp2 kunt u een tweede argument x opgeven, dat een constante of een andere kolom met waarden kan zijn. Geef bij Argumenttype Tweede aan of u de vermenigvuldiger x als een constante of een waarde in een kolom wilt opgeven.
Als u bijvoorbeeld een kolom selecteert met de waarden {0,1,2,3,4,5} voor zowel de vermenigvuldiger als de exponent, retourneert de functie {0, 2, 8, 24, 64 160).
ExpMinus1
Retourneert de negatieve exponent voor waarden in de geselecteerde kolom.
Faculteit
Retourneert de factorial voor waarden in de geselecteerde kolom.
Hypotenuse
Berekent de hypotenuse voor een driehoek waarin de lengte van één zijde is opgegeven als een kolom met waarden en de lengte van de tweede zijde wordt opgegeven als een constante of als twee kolommen.
Ln
Retourneert de natuurlijke logaritme voor de waarden in de geselecteerde kolom.
LnPlus1
Retourneert de natuurlijke logaritme plus één voor de waarden in de geselecteerde kolom.
Logboek
Retourneert het logboek van de waarden in de geselecteerde kolom, op basis van de opgegeven basis.
U kunt de basis (het tweede argument) opgeven als een constante of door een andere kolom met waarden te selecteren.
Log10
Retourneert de basis-10-logaritme-waarden voor de geselecteerde kolom.
Logboek2
Retourneert de base 2-logaritme waarden voor de geselecteerde kolom.
NthRoot
Retourneert de nde hoofdmap van de waarde, met behulp van een n die u opgeeft.
Selecteer de kolommen waarvoor u de hoofdmap wilt berekenen met behulp van de optie ColumnSet .
Selecteer in Tweede argumenttype een andere kolom die de hoofdmap bevat of geef een constante op die als hoofdmap moet worden gebruikt.
Als het tweede argument een kolom is, wordt elke waarde in de kolom gebruikt als de waarde van n voor de bijbehorende rij. Als het tweede argument een constante is, typt u de waarde voor n in het tekstvak Tweede argument .
Pow
Berekent X tot de macht van Y voor elk van de waarden in de geselecteerde kolom.
Selecteer eerst de kolommen die de basis bevatten, wat een float moet zijn, met behulp van de optie ColumnSet .
Selecteer in Tweede argumenttype de kolom die de exponent bevat of geef een constante op die als exponent moet worden gebruikt.
Als het tweede argument een kolom is, wordt elke waarde in de kolom gebruikt als exponent voor de bijbehorende rij. Als het tweede argument een constante is, typt u de waarde voor de exponent in het tekstvak Tweede argument .
Sqrt
Retourneert de vierkantswortel van de waarden in de geselecteerde kolom.
SqrtPi
Voor elke waarde in de geselecteerde kolom wordt de waarde vermenigvuldigd met pi en wordt vervolgens de vierkantswortel van het resultaat geretourneerd.
Square
Hiermee kunt u de waarden in de geselecteerde kolom kwadrateren.
Vergelijkingsbewerkingen
Gebruik de vergelijkingsfuncties in Azure Machine Learning Designer op elk moment dat u twee sets waarden tegen elkaar wilt testen. In een pijplijn moet u bijvoorbeeld deze vergelijkingsbewerkingen uitvoeren:
- Evalueer een kolom met het model voor waarschijnlijkheidsscores op basis van een drempelwaarde.
- Bepaal of twee sets met resultaten hetzelfde zijn. Voeg voor elke rij die anders is een vlag ONWAAR toe die kan worden gebruikt voor verdere verwerking of filtering.
Gelijk aan
Retourneert Waar als de waarden hetzelfde zijn.
GreaterThan
Retourneert Waar als de waarden in de kolomset groter zijn dan de opgegeven constante of groter zijn dan de bijbehorende waarden in de vergelijkingskolom.
GreaterThanOrEqualTo
Retourneert Waar als de waarden in de kolomset groter dan of gelijk zijn aan de opgegeven constante, of groter dan of gelijk aan de overeenkomende waarden in de vergelijkingskolom.
LessThan
Retourneert Waar als de waarden in de kolomset kleiner zijn dan de opgegeven constante of kleiner zijn dan de overeenkomende waarden in de vergelijkingskolom.
LessThanOrEqualTo
Retourneert Waar als de waarden in de kolomset kleiner zijn dan of gelijk zijn aan de opgegeven constante, of kleiner dan of gelijk aan de overeenkomende waarden in de vergelijkingskolom.
NotEqualTo
Retourneert Waar als de waarden in kolomset niet gelijk zijn aan de constante of vergelijkingskolom en retourneert Onwaar als ze gelijk zijn.
PairMax
Retourneert de waarde die groter is: de waarde in kolomset of de waarde in de constante- of vergelijkingskolom.
PairMin
Retourneert de waarde die kleiner is: de waarde in kolomset of de waarde in de constante- of vergelijkingskolom
Rekenkundige bewerkingen
Bevat de basis rekenkundige bewerkingen: optellen en aftrekken, delen en vermenigvuldigen. Omdat de meeste bewerkingen binair zijn, waarvoor twee getallen zijn vereist, kiest u eerst de bewerking en kiest u vervolgens de kolom of getallen die u wilt gebruiken in het eerste en tweede argument.
De volgorde voor deling en aftrekking zijn als volgt:
- Aftrekken(Arg1_Arg2) = Arg1 - Arg 2
- Delen(Arg1_Arg2) = Arg1 / Arg 2
In de volgende tabel ziet u enkele voorbeelden
Bewerking | Getal1 | Getal2 | Resultaatkolom | Resultaatwaarde |
---|---|---|---|---|
Optellen | 1 | 5 | Toevoegen(Num2_Num1) | 6 |
Vermenigvuldigen | 1 | 5 | Meerdere (Num2_Num1) | 5 |
Aftrekking | 5 | 1 | Aftrekken(Num2_Num1) | 4 |
Aftrekking | 0 | 1 | Aftrekken(Num2_Num1) | -1 |
Afdeling | 5 | 1 | Delen(Num2_Num1) | 5 |
Afdeling | 1 | 0 | Delen(Num2_Num1) | Oneindig |
Toevoegen
Geef de bronkolommen op met behulp van kolomset en voeg vervolgens aan deze waarden een getal toe dat is opgegeven in het argument Tweede.
Als u de waarden in twee kolommen wilt toevoegen, kiest u een kolom of kolommen met behulp van kolomset en kiest u vervolgens een tweede kolom met het argument Tweede.
Delen
Verdeelt de waarden in Kolomset door een constante of door de kolomwaarden die zijn gedefinieerd in het tweede argument. Met andere woorden, u kiest eerst de deler en vervolgens het dividend. De uitvoerwaarde is het quotiënt.
Vermenigvuldigen
Vermenigvuldigt de waarden in Kolom ingesteld met de opgegeven constante of kolomwaarden.
Aftrekken
Geef de kolom met waarden op waarop u wilt werken (de minuend) door een andere kolom te kiezen met behulp van de optie Kolomset . Geef vervolgens het getal op dat u wilt aftrekken (de aftrekking) met behulp van de vervolgkeuzelijst Tweede argument . U kunt een constante of kolom met waarden kiezen.
Afrondingsbewerkingen
Azure Machine Learning Designer ondersteunt diverse afrondingsbewerkingen. Voor veel bewerkingen moet u de hoeveelheid precisie opgeven die moet worden gebruikt bij het afronden. U kunt een statisch precisieniveau gebruiken, opgegeven als een constante, of u kunt een dynamische precisiewaarde toepassen die is verkregen uit een kolom met waarden.
Als u een constante gebruikt, stelt u Precisietype in op Constant en typt u het aantal cijfers als geheel getal in het tekstvak Constante precisie . Als u een niet-geheel getal typt, genereert het onderdeel geen fout, maar kunnen de resultaten onverwacht zijn.
Als u een andere precisiewaarde wilt gebruiken voor elke rij in uw gegevensset, stelt u Precisietype in op ColumnSet en kiest u vervolgens de kolom die de juiste precisiewaarden bevat.
Ceiling
Retourneert het maximum voor de waarden in de kolomset.
CeilingPower2
Retourneert het kwadratische plafond voor de waarden in kolomset.
Floor
Retourneert de basis voor de waarden in kolomset, met de opgegeven precisie.
Mod
Retourneert het breukgedeelte van de waarden in de kolomset, met de opgegeven precisie.
Quotiënt
Retourneert het breukgedeelte van de waarden in de kolomset, met de opgegeven precisie.
Rest
Retourneert de rest voor de waarden in de kolomset.
RoundDigits
Retourneert de waarden in kolomset, afgerond met de 4/5-regel op het opgegeven aantal cijfers.
RoundDown
Retourneert de waarden in kolomset, afgerond op het opgegeven aantal cijfers.
RoundUp
Retourneert de waarden in kolomset, afgerond op het opgegeven aantal cijfers.
ToEven
Retourneert de waarden in kolomset, afgerond op het dichtstbijzijnde gehele, even getal.
ToOdd
Retourneert de waarden in kolomset, afgerond op het dichtstbijzijnde gehele, oneven getal.
Truncate
De waarden in kolomset worden afgekapt door alle cijfers te verwijderen die niet door de opgegeven precisie zijn toegestaan.
Speciale wiskundige functies
Deze categorie bevat gespecialiseerde wiskundige functies die vaak worden gebruikt in gegevenswetenschap. Tenzij anders vermeld, is de functie unair en retourneert de opgegeven berekening voor elke waarde in de geselecteerde kolom of kolommen.
Bèta
Geeft als resultaat de waarde van de bètafunctie van Euler.
EllipticIntegralE
Retourneert de waarde van de onvolledige elliptische integraal.
EllipticIntegralK
Geeft als resultaat de waarde van de volledige elliptische integraal (K).
Evf
Retourneert de waarde van de foutfunctie.
De foutfunctie (ook wel de Gauss-foutfunctie genoemd) is een speciale functie van de sigmoïdevorm die in kans wordt gebruikt om diffusie te beschrijven.
Erfc
Retourneert de waarde van de aanvullende foutfunctie.
Erfc
wordt gedefinieerd als 1 – erf(x).
ErfScaled
Retourneert de waarde van de geschaalde foutfunctie.
De geschaalde versie van de foutfunctie kan worden gebruikt om rekenkundige onderstroom te voorkomen.
ErfInverse
Retourneert de waarde van de inverse erf
functie.
ExponentialIntegralEin
Geeft als resultaat de waarde van de exponentiële integraal Ei.
Gamma
Geeft als resultaat de waarde van de gammafunctie.
GammaLn
Retourneert de natuurlijke logaritme van de gammafunctie.
GammaRegularizedP
Geeft als resultaat de waarde van de geserialiseerde onvolledige gammafunctie.
Voor deze functie is een tweede argument nodig, dat kan worden opgegeven als een constante of een kolom met waarden.
GammaRegularizedPInverse
Retourneert de waarde van de inverse ge regulariseerde onvolledige gammafunctie.
Voor deze functie is een tweede argument nodig, dat kan worden opgegeven als een constante of een kolom met waarden.
GammaRegularizedQ
Geeft als resultaat de waarde van de geserialiseerde onvolledige gammafunctie.
Voor deze functie is een tweede argument nodig, dat kan worden opgegeven als een constante of een kolom met waarden.
GammaRegularizedQInverse
Geeft als resultaat de waarde van de inverse gegeneraliseerde gegeneraliseerde onvolledige gammafunctie.
Voor deze functie is een tweede argument nodig, dat kan worden opgegeven als een constante of een kolom met waarden.
PolyGamma
Retourneert de waarde van de polygamma-functie.
Voor deze functie is een tweede argument nodig, dat kan worden opgegeven als een constante of een kolom met waarden.
Trigonometrische functies
Deze categorie omvat de meeste belangrijke trigonometrische en inverse trigonometrische functies. Alle trigonometrische functies zijn unair en vereisen geen extra argumenten.
Acos
Berekent de boogcosinus voor de kolomwaarden.
AcosDegree
Berekent de boogcosinus van de kolomwaarden, in graden.
Acosh
Berekent de hyperbolische arccosinus van de kolomwaarden.
Acot
Berekent de boogcotangens van de kolomwaarden.
AcotDegrees
Berekent de boogcotangens van de kolomwaarden, in graden.
Acoth
Berekent de boogcotangens hyperbolicus van de kolomwaarden.
Acsc
Berekent de boogcosecant van de kolomwaarden.
AcscDegrees
Berekent de boogcosecant van de kolomwaarden, in graden.
Asec
Berekent de boogsecans van de kolomwaarden.
AsecDegrees
Berekent de arcsecans van de kolomwaarden, in graden.
Asech
Berekent de boogsecans hyperbolicus van de kolomwaarden.
Asin
Berekent de arcsinus van de kolomwaarden.
AsinDegrees
Berekent de arcsinus van de kolomwaarden, in graden.
Asinh
Berekent de hyperbolische arcsinus voor de kolomwaarden.
Atan
Berekent de boogtangens van de kolomwaarden.
AtanDegrees
Berekent de boogtangens van de kolomwaarden, in graden.
Atanh
Berekent de hyperbolische boogtangens van de kolomwaarden.
Cos
Berekent de cosinus van de kolomwaarden.
CosDegrees
Berekent de cosinus voor de kolomwaarden, in graden.
Cosh
Berekent de cosinus hyperbolicus voor de kolomwaarden.
Cot
Berekent de cotangens voor de kolomwaarden.
CotDegrees
Berekent de cotangens voor de kolomwaarden, in graden.
Coth
Berekent de cotangens hyperbolicus voor de kolomwaarden.
Csc
Berekent de cosecans voor de kolomwaarden.
CscDegrees
Berekent de cosecans voor de kolomwaarden, in graden.
Csch
Berekent de cosecans hyperbolicus voor de kolomwaarden.
DegreesToRadians
Converteert graden naar radialen.
Sec
Berekent de secans van de kolomwaarden.
aSecDegrees
Berekent de secans voor de kolomwaarden, in graden.
aSech
Berekent de secans hyperbolicus van de kolomwaarden.
Teken
Retourneert het teken van de kolomwaarden.
Sin
Berekent de sinus van de kolomwaarden.
Sinc
Berekent de sinus-cosinuswaarde van de kolomwaarden.
SinDegrees
Berekent de sinus voor de kolomwaarden, in graden.
Sinh
Berekent de sinus hyperbolicus van de kolomwaarden.
Tan
Berekent de tangens van de kolomwaarden.
TanDegrees
Berekent de tangens voor het argument, in graden.
Tanh
Berekent de hyperbolische tangens van de kolomwaarden.
Technische opmerkingen
Wees voorzichtig wanneer u meer dan één kolom als tweede operator selecteert. De resultaten zijn gemakkelijk te begrijpen als de bewerking eenvoudig is, zoals het toevoegen van een constante aan alle kolommen.
Stel dat uw gegevensset meerdere kolommen heeft en dat u de gegevensset aan zichzelf toevoegt. In de resultaten wordt elke kolom als volgt aan zichzelf toegevoegd:
Getal1 | Getal2 | Getal3 | Toevoegen(Num1_Num1) | Toevoegen(Num2_Num2) | Toevoegen(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Als u complexere berekeningen moet uitvoeren, kunt u meerdere exemplaren van Wiskundige bewerking toepassen koppelen. U kunt bijvoorbeeld twee kolommen toevoegen met behulp van één exemplaar van Wiskundige bewerking toepassen en vervolgens een ander exemplaar van Wiskundige bewerking toepassen gebruiken om de som te delen door een constante om het gemiddelde te verkrijgen.
U kunt ook een van de volgende onderdelen gebruiken om alle berekeningen in één keer uit te voeren met behulp van EEN SQL-, R- of Python-script:
Volgende stappen
Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.