Použití matematických operací
Tento článek popisuje komponentu návrháře služby Azure Machine Learning.
Pomocí operace Použít matematický zápis můžete vytvořit výpočty, které se použijí na číselné sloupce ve vstupní datové sadě.
Matematické operace zahrnují aritmetické funkce, trigonometrické funkce, zaokrouhlovací funkce a speciální funkce používané v datových vědách, jako jsou gama a chybové funkce.
Po definování operace a spuštění kanálu se hodnoty přidají do vaší datové sady. V závislosti na konfiguraci komponenty můžete:
- Připojte výsledky k datové sadě (užitečné při ověřování výsledku operace).
- Nahraďte hodnoty sloupců novými vypočítanými hodnotami.
- Vygenerujte nový sloupec pro výsledky, ale nezobrazíte původní data.
Vyhledejte operaci, kterou potřebujete, v těchto kategoriích:
-
Funkce v kategorii Basic lze použít k manipulaci s jednou hodnotou nebo sloupcem hodnot. Můžete například získat absolutní hodnotu všech čísel ve sloupci nebo vypočítat druhou odmocninu každé hodnoty ve sloupci.
-
Všechny funkce v kategorii Compare se používají k porovnání: můžete provést párové porovnání hodnot ve dvou sloupcích nebo můžete porovnat každou hodnotu ve sloupci se zadanou konstantou. Můžete například porovnat sloupce a určit, jestli jsou hodnoty ve dvou datových sadách stejné. Nebo můžete k vyhledání odlehlých hodnot v číselném sloupci použít konstantu, například maximální povolenou hodnotu.
-
Kategorie Operace obsahuje základní matematické funkce: sčítání, odčítání, násobení a dělení. Můžete pracovat se sloupci nebo konstantami. Můžete například přidat hodnotu ve sloupci A k hodnotě ve sloupci B. Nebo můžete od každé hodnoty ve sloupci A odečíst konstantu, například dříve vypočítanou střední hodnotu.
-
Kategorie Zaokrouhlování zahrnuje celou řadu funkcí pro provádění operací, jako je zaokrouhlení, strop, podlaha a zkracování, až do různých úrovní přesnosti. Můžete zadat úroveň přesnosti pro desetinná i celá čísla.
-
Kategorie Special zahrnuje matematické funkce, které se používají zejména v datových vědách, jako jsou eliptické integrály a Gaussovy chybové funkce.
-
Kategorie Trigonometric zahrnuje všechny standardní trigonometrické funkce. Můžete například převést radiány na stupně nebo výpočetní funkce, jako je tangens v radiánech nebo stupních. Tyto funkce jsou unární, což znamená, že jako vstup přebírají jeden sloupec hodnot, použijí trigonometrickou funkci a jako výsledek vrátí sloupec hodnot. Ujistěte se, že vstupní sloupec je odpovídající typ a obsahuje správný typ hodnot pro zadanou operaci.
Jak nakonfigurovat použití matematické operace
Komponenta Apply Math Operation vyžaduje datovou sadu, která obsahuje alespoň jeden sloupec obsahující pouze čísla. Čísla můžou být diskrétní nebo souvislá, ale musí mít číselný datový typ, ne řetězec.
Stejnou operaci můžete použít u více číselných sloupců, ale všechny sloupce musí být ve stejné datové sadě.
Každá instance této komponenty může najednou provádět pouze jeden typ operace. Pokud chcete provádět složité matematické operace, možná budete muset zřetězit několik instancí komponenty Apply Math Operation( Použít matematickou operaci ).
Přidejte do svého kanálu komponentu Apply Math Operation (Použít matematickou operaci ).
Připojte datovou sadu, která obsahuje alespoň jeden číselný sloupec.
Vyberte jeden nebo více zdrojových sloupců, u kterých chcete provést výpočet.
- Libovolný sloupec, který zvolíte, musí být číselný datový typ.
- Oblast dat musí být platná pro vybranou matematickou operaci. V opačném případě může dojít k chybě nebo výsledku NaN (ne číslo). Například Ln(-1,0) je neplatná operace a výsledkem je hodnota
NaN
.
Vyberte Kategorie a vyberte typ matematické operace, která se má provést.
V seznamu v této kategorii vyberte konkrétní operaci.
Nastavte další parametry vyžadované jednotlivými typy operací.
Pomocí možnosti Režim výstupu můžete určit, jak se má matematická operace generovat:
- Připojit. Všechny sloupce použité jako vstupy jsou zahrnuté ve výstupní datové sadě a navíc se připojí jeden další sloupec, který obsahuje výsledky matematické operace.
- Inplace. Hodnoty ve sloupcích použitých jako vstupy se nahradí novými počítanými hodnotami.
- ResultOnly. Vrátí se jeden sloupec obsahující výsledky matematické operace.
Odešlete kanál.
Výsledky
Pokud vygenerujete výsledky pomocí možností Připojit nebo ResultOnly , záhlaví sloupců vrácené datové sady označují operaci a sloupce, které byly použity. Pokud například porovnáte dva sloupce pomocí operátoru Rovná se, výsledky by vypadaly takto:
- Equals(Col2_Col1) označující, že jste testovali Col2 proti Col1.
- Rovná se(Col2_$10), což znamená, že jste porovnávali sloupec 2 s konstantou 10.
I když použijete možnost Na místě , zdrojová data nebudou odstraněna ani změněna; sloupec v původní datové sadě je stále k dispozici v návrháři. Pokud chcete zobrazit původní data, můžete připojit komponentu Přidat sloupce a spojit ji s výstupem operace Použít matematický zápis.
Základní matematické operace
Funkce v kategorii Basic obvykle přebírají jednu hodnotu ze sloupce, provedou předdefinovanou operaci a vrátí jednu hodnotu. U některých funkcí můžete zadat konstantu nebo sloupec nastavený jako druhý argument.
Azure Machine Learning podporuje následující funkce v kategorii Basic :
Abs
Vrátí absolutní hodnotu vybraných sloupců.
Atan2
Vrátí inverzní tangens se čtyřmi kvadranty.
Vyberte sloupce, které obsahují souřadnice bodů. Pro druhý argument, který odpovídá souřadnici x, můžete také zadat konstantu.
Odpovídá funkci ATAN2 v matlabu.
Conj
Vrátí konjugát pro hodnoty ve vybraném sloupci.
CubeRoot
Vypočítá kořen datové krychle pro hodnoty ve vybraném sloupci.
DoubleFactorial
Vypočítá dvojitý faktoriál pro hodnoty ve vybraném sloupci. Dvojitý faktoriál je rozšířením normální faktoriální funkce a je označen jako x!!
.
Eps
Vrátí velikost mezery mezi aktuální hodnotou a dalším nejvyšším číslem s dvojitou přesností. Odpovídá funkci EPS v MATLABu.
Exp
Vrátí e umocněné na mocninu hodnoty ve vybraném sloupci. Tato funkce je stejná jako excelová funkce EXP.
Exp2
Vrátí exponenciální hodnotu argumentů ve 2. základu, řešení pro y = x * 2t , kde t je sloupec hodnot obsahujících exponenty.
V části Sada sloupců vyberte sloupec, který obsahuje hodnoty exponentu t.
Pro Exp2 můžete zadat druhý argument x, který může být konstantou nebo jiným sloupcem hodnot. V části Druhý typ argumentu určete, jestli násobitel x zadáte jako konstantu, nebo hodnotu ve sloupci.
Pokud například vyberete sloupec s hodnotami {0,1,2,3,4,5} pro násobitel i exponent, vrátí funkce {0, 2, 8, 24, 64 160).
ExpMinus1
Vrátí záporný exponent pro hodnoty ve vybraném sloupci.
Faktoriál
Vrátí faktoriál pro hodnoty ve vybraném sloupci.
Přetonážka
Vypočítá přepočty pro trojúhelník, ve kterém je délka jedné strany zadána jako sloupec hodnot a délka druhé strany je určena buď jako konstanta, nebo jako dva sloupce.
Logaritmus
Vrátí přirozený logaritmus pro hodnoty ve vybraném sloupci.
LnPlus1
Vrátí přirozený logaritmus plus 1 pro hodnoty ve vybraném sloupci.
Protokol
Vrátí protokol hodnot ve vybraném sloupci vzhledem k zadanému základu.
Základ (druhý argument) můžete zadat buď jako konstantu, nebo výběrem jiného sloupce hodnot.
Log10
Vrátí základní 10-logaritmus hodnoty vybraného sloupce.
Protokol 2
Vrátí hodnoty základního logaritmu 2 pro vybraný sloupec.
NthRoot
Vrátí n-tý kořen hodnoty pomocí n, které zadáte.
Pomocí možnosti ColumnSet (Sada sloupců) vyberte sloupce, pro které chcete vypočítat kořen.
V části Druhý typ argumentu vyberte jiný sloupec, který obsahuje kořen, nebo zadejte konstantu, která se má použít jako kořen.
Pokud je druhým argumentem sloupec, každá hodnota ve sloupci se použije jako hodnota n pro odpovídající řádek. Pokud je druhým argumentem konstanta, zadejte hodnotu pro n do textového pole Druhý argument .
Pow
Vypočítá X umocněné na mocninu Y pro každou hodnotu ve vybraném sloupci.
Nejprve pomocí možnosti ColumnSet vyberte sloupce, které obsahují základ, který by měl být float.
V části Druhý typ argumentu vyberte sloupec, který obsahuje exponent, nebo určete konstantu, která se má použít jako exponent.
Pokud je druhým argumentem sloupec, každá hodnota ve sloupci se použije jako exponent odpovídajícího řádku. Pokud je druhým argumentem konstanta, zadejte hodnotu exponentu do textového pole Druhý argument .
Sqrt
Vrátí druhou odmocninu hodnot ve vybraném sloupci.
SqrtPi
Pro každou hodnotu ve vybraném sloupci vynásobí hodnotu pí a vrátí druhou odmocninu výsledku.
Square
Na druhou mocninu hodnot ve vybraném sloupci.
Operace porovnání
Kdykoli potřebujete otestovat dvě sady hodnot, použijte v návrháři Azure Machine Learning srovnávací funkce. Například v kanálu může být potřeba provést tyto operace porovnání:
- Vyhodnotí sloupec modelu skóre pravděpodobnosti oproti prahové hodnotě.
- Určí, jestli jsou dvě sady výsledků stejné. Pro každý řádek, který se liší, přidejte příznak FALSE, který lze použít k dalšímu zpracování nebo filtrování.
EqualTo
Vrátí hodnotu True, pokud jsou hodnoty stejné.
GreaterThan
Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců větší než zadaná konstanta nebo větší než odpovídající hodnoty ve sloupci porovnání.
GreaterThanOrEqualTo
Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců větší nebo rovné zadané konstantě nebo větší nebo rovné odpovídajícím hodnotám ve sloupci porovnání.
LessThan
Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců menší než zadaná konstanta nebo menší než odpovídající hodnoty ve sloupci porovnání.
LessThanOrEqualTo
Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců menší nebo rovny zadané konstantě nebo menší nebo rovné odpovídajícím hodnotám ve sloupci porovnání.
NotEqualTo
Vrátí hodnotu True, pokud se hodnoty v sadě sloupců nerovnají konstantě nebo srovnávacímu sloupci, a vrátí hodnotu False, pokud jsou stejné.
PairMax
Vrátí hodnotu, která je větší – hodnotu v sadě sloupců nebo hodnotu ve sloupci konstanty nebo porovnání.
PairMin
Vrátí hodnotu, která je menší – hodnotu v sadě sloupců nebo hodnotu ve sloupci konstanty nebo porovnání.
Aritmetické operace
Zahrnuje základní aritmetické operace: sčítání a odčítání, dělení a násobení. Vzhledem k tomu, že většina operací je binární a vyžaduje dvě čísla, nejprve zvolíte operaci a pak zvolíte sloupec nebo čísla, která se mají použít v prvním a druhém argumentu.
Pořadí dělení a odčítání je následující:
- Subtract(Arg1_Arg2) = Arg1 - Arg 2
- Divide(Arg1_Arg2) = Arg1 / Arg 2
V následující tabulce jsou uvedeny některé příklady.
Operace | Číslo 1 | Číslo 2 | Sloupec výsledku | Výsledná hodnota |
---|---|---|---|---|
Sčítání | 1 | 5 | Přidat(Num2_Num1) | 6 |
Násobení | 1 | 5 | Více (Num2_Num1) | 5 |
Odčítání | 5 | 1 | Subtract(Num2_Num1) | 4 |
Odčítání | 0 | 1 | Subtract(Num2_Num1) | -1 |
Oddělení | 5 | 1 | Divide(Num2_Num1) | 5 |
Oddělení | 1 | 0 | Divide(Num2_Num1) | Nekonečno |
Přidání
Určete zdrojové sloupce pomocí sady sloupců a pak k těmto hodnotám přidejte číslo zadané v argumentu Druhý.
Pokud chcete přidat hodnoty ve dvou sloupcích, zvolte sloupec nebo sloupce pomocí sady sloupců a pak zvolte druhý sloupec pomocí argumentu Druhý.
Dělení
Vydělí hodnoty ve sloupci nastavené konstantou nebo hodnotami sloupce definovanými v argumentu Second. Jinými slovy, nejprve vyberete dělitele a pak dividendu. Výstupní hodnota je podíl.
Násobení
Vynásobí hodnoty v sloupci nastavené hodnotami zadané konstanty nebo sloupce.
Odčítání
Zadejte sloupec hodnot, se kterou se mají pracovat ( minuend), výběrem jiného sloupce pomocí možnosti Sada sloupců . Potom pomocí rozevíracího seznamu Druhý argument zadejte číslo, které se má odečíst (podtrahend). Můžete zvolit konstantu nebo sloupec hodnot.
Operace zaokrouhlování
Návrhář Azure Machine Learning podporuje různé operace zaokrouhlování. U mnoha operací je nutné zadat míru přesnosti, která se má použít při zaokrouhlování. Můžete použít buď statickou úroveň přesnosti zadanou jako konstantu, nebo dynamickou hodnotu přesnosti získanou ze sloupce hodnot.
Pokud používáte konstantu, nastavte Typ přesnosti na Konstantní a potom zadejte počet číslic jako celé číslo do textového pole Konstantní přesnost . Pokud zadáte non-integer, komponenta nevyvolá chybu, ale výsledky mohou být neočekávané.
Pokud chcete pro každý řádek v datové sadě použít jinou hodnotu přesnosti, nastavte Typ přesnosti na ColumnSet a pak zvolte sloupec, který obsahuje odpovídající hodnoty přesnosti.
Ceiling
Vrátí horní mez pro hodnoty v sadě sloupců.
CeilingPower2
Vrátí druhou mocninu pro hodnoty v sadě sloupců.
Floor
Vrátí dolní mez pro hodnoty v sadě sloupců na zadanou přesnost.
Mod
Vrátí desetinnou část hodnot v sadě sloupců na zadanou přesnost.
Podíl
Vrátí desetinnou část hodnot v sadě sloupců na zadanou přesnost.
Zbytek
Vrátí zbytek pro hodnoty v sadě sloupců.
RoundDigits
Vrátí hodnoty v sadě sloupců zaokrouhlené pravidlem 4/5 na zadaný počet číslic.
RoundDown
Vrátí hodnoty v sadě sloupců zaokrouhlené dolů na zadaný počet číslic.
RoundUp
Vrátí hodnoty v sadě sloupců zaokrouhlené nahoru na zadaný počet číslic.
Toeven
Vrátí hodnoty v sadě sloupců zaokrouhlené na nejbližší celé sudé číslo.
ToOdd (Odd)
Vrátí hodnoty v sadě sloupců zaokrouhlené na nejbližší celé liché číslo.
Truncate
Zkrátí hodnoty v nastaveném sloupci odebráním všech číslic, které nejsou povoleny se zadanou přesností.
Speciální matematické funkce
Tato kategorie zahrnuje specializované matematické funkce, které se často používají v datových vědách. Pokud není uvedeno jinak, je funkce unární a vrací zadaný výpočet pro každou hodnotu ve vybraném sloupci nebo sloupci.
Beta
Vrátí hodnotu Eulerovy beta funkce.
EllipticIntegralE
Vrátí hodnotu neúplného eliptického integrálu.
Tři tečkyIntegralK
Vrátí hodnotu celého eliptického integrálu (K).
Erf
Vrátí hodnotu chybové funkce.
Chybová funkce (označovaná také jako Gaussovu chybovou funkci) je speciální funkce sigmoidního tvaru, která se používá jako pravděpodobnost k popisu difúze.
Erfc
Vrátí hodnotu doplňkové chybové funkce.
Erfc
je definován jako 1 – erf(x).
ErfScaled
Vrátí hodnotu škálované chybové funkce.
Škálovaná verze chybové funkce se dá použít k tomu, aby se zabránilo aritmetickému podtečení.
ErfInverse
Vrátí hodnotu inverzní erf
funkce.
ExponentialIntegralEin
Vrátí hodnotu exponenciálního integrálu Ei.
Gama
Vrátí hodnotu funkce gama.
GammaLn
Vrátí přirozený logaritmus funkce gama.
GammaRegularizedP
Vrátí hodnotu regularizované neúplné gama funkce.
Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
GammaRegularizedPInverse
Vrátí hodnotu inverzní regularizované neúplné gama funkce.
Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
GammaRegularizedQ
Vrátí hodnotu regularizované neúplné gama funkce.
Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
GammaRegularizedQInverse
Vrátí hodnotu inverzní zobecněné regularizované nekompletní gama funkce.
Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
Polygamma
Vrátí hodnotu polygamní funkce.
Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
Trigonometrické funkce
Tato kategorie iZahrnuje většinu důležitých trigonometrických a inverzních trigonometrických funkcí. Všechny trigonometrické funkce jsou unární a nevyžadují žádné další argumenty.
Acos
Vypočítá arkus kosinus hodnot sloupců.
AcosDegree
Vypočítá arkus kosinus hodnot sloupců ve stupních.
Acosh
Vypočítá hyperbolický arkuskosinus hodnot sloupců.
Acot
Vypočítá arkuskotangens hodnot sloupců.
AcotDegrees
Vypočítá arkuskotangens hodnot sloupců ve stupních.
Acoth
Vypočítá hyperbolický arkuskotangens hodnot sloupců.
Acsc
Vypočítá arccosecant hodnot sloupců.
AcscDegrees
Vypočítá arkuskosekans hodnot sloupců ve stupních.
Asec
Vypočítá arkusekant hodnot sloupců.
AsecDegrees
Vypočítá arkusekans hodnot sloupců ve stupních.
Asech
Vypočítá hyperbolický arkusekans hodnot sloupců.
Asin
Vypočítá arkus sinus hodnot sloupce.
AsinDegrees
Vypočítá arkus sinus hodnot sloupce ve stupních.
Asinh
Vypočítá hyperbolický arkus sinus hodnot sloupců.
Atan
Vypočítá arkus tangens hodnot sloupců.
AtanDegrees
Vypočítá arkus tangens hodnot sloupců ve stupních.
Atanh
Vypočítá hyperbolický arkus tangens hodnot sloupců.
Cos
Vypočítá kosinus hodnot sloupců.
CosDegrees
Vypočítá kosinus hodnot sloupců ve stupních.
Cosh
Vypočítá hyperbolický kosinus hodnot sloupců.
Cot
Vypočítá kotangens pro hodnoty sloupce.
CotDegrees
Vypočítá kotangens hodnot sloupců ve stupních.
Kolébka
Vypočítá hyperbolický kotangens pro hodnoty sloupce.
Csc
Vypočítá kosekans pro hodnoty sloupce.
CscDegrees
Vypočítá kosekans pro hodnoty sloupce ve stupních.
Csch
Vypočítá hyperbolický kosekans hodnot sloupců.
DegreesToRadians
Převede stupně na radiány.
Sec
Vypočítá sekans hodnot ve sloupci.
aSecDegrees
Vypočítá sekans hodnot sloupců ve stupních.
aSech
Vypočítá hyperbolický sekans hodnot sloupců.
Znaménko
Vrátí znaménko hodnot sloupce.
Sinus
Vypočítá sinus hodnot sloupce.
Sinc
Vypočítá hodnotu sinus-kosinus hodnot sloupce.
SinDegrees
Vypočítá sinus hodnot sloupců ve stupních.
Sinh
Vypočítá hyperbolický sinus hodnot sloupce.
Tan
Vypočítá tangens hodnot sloupců.
TanDegrees
Vypočítá tangens argumentu ve stupních.
Tanh
Vypočítá hyperbolický tangens hodnot sloupců.
Technické poznámky
Při výběru více než jednoho sloupce jako druhého operátoru buďte opatrní. Výsledky jsou snadno pochopitelné, pokud je operace jednoduchá, například přidání konstanty do všech sloupců.
Předpokládejme, že datová sada má více sloupců a přidáte ji do sebe. Ve výsledcích se každý sloupec přidá sám k sobě následujícím způsobem:
Číslo 1 | Číslo 2 | Číslo 3 | Přidat(Num1_Num1) | Přidat(Num2_Num2) | Přidat(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Pokud potřebujete provádět složitější výpočty, můžete zřetězených více instancí operace Použít matematickou operaci. Můžete například přidat dva sloupce pomocí jedné instance použít matematickou operaci a pak použít jinou instanci Použít matematickou operaci k vydělení součtu konstantou, abyste získali střední hodnotu.
Případně můžete použít jednu z následujících komponent k provedení všech výpočtů najednou pomocí skriptu SQL, R nebo Pythonu:
Další kroky
Podívejte se na sadu komponent dostupných pro Azure Machine Learning.