Použití matematických operací

Tento článek popisuje komponentu návrháře služby Azure Machine Learning.

Pomocí operace Použít matematický zápis můžete vytvořit výpočty, které se použijí na číselné sloupce ve vstupní datové sadě.

Matematické operace zahrnují aritmetické funkce, trigonometrické funkce, zaokrouhlovací funkce a speciální funkce používané v datových vědách, jako jsou gama a chybové funkce.

Po definování operace a spuštění kanálu se hodnoty přidají do vaší datové sady. V závislosti na konfiguraci komponenty můžete:

  • Připojte výsledky k datové sadě (užitečné při ověřování výsledku operace).
  • Nahraďte hodnoty sloupců novými vypočítanými hodnotami.
  • Vygenerujte nový sloupec pro výsledky, ale nezobrazíte původní data.

Vyhledejte operaci, kterou potřebujete, v těchto kategoriích:

  • Basic

    Funkce v kategorii Basic lze použít k manipulaci s jednou hodnotou nebo sloupcem hodnot. Můžete například získat absolutní hodnotu všech čísel ve sloupci nebo vypočítat druhou odmocninu každé hodnoty ve sloupci.

  • Porovnání

    Všechny funkce v kategorii Compare se používají k porovnání: můžete provést párové porovnání hodnot ve dvou sloupcích nebo můžete porovnat každou hodnotu ve sloupci se zadanou konstantou. Můžete například porovnat sloupce a určit, jestli jsou hodnoty ve dvou datových sadách stejné. Nebo můžete k vyhledání odlehlých hodnot v číselném sloupci použít konstantu, například maximální povolenou hodnotu.

  • Operace

    Kategorie Operace obsahuje základní matematické funkce: sčítání, odčítání, násobení a dělení. Můžete pracovat se sloupci nebo konstantami. Můžete například přidat hodnotu ve sloupci A k hodnotě ve sloupci B. Nebo můžete od každé hodnoty ve sloupci A odečíst konstantu, například dříve vypočítanou střední hodnotu.

  • Zaokrouhlení

    Kategorie Zaokrouhlování zahrnuje celou řadu funkcí pro provádění operací, jako je zaokrouhlení, strop, podlaha a zkracování, až do různých úrovní přesnosti. Můžete zadat úroveň přesnosti pro desetinná i celá čísla.

  • Zvláštní

    Kategorie Special zahrnuje matematické funkce, které se používají zejména v datových vědách, jako jsou eliptické integrály a Gaussovy chybové funkce.

  • Trigonometrické

    Kategorie Trigonometric zahrnuje všechny standardní trigonometrické funkce. Můžete například převést radiány na stupně nebo výpočetní funkce, jako je tangens v radiánech nebo stupních. Tyto funkce jsou unární, což znamená, že jako vstup přebírají jeden sloupec hodnot, použijí trigonometrickou funkci a jako výsledek vrátí sloupec hodnot. Ujistěte se, že vstupní sloupec je odpovídající typ a obsahuje správný typ hodnot pro zadanou operaci.

Jak nakonfigurovat použití matematické operace

Komponenta Apply Math Operation vyžaduje datovou sadu, která obsahuje alespoň jeden sloupec obsahující pouze čísla. Čísla můžou být diskrétní nebo souvislá, ale musí mít číselný datový typ, ne řetězec.

Stejnou operaci můžete použít u více číselných sloupců, ale všechny sloupce musí být ve stejné datové sadě.

Každá instance této komponenty může najednou provádět pouze jeden typ operace. Pokud chcete provádět složité matematické operace, možná budete muset zřetězit několik instancí komponenty Apply Math Operation( Použít matematickou operaci ).

  1. Přidejte do svého kanálu komponentu Apply Math Operation (Použít matematickou operaci ).

  2. Připojte datovou sadu, která obsahuje alespoň jeden číselný sloupec.

  3. Vyberte jeden nebo více zdrojových sloupců, u kterých chcete provést výpočet.

    • Libovolný sloupec, který zvolíte, musí být číselný datový typ.
    • Oblast dat musí být platná pro vybranou matematickou operaci. V opačném případě může dojít k chybě nebo výsledku NaN (ne číslo). Například Ln(-1,0) je neplatná operace a výsledkem je hodnota NaN.
  4. Vyberte Kategorie a vyberte typ matematické operace, která se má provést.

  5. V seznamu v této kategorii vyberte konkrétní operaci.

  6. Nastavte další parametry vyžadované jednotlivými typy operací.

  7. Pomocí možnosti Režim výstupu můžete určit, jak se má matematická operace generovat:

    • Připojit. Všechny sloupce použité jako vstupy jsou zahrnuté ve výstupní datové sadě a navíc se připojí jeden další sloupec, který obsahuje výsledky matematické operace.
    • Inplace. Hodnoty ve sloupcích použitých jako vstupy se nahradí novými počítanými hodnotami.
    • ResultOnly. Vrátí se jeden sloupec obsahující výsledky matematické operace.
  8. Odešlete kanál.

Výsledky

Pokud vygenerujete výsledky pomocí možností Připojit nebo ResultOnly , záhlaví sloupců vrácené datové sady označují operaci a sloupce, které byly použity. Pokud například porovnáte dva sloupce pomocí operátoru Rovná se, výsledky by vypadaly takto:

  • Equals(Col2_Col1) označující, že jste testovali Col2 proti Col1.
  • Rovná se(Col2_$10), což znamená, že jste porovnávali sloupec 2 s konstantou 10.

I když použijete možnost Na místě , zdrojová data nebudou odstraněna ani změněna; sloupec v původní datové sadě je stále k dispozici v návrháři. Pokud chcete zobrazit původní data, můžete připojit komponentu Přidat sloupce a spojit ji s výstupem operace Použít matematický zápis.

Základní matematické operace

Funkce v kategorii Basic obvykle přebírají jednu hodnotu ze sloupce, provedou předdefinovanou operaci a vrátí jednu hodnotu. U některých funkcí můžete zadat konstantu nebo sloupec nastavený jako druhý argument.

Azure Machine Learning podporuje následující funkce v kategorii Basic :

Abs

Vrátí absolutní hodnotu vybraných sloupců.

Atan2

Vrátí inverzní tangens se čtyřmi kvadranty.

Vyberte sloupce, které obsahují souřadnice bodů. Pro druhý argument, který odpovídá souřadnici x, můžete také zadat konstantu.

Odpovídá funkci ATAN2 v matlabu.

Conj

Vrátí konjugát pro hodnoty ve vybraném sloupci.

CubeRoot

Vypočítá kořen datové krychle pro hodnoty ve vybraném sloupci.

DoubleFactorial

Vypočítá dvojitý faktoriál pro hodnoty ve vybraném sloupci. Dvojitý faktoriál je rozšířením normální faktoriální funkce a je označen jako x!!.

Eps

Vrátí velikost mezery mezi aktuální hodnotou a dalším nejvyšším číslem s dvojitou přesností. Odpovídá funkci EPS v MATLABu.

Exp

Vrátí e umocněné na mocninu hodnoty ve vybraném sloupci. Tato funkce je stejná jako excelová funkce EXP.

Exp2

Vrátí exponenciální hodnotu argumentů ve 2. základu, řešení pro y = x * 2t , kde t je sloupec hodnot obsahujících exponenty.

V části Sada sloupců vyberte sloupec, který obsahuje hodnoty exponentu t.

Pro Exp2 můžete zadat druhý argument x, který může být konstantou nebo jiným sloupcem hodnot. V části Druhý typ argumentu určete, jestli násobitel x zadáte jako konstantu, nebo hodnotu ve sloupci.

Pokud například vyberete sloupec s hodnotami {0,1,2,3,4,5} pro násobitel i exponent, vrátí funkce {0, 2, 8, 24, 64 160).

ExpMinus1

Vrátí záporný exponent pro hodnoty ve vybraném sloupci.

Faktoriál

Vrátí faktoriál pro hodnoty ve vybraném sloupci.

Přetonážka

Vypočítá přepočty pro trojúhelník, ve kterém je délka jedné strany zadána jako sloupec hodnot a délka druhé strany je určena buď jako konstanta, nebo jako dva sloupce.

Logaritmus

Vrátí přirozený logaritmus pro hodnoty ve vybraném sloupci.

LnPlus1

Vrátí přirozený logaritmus plus 1 pro hodnoty ve vybraném sloupci.

Protokol

Vrátí protokol hodnot ve vybraném sloupci vzhledem k zadanému základu.

Základ (druhý argument) můžete zadat buď jako konstantu, nebo výběrem jiného sloupce hodnot.

Log10

Vrátí základní 10-logaritmus hodnoty vybraného sloupce.

Protokol 2

Vrátí hodnoty základního logaritmu 2 pro vybraný sloupec.

NthRoot

Vrátí n-tý kořen hodnoty pomocí n, které zadáte.

Pomocí možnosti ColumnSet (Sada sloupců) vyberte sloupce, pro které chcete vypočítat kořen.

V části Druhý typ argumentu vyberte jiný sloupec, který obsahuje kořen, nebo zadejte konstantu, která se má použít jako kořen.

Pokud je druhým argumentem sloupec, každá hodnota ve sloupci se použije jako hodnota n pro odpovídající řádek. Pokud je druhým argumentem konstanta, zadejte hodnotu pro n do textového pole Druhý argument .

Pow

Vypočítá X umocněné na mocninu Y pro každou hodnotu ve vybraném sloupci.

Nejprve pomocí možnosti ColumnSet vyberte sloupce, které obsahují základ, který by měl být float.

V části Druhý typ argumentu vyberte sloupec, který obsahuje exponent, nebo určete konstantu, která se má použít jako exponent.

Pokud je druhým argumentem sloupec, každá hodnota ve sloupci se použije jako exponent odpovídajícího řádku. Pokud je druhým argumentem konstanta, zadejte hodnotu exponentu do textového pole Druhý argument .

Sqrt

Vrátí druhou odmocninu hodnot ve vybraném sloupci.

SqrtPi

Pro každou hodnotu ve vybraném sloupci vynásobí hodnotu pí a vrátí druhou odmocninu výsledku.

Square

Na druhou mocninu hodnot ve vybraném sloupci.

Operace porovnání

Kdykoli potřebujete otestovat dvě sady hodnot, použijte v návrháři Azure Machine Learning srovnávací funkce. Například v kanálu může být potřeba provést tyto operace porovnání:

  • Vyhodnotí sloupec modelu skóre pravděpodobnosti oproti prahové hodnotě.
  • Určí, jestli jsou dvě sady výsledků stejné. Pro každý řádek, který se liší, přidejte příznak FALSE, který lze použít k dalšímu zpracování nebo filtrování.

EqualTo

Vrátí hodnotu True, pokud jsou hodnoty stejné.

GreaterThan

Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců větší než zadaná konstanta nebo větší než odpovídající hodnoty ve sloupci porovnání.

GreaterThanOrEqualTo

Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců větší nebo rovné zadané konstantě nebo větší nebo rovné odpovídajícím hodnotám ve sloupci porovnání.

LessThan

Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců menší než zadaná konstanta nebo menší než odpovídající hodnoty ve sloupci porovnání.

LessThanOrEqualTo

Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců menší nebo rovny zadané konstantě nebo menší nebo rovné odpovídajícím hodnotám ve sloupci porovnání.

NotEqualTo

Vrátí hodnotu True, pokud se hodnoty v sadě sloupců nerovnají konstantě nebo srovnávacímu sloupci, a vrátí hodnotu False, pokud jsou stejné.

PairMax

Vrátí hodnotu, která je větší – hodnotu v sadě sloupců nebo hodnotu ve sloupci konstanty nebo porovnání.

PairMin

Vrátí hodnotu, která je menší – hodnotu v sadě sloupců nebo hodnotu ve sloupci konstanty nebo porovnání.

Aritmetické operace

Zahrnuje základní aritmetické operace: sčítání a odčítání, dělení a násobení. Vzhledem k tomu, že většina operací je binární a vyžaduje dvě čísla, nejprve zvolíte operaci a pak zvolíte sloupec nebo čísla, která se mají použít v prvním a druhém argumentu.

Pořadí dělení a odčítání je následující:

  • Subtract(Arg1_Arg2) = Arg1 - Arg 2
  • Divide(Arg1_Arg2) = Arg1 / Arg 2

V následující tabulce jsou uvedeny některé příklady.

Operace Číslo 1 Číslo 2 Sloupec výsledku Výsledná hodnota
Sčítání 1 5 Přidat(Num2_Num1) 6
Násobení 1 5 Více (Num2_Num1) 5
Odčítání 5 1 Subtract(Num2_Num1) 4
Odčítání 0 1 Subtract(Num2_Num1) -1
Oddělení 5 1 Divide(Num2_Num1) 5
Oddělení 1 0 Divide(Num2_Num1) Nekonečno

Přidání

Určete zdrojové sloupce pomocí sady sloupců a pak k těmto hodnotám přidejte číslo zadané v argumentu Druhý.

Pokud chcete přidat hodnoty ve dvou sloupcích, zvolte sloupec nebo sloupce pomocí sady sloupců a pak zvolte druhý sloupec pomocí argumentu Druhý.

Dělení

Vydělí hodnoty ve sloupci nastavené konstantou nebo hodnotami sloupce definovanými v argumentu Second. Jinými slovy, nejprve vyberete dělitele a pak dividendu. Výstupní hodnota je podíl.

Násobení

Vynásobí hodnoty v sloupci nastavené hodnotami zadané konstanty nebo sloupce.

Odčítání

Zadejte sloupec hodnot, se kterou se mají pracovat ( minuend), výběrem jiného sloupce pomocí možnosti Sada sloupců . Potom pomocí rozevíracího seznamu Druhý argument zadejte číslo, které se má odečíst (podtrahend). Můžete zvolit konstantu nebo sloupec hodnot.

Operace zaokrouhlování

Návrhář Azure Machine Learning podporuje různé operace zaokrouhlování. U mnoha operací je nutné zadat míru přesnosti, která se má použít při zaokrouhlování. Můžete použít buď statickou úroveň přesnosti zadanou jako konstantu, nebo dynamickou hodnotu přesnosti získanou ze sloupce hodnot.

  • Pokud používáte konstantu, nastavte Typ přesnosti na Konstantní a potom zadejte počet číslic jako celé číslo do textového pole Konstantní přesnost . Pokud zadáte non-integer, komponenta nevyvolá chybu, ale výsledky mohou být neočekávané.

  • Pokud chcete pro každý řádek v datové sadě použít jinou hodnotu přesnosti, nastavte Typ přesnosti na ColumnSet a pak zvolte sloupec, který obsahuje odpovídající hodnoty přesnosti.

Ceiling

Vrátí horní mez pro hodnoty v sadě sloupců.

CeilingPower2

Vrátí druhou mocninu pro hodnoty v sadě sloupců.

Floor

Vrátí dolní mez pro hodnoty v sadě sloupců na zadanou přesnost.

Mod

Vrátí desetinnou část hodnot v sadě sloupců na zadanou přesnost.

Podíl

Vrátí desetinnou část hodnot v sadě sloupců na zadanou přesnost.

Zbytek

Vrátí zbytek pro hodnoty v sadě sloupců.

RoundDigits

Vrátí hodnoty v sadě sloupců zaokrouhlené pravidlem 4/5 na zadaný počet číslic.

RoundDown

Vrátí hodnoty v sadě sloupců zaokrouhlené dolů na zadaný počet číslic.

RoundUp

Vrátí hodnoty v sadě sloupců zaokrouhlené nahoru na zadaný počet číslic.

Toeven

Vrátí hodnoty v sadě sloupců zaokrouhlené na nejbližší celé sudé číslo.

ToOdd (Odd)

Vrátí hodnoty v sadě sloupců zaokrouhlené na nejbližší celé liché číslo.

Truncate

Zkrátí hodnoty v nastaveném sloupci odebráním všech číslic, které nejsou povoleny se zadanou přesností.

Speciální matematické funkce

Tato kategorie zahrnuje specializované matematické funkce, které se často používají v datových vědách. Pokud není uvedeno jinak, je funkce unární a vrací zadaný výpočet pro každou hodnotu ve vybraném sloupci nebo sloupci.

Beta

Vrátí hodnotu Eulerovy beta funkce.

EllipticIntegralE

Vrátí hodnotu neúplného eliptického integrálu.

Tři tečkyIntegralK

Vrátí hodnotu celého eliptického integrálu (K).

Erf

Vrátí hodnotu chybové funkce.

Chybová funkce (označovaná také jako Gaussovu chybovou funkci) je speciální funkce sigmoidního tvaru, která se používá jako pravděpodobnost k popisu difúze.

Erfc

Vrátí hodnotu doplňkové chybové funkce.

Erfc je definován jako 1 – erf(x).

ErfScaled

Vrátí hodnotu škálované chybové funkce.

Škálovaná verze chybové funkce se dá použít k tomu, aby se zabránilo aritmetickému podtečení.

ErfInverse

Vrátí hodnotu inverzní erf funkce.

ExponentialIntegralEin

Vrátí hodnotu exponenciálního integrálu Ei.

Gama

Vrátí hodnotu funkce gama.

GammaLn

Vrátí přirozený logaritmus funkce gama.

GammaRegularizedP

Vrátí hodnotu regularizované neúplné gama funkce.

Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.

GammaRegularizedPInverse

Vrátí hodnotu inverzní regularizované neúplné gama funkce.

Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.

GammaRegularizedQ

Vrátí hodnotu regularizované neúplné gama funkce.

Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.

GammaRegularizedQInverse

Vrátí hodnotu inverzní zobecněné regularizované nekompletní gama funkce.

Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.

Polygamma

Vrátí hodnotu polygamní funkce.

Tato funkce přebírá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.

Trigonometrické funkce

Tato kategorie iZahrnuje většinu důležitých trigonometrických a inverzních trigonometrických funkcí. Všechny trigonometrické funkce jsou unární a nevyžadují žádné další argumenty.

Acos

Vypočítá arkus kosinus hodnot sloupců.

AcosDegree

Vypočítá arkus kosinus hodnot sloupců ve stupních.

Acosh

Vypočítá hyperbolický arkuskosinus hodnot sloupců.

Acot

Vypočítá arkuskotangens hodnot sloupců.

AcotDegrees

Vypočítá arkuskotangens hodnot sloupců ve stupních.

Acoth

Vypočítá hyperbolický arkuskotangens hodnot sloupců.

Acsc

Vypočítá arccosecant hodnot sloupců.

AcscDegrees

Vypočítá arkuskosekans hodnot sloupců ve stupních.

Asec

Vypočítá arkusekant hodnot sloupců.

AsecDegrees

Vypočítá arkusekans hodnot sloupců ve stupních.

Asech

Vypočítá hyperbolický arkusekans hodnot sloupců.

Asin

Vypočítá arkus sinus hodnot sloupce.

AsinDegrees

Vypočítá arkus sinus hodnot sloupce ve stupních.

Asinh

Vypočítá hyperbolický arkus sinus hodnot sloupců.

Atan

Vypočítá arkus tangens hodnot sloupců.

AtanDegrees

Vypočítá arkus tangens hodnot sloupců ve stupních.

Atanh

Vypočítá hyperbolický arkus tangens hodnot sloupců.

Cos

Vypočítá kosinus hodnot sloupců.

CosDegrees

Vypočítá kosinus hodnot sloupců ve stupních.

Cosh

Vypočítá hyperbolický kosinus hodnot sloupců.

Cot

Vypočítá kotangens pro hodnoty sloupce.

CotDegrees

Vypočítá kotangens hodnot sloupců ve stupních.

Kolébka

Vypočítá hyperbolický kotangens pro hodnoty sloupce.

Csc

Vypočítá kosekans pro hodnoty sloupce.

CscDegrees

Vypočítá kosekans pro hodnoty sloupce ve stupních.

Csch

Vypočítá hyperbolický kosekans hodnot sloupců.

DegreesToRadians

Převede stupně na radiány.

Sec

Vypočítá sekans hodnot ve sloupci.

aSecDegrees

Vypočítá sekans hodnot sloupců ve stupních.

aSech

Vypočítá hyperbolický sekans hodnot sloupců.

Znaménko

Vrátí znaménko hodnot sloupce.

Sinus

Vypočítá sinus hodnot sloupce.

Sinc

Vypočítá hodnotu sinus-kosinus hodnot sloupce.

SinDegrees

Vypočítá sinus hodnot sloupců ve stupních.

Sinh

Vypočítá hyperbolický sinus hodnot sloupce.

Tan

Vypočítá tangens hodnot sloupců.

TanDegrees

Vypočítá tangens argumentu ve stupních.

Tanh

Vypočítá hyperbolický tangens hodnot sloupců.

Technické poznámky

Při výběru více než jednoho sloupce jako druhého operátoru buďte opatrní. Výsledky jsou snadno pochopitelné, pokud je operace jednoduchá, například přidání konstanty do všech sloupců.

Předpokládejme, že datová sada má více sloupců a přidáte ji do sebe. Ve výsledcích se každý sloupec přidá sám k sobě následujícím způsobem:

Číslo 1 Číslo 2 Číslo 3 Přidat(Num1_Num1) Přidat(Num2_Num2) Přidat(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Pokud potřebujete provádět složitější výpočty, můžete zřetězených více instancí operace Použít matematickou operaci. Můžete například přidat dva sloupce pomocí jedné instance použít matematickou operaci a pak použít jinou instanci Použít matematickou operaci k vydělení součtu konstantou, abyste získali střední hodnotu.

Případně můžete použít jednu z následujících komponent k provedení všech výpočtů najednou pomocí skriptu SQL, R nebo Pythonu:

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.