Partager via


Appliquer une opération mathématique

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Applique une opération mathématique aux valeurs de colonne

Catégorie : fonctions statistiques

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module appliquer l’opération mathématique dans Machine Learning Studio (classic) pour créer des calculs qui sont appliqués aux colonnes numériques dans le jeu de données d’entrée.

Les opérations mathématiques prises en charge comprennent des fonctions arithmétiques courantes comme la multiplication et la division, des fonctions trigonométriques, une variété de fonctions d’arrondi et des fonctions spéciales utilisées dans la science des données, comme les fonctions gamma et d’erreur.

Une fois que vous avez défini une opération et exécuté l’expérience, les valeurs sont ajoutées à votre jeu de données. Selon la façon dont vous configurez le module, vous pouvez :

  • Ajouter les résultats à votre jeu de données. Particulièrement utile pour vérifier le résultat de l’opération.
  • Remplacer les valeurs de colonne par les nouvelles valeurs calculées.
  • Générer une nouvelle colonne pour les résultats et ne pas afficher les données d’origine.

Conseil

Ce module effectue une seule opération mathématique à la fois. Pour les opérations mathématiques complexes, nous vous recommandons d’utiliser ces modules à la place :

Recherchez l’opération dont vous avez besoin dans les catégories suivantes :

  • De base

    Les fonctions de la catégorie De base peuvent être utilisées pour manipuler une seule valeur ou une colonne de valeurs. Par exemple, vous pouvez obtenir la valeur absolue de tous les nombres d’une colonne, ou calculer la racine carrée de chaque valeur dans une colonne.

  • Compare

    Les fonctions de la catégorie Comparer sont toutes utilisées pour la comparaison : vous pouvez comparer des paires de valeurs de deux colonnes, ou comparer chaque valeur d’une colonne à une constante spécifiée. Par exemple, vous pouvez comparer des colonnes pour déterminer si les valeurs étaient identiques dans deux jeux de données. Vous pouvez également utiliser une constante, par exemple, une valeur maximale autorisée, pour rechercher les valeurs hors norme dans une colonne numérique.

  • Opérations

    Cette catégorie comprend les fonctions mathématiques de base : addition, soustraction, multiplication et Division. Vous pouvez utiliser des colonnes ou des constantes. Par exemple, vous pouvez ajouter la valeur de la colonne A à la valeur de la colonne B. Vous pouvez également soustraire une constante, par exemple, une moyenne calculée précédemment, de chaque valeur de la colonne A.

  • Arrondi

    Cette catégorie comprend une variété de fonctions permettant d’effectuer des opérations telles que l’arrondi, le plafond, le plancher et la troncation à différents niveaux de précision. Vous pouvez spécifier le niveau de précision pour les nombres décimaux et entiers.

  • Fonctions mathématiques spéciales

    La catégorie Spécial comprend des fonctions mathématiques utilisées en particulier dans la science des données, comme les intégrales elliptiques et la fonction d’erreur gaussienne.

  • Fonctions trigonométriques

    Cette catégorie comprend toutes les fonctions trigonométriques standard. Par exemple, vous pouvez convertir des radians en degrés, ou des fonctions de calcul comme la tangente en radians ou degrés. Ces fonctions sont unaires, ce qui signifie qu’elles prennent une seule colonne de valeurs comme entrée, appliquent la fonction trigonométrique et retournent une colonne de valeurs en résultat. Par conséquent, vous devez vérifier que la colonne d’entrée a le type approprié et qu’elle contient le type de valeur qui convient pour l’opération spécifiée.

Exemples

Pour obtenir des exemples d’utilisation de l' opération d’application mathématique, consultez les exemples d’expériences suivants dans le Azure ai Gallery:

  • Quantification des couleurs: un ensemble de valeurs de colonne est soustrait d’un autre, puis les résultats sont au carré.

  • Prédiction de la relation client: la constante 1 est ajoutée à toutes les valeurs d’une colonne pour faire la distinction entre les zéros et les valeurs manquantes.

  • Prédiction des retards de vol: illustre diverses opérations, y compris l’arrondi et la Division.

  • Marketing direct: utilise des opérations de comparaison pour déterminer si les scores de probabilité remplissent une valeur requise.

Utilisation de l’opération d’application mathématique

Le module Appliquer une opération mathématique nécessite un jeu de données avec au moins une colonne contenant uniquement des nombres. Les nombres peuvent être discrets ou continus, mais doivent avoir un type de données numérique et non une chaîne.

Vous pouvez appliquer la même opération à plusieurs colonnes numériques, mais toutes les colonnes doivent se trouver dans le même jeu de données.

Chaque instance de ce module peut exécuter un seul type d’opération à la fois. Pour effectuer des opérations mathématiques complexes, vous devez peut-être chaîner plusieurs instances du module Appliquer une opération mathématique.

  1. Ajoutez le module appliquer l’opération mathématique à votre expérience. Vous pouvez trouver ce module dans la catégorie des fonctions statistiques .

  2. Connectez un jeu de données contenant au moins une colonne numérique.

  3. Cliquez sur Catégorie pour sélectionner le type de l’opération mathématique à effectuer.

    Par exemple, pour effectuer une opération arithmétique de base sur les colonnes, choisissez opérations. Pour obtenir un logarithme ou un plafond, choisissez de base. Pour comparer des colonnes de valeurs, utilisez la comparaison.

    Conseil

    Toutes les autres options changent en fonction du type d’opération mathématique que vous choisissez. En outre, toute modification apportée à la catégorie réinitialise toutes les autres options. Par conséquent, assurez-vous d’abord de sélectionner une catégorie .

  4. Choisissez une opération spécifique dans la liste de cette catégorie.

  5. Sélectionnez une ou plusieurs colonnes sources sur lesquelles effectuer le calcul.

    • Toute colonne que vous choisissez doit avoir un type de données numérique.
    • La plage de données doit être valide pour l’opération mathématique sélectionnée. Sinon, une erreur ou un résultat NaN (autre qu’un nombre) peut se produire. Par exemple, Ln(-1,0) est une opération non valide qui génère la valeur NaN.
  6. Définissez les paramètres supplémentaires nécessaires pour chaque type d’opération.

  7. Utilisez l’option Mode de sortie pour indiquer comment vous voulez que l’opération mathématique soit générée :

    • Append. Toutes les colonnes utilisées comme entrées sont incluses dans le jeu de données de sortie, une colonne supplémentaire est ajoutée pour contenir les résultats de l’opération mathématique.
    • Inplace. Les valeurs des colonnes utilisées comme entrées sont remplacées par les nouvelles valeurs calculées.
    • ResultOnly. Une seule colonne est retournée avec les résultats de l’opération mathématique.
  8. Exécutez l’expérience, ou cliquez avec le bouton droit sur le module appliquer l’opération mathématique , puis sélectionnez exécuter la sélection.

Résultats

Si vous générez les résultats à l’aide des options Append ou ResultOnly, les en-têtes de colonne du jeu de données retourné indiquent l’opération et les colonnes qui ont été utilisées. Par exemple, si vous comparez deux colonnes à l’aide de l’opérateur Equals, les résultats ressemblent à ceci :

  • Equals(Col2_Col1), qui indique que vous avez testé Col2 par rapport à Col1.
  • Equals(Col2_$10), qui indique que vous avez comparé la colonne 2 à la constante 10.

Même si vous utilisez l’option InPlace , les données sources ne sont pas supprimées ou modifiées ; la colonne du jeu de données d’origine est toujours disponible dans Studio (Classic). Pour voir les données d’origine, vous pouvez connecter le module Ajouter des colonnes et le joindre à la sortie du module Appliquer une opération mathématique.

Opérations mathématiques de base

Les fonctions de la catégorie De base prennent généralement une seule valeur d’une colonne, effectuent l’opération prédéfinie et retournent une seule valeur. Pour certaines fonctions, vous pouvez spécifier une constante comme deuxième argument.

Machine Learning prend en charge les fonctions suivantes dans la catégorie de base :

Abs

Retourne la valeur absolue des colonnes sélectionnées.

Atan2

Retourne une tangente inverse à quatre quadrants.

Sélectionnez les colonnes qui contiennent les coordonnées de point. Pour le deuxième argument, qui correspond à la coordonnée x, vous pouvez également spécifier une constante.

Correspond à la fonction ATAN2 dans Matlab.

Conj

Retourne le conjugué des valeurs de la colonne sélectionnée.

CubeRoot

Retourne la racine cube des valeurs de la colonne sélectionnée.

DoubleFactorial**

Calcule la factorielle double des valeurs de la colonne sélectionnée. La factorielle double est une extension de la fonction factorielle normale et est indiquée sous la forme x!!.

Eps

Retourne la taille de l’écart entre la valeur actuelle et le plus grand nombre suivant à double précision. Correspond à la fonction EPS dans Matlab.

Exp

Retourne e élevé à la puissance de la valeur de la colonne sélectionnée. C’est l’équivalent de la fonction Excel EXP.

Exp2

Retourne la valeur exponentielle en base 2 des arguments, résolution de y = x * 2t, où t est une colonne de valeurs contenant des exposants.

Pour EXP2 , vous pouvez spécifier un deuxième argument x, qui peut être une constante ou une autre colonne de valeurs.

Dans deuxième argument type, indiquez si vous devez fournir le multiplicateur t comme constante ou une valeur dans une colonne.

Vous pouvez sélectionner une seule colonne avec les valeurs d’exposant, ou taper la valeur d’exposant dans la zone de texte constante du deuxième argument . Ensuite, dans jeu de colonnes, sélectionnez la colonne qui contient les valeurs d’exposant.

Par exemple, si vous sélectionnez une colonne avec les valeurs {0,1,2,3,4,5} pour le multiplicateur et l’exposant, la fonction retourne {0, 2, 8, 24, 64 160).

ExpMinus1

Retourne l’exposant négatif des valeurs de la colonne sélectionnée.

Factorielle

Retourne la factorielle des valeurs de la colonne sélectionnée.

Hypotenuse

Calcule l’hypoténuse d’un triangle dans lequel la longueur d’un côté est une colonne de valeurs, et la longueur du deuxième côté est une constante ou deux colonnes.

ImaginaryPart

Renvoie la partie imaginaire des valeurs dans la colonne sélectionnée.

Ln

Retourne le logarithme naturel des valeurs de la colonne sélectionnée.

LnPlus1

Retourne le logarithme naturel plus un des valeurs de la colonne sélectionnée.

Journal

Retourne le journal des valeurs de la colonne sélectionnée, en fonction de la base spécifiée.

Vous pouvez spécifier la base (le deuxième argument) en choisissant une constante ou une autre colonne de valeurs.

Log10

Retourne le logarithme de base 10 des valeurs dans la colonne sélectionnée.

Log2

Retourne le logarithme de base 2 pour les valeurs de la colonne sélectionnée.

NthRoot

Retourne la racine énième de la valeur, à l’aide d’une valeur n que vous spécifiez.

Sélectionnez les colonnes pour lesquelles vous voulez calculer la racine, à l’aide de l’option ColumnSet.

Dans Deuxième type d’argument, sélectionnez une autre colonne qui contient la racine ou spécifiez une constante à utiliser comme racine.

Si le deuxième argument est une colonne, chaque valeur de la colonne est utilisée comme valeur de n pour la ligne correspondante. Si le deuxième argument est une constante, tapez la valeur de n dans la zone de texte constante du deuxième argument .

Pow

Calcule X élevé à la puissance Y pour chacune des valeurs de la colonne sélectionnée.

Tout d’abord, sélectionnez les colonnes qui contiennent la base, qui doit être une valeur float, à l’aide de l’option ColumnSet .

Dans Deuxième type d’argument, sélectionnez la colonne qui contient l’exposant ou spécifiez une constante à utiliser comme exposant.

Si le deuxième argument est une colonne, chaque valeur de la colonne est utilisée comme exposant de la ligne correspondante. Si le deuxième argument est une constante, tapez la valeur de l'exposant dans la zone de texte Constante comme deuxième argument.

RealPart

Retourne la partie réelle des valeurs dans la colonne sélectionnée.

Sqrt

Retourne la racine carrée des valeurs de la colonne sélectionnée.

SqrtPi

Pour chaque valeur de la colonne sélectionnée, multiplie la valeur par pi, puis retourne la racine carrée du résultat.

Carré

Élève au carré les valeurs de la colonne sélectionnée.

Opérations de comparaison

utilisez les fonctions de comparaison de Machine Learning Studio (classic) chaque fois que vous avez besoin de tester deux ensembles de valeurs. Par exemple, dans une expérimentation, vous pouvez être amené à effectuer ces opérations de comparaison :

  • Évaluer une colonne du modèle de score de probabilité par rapport à une valeur de seuil.
  • Déterminez si deux jeux de résultats sont identiques et, pour chaque ligne différente, ajoutez un indicateur FALSe qui peut être utilisé pour un traitement ou un filtrage ultérieur.

EqualTo

Retourne True si les valeurs sont identiques.

GreaterThan

Retourne True si les valeurs du Jeu de colonnes sont supérieures à la constante spécifiée ou supérieures aux valeurs correspondantes dans la colonne de comparaison.

GreaterThanOrEqualTo

Retourne True si les valeurs du Jeu de colonnes sont supérieures ou égales à la constante spécifiée ou supérieures ou égales aux valeurs correspondantes dans la colonne de comparaison.

LessThan

Retourne True si les valeurs du Jeu de colonnes sont inférieures à la constante spécifiée ou inférieures aux valeurs correspondantes dans la colonne de comparaison.

LessThanOrEqualTo

Retourne True si les valeurs du Jeu de colonnes sont inférieures ou égales à la constante spécifiée ou inférieures ou égales aux valeurs correspondantes dans la colonne de comparaison.

NotEqualTo

Renvoie True si les valeurs figurant dans Jeu de colonnes ne sont pas égales à la constante ou à la colonne de comparaison, et False dans le cas contraire.

PairMax

Renvoie la valeur supérieure entre celle figurant dans Jeu de colonnes ou celle figurant dans la colonne de constantes ou de comparaison.

PairMin

Retourne la valeur inférieure : la valeur du Jeu de colonnes ou la valeur de la constante ou de la colonne de comparaison

Opérations arithmétiques

Comprend les opérations arithmétiques de base : l’addition et la soustraction, la Division et la multiplication. Comme la plupart des opérations sont binaires (nécessitent deux nombres), vous devez d’abord choisir l’opération, puis choisir la colonne ou les nombres à utiliser dans les premier et deuxième arguments.

L’ordre dans lequel vous choisissez les colonnes pour la division et la soustraction peut paraître contre-intuitif, toutefois, pour faciliter la compréhension des résultats, l’en-tête de colonne fournit le nom de l’opération ainsi que l’ordre dans lequel les colonnes ont été utilisées.

Opération Num1 Num2 Colonne de résultats Valeur de résultat
Addition 1 5 Add(Num2_Num1) 4
Multiplication 1 5 Multiple(Num2_Num1) 5
Soustraction 1 5 Subtract(Num2_Num1) 4
Soustraction 0 1 Subtract(Num2_Num1) 0
Division 1 5 Divide(Num2_Num1) 5
Division 0 1 Divide(Num2_Num1) Infini

Ajouter

Spécifiez les colonnes sources à l’aide du jeu de colonnes, puis ajoutez à ces valeurs un nombre spécifié dans argument de l' opération constante.

Pour ajouter les valeurs dans deux colonnes, choisissez une ou plusieurs colonnes à l’aide du jeu de colonnes, puis choisissez une deuxième colonne à l’aide de l' argument Operation.

Diviser

Divise les valeurs figurant dans le Jeu de colonnes par une constante ou par les valeurs de colonne définies dans Argument de l'opération. En d’autres termes, vous choisissez d’abord le diviseur, puis le dividende. La valeur de sortie est le quotient.

Multiplier

Multiplie les valeurs figurant dans le Jeu de colonnes par la constante ou les valeurs de colonne spécifiées.

Soustraire

Spécifiez le nombre à soustraire ( diminuteur) à l’aide de la liste déroulante argument de l' opération . Vous pouvez choisir une constante ou une colonne de valeurs. Ensuite, spécifiez la colonne de valeurs à utiliser ( diminuende), en choisissant une autre colonne, à l’aide de la deuxième option de jeu de colonnes .

Vous pouvez soustraire une constante de chaque valeur dans une colonne de valeurs, mais pas l’opération inverse. Pour ce faire, utilisez plutôt l’addition.

Opérations d’arrondi

Studio (Classic) prend en charge plusieurs opérations d’arrondi. Pour de nombreuses opérations, vous devez spécifier le degré de précision à utiliser pour l’arrondi. Vous pouvez utiliser un niveau de précision statique, spécifié comme une constante, ou appliquer une valeur de précision dynamique obtenue à partir d’une colonne de valeurs.

  • Si vous utilisez une constante, définissez Type de précision sur Constante, puis tapez le nombre de chiffres (un entier) dans la zone de texte Précision de la constante. Si vous tapez un nombre qui n’est pas un entier, le module ne génère pas d’erreur, mais les résultats peuvent être inattendus.

  • Pour utiliser une valeur de précision différente pour chaque ligne de votre jeu de données, définissez Type de précision sur ColumnSet, puis choisissez la colonne qui contient les valeurs de précision appropriées.

Ceiling

Renvoie la valeur plafond des valeurs figurant dans le jeu de colonnes.

CeilingPower2

Renvoie la valeur plafond élevée au carré des valeurs figurant dans le jeu de colonnes.

Floor

Renvoie la valeur plancher des valeurs figurant dans le jeu de colonnes, selon la précision spécifiée.

Mod

Renvoie la partie fractionnaire des valeurs figurant dans le jeu de colonnes, selon la précision spécifiée.

Quotient

Renvoie la partie fractionnaire des valeurs figurant dans le jeu de colonnes, selon la précision spécifiée.

Reste

Renvoie le reste des valeurs figurant dans le jeu de colonnes.

RoundDigits

Renvoie les valeurs figurant dans le jeu de colonnes, arrondies selon la règle des 4/5 au nombre de chiffres spécifié.

RoundDown

Renvoie les valeurs figurant dans le jeu de colonnes, arrondies à la valeur inférieure comportant le nombre de chiffres spécifié.

RoundUp

Renvoie les valeurs figurant dans le jeu de colonnes, arrondies à la valeur supérieure comportant le nombre de chiffres spécifié.

ToEven

Renvoie les valeurs figurant dans Jeu de colonnes, arrondies au nombre pair entier le plus proche.

ToOdd

Renvoie les valeurs figurant dans Jeu de colonnes, arrondies au nombre impair entier le plus proche.

Tronquer

Tronque les valeurs figurant dans Jeu de colonnes en supprimant tous les chiffres non autorisés par la précision spécifiée.

Fonctions mathématiques spéciales

Cette catégorie comprend des fonctions mathématiques spécialisées souvent utilisées dans la science des données. Sauf indication contraire, la fonction est unaire et retourne le calcul spécifié pour chaque valeur de la ou des colonnes sélectionnées.

Bêta

Retourne la valeur de la fonction bêta de Euler.

EllipticIntegralE

Retourne la valeur de l’intégrale elliptique incomplète.

EllipticIntegralK

Retourne la valeur de l’intégrale elliptique complète (K).

Erf

Retourne la valeur de la fonction d’erreur.

La fonction d’erreur (également appelée fonction d’erreur de Gauss) est une fonction spéciale de la forme sigmoïde qui est utilisée en probabilités pour décrire la diffusion.

Erfc

Retourne la valeur de la fonction d’erreur complémentaire.

Erfc est défini par 1 – erf(x).

ErfScaled

Retourne la valeur de la fonction d’erreur complémentaire normalisée.

La version normalisée de la fonction d’erreur peut être utilisée pour éviter le soupassement arithmétique.

ErfInverse

Retourne la valeur de la fonction erf inverse.

ExponentialIntegralEin

Retourne la valeur de l’intégrale exponentielle Ei.

Gamma

Retourne la valeur de la fonction gamma.

GammaLn

Retourne la valeur du logarithme naturel de la fonction gamma.

GammaRegularizedP

Retourne la valeur de la fonction gamma incomplète régularisée.

Cette fonction prend un deuxième argument, qui peut être une constante ou une colonne de valeurs.

GammaRegularizedPInverse

Retourne la valeur de la fonction gamma incomplète régularisée inverse.

Cette fonction prend un deuxième argument, qui peut être une constante ou une colonne de valeurs.

GammaRegularizedQ

Retourne la valeur de la fonction gamma incomplète régularisée.

Cette fonction prend un deuxième argument, qui peut être une constante ou une colonne de valeurs.

GammaRegularizedQInverse

Retourne la valeur de la fonction gamma incomplète régularisée généralisée inverse.

Cette fonction prend un deuxième argument, qui peut être une constante ou une colonne de valeurs.

PolyGamma

Retourne la valeur de la fonction polygamma.

Cette fonction prend un deuxième argument, qui peut être une constante ou une colonne de valeurs.

Fonctions trigonométriques

Cette catégorie comprend la plupart des fonctions trigonométriques et trigonométriques inverses importantes. Toutes les fonctions trigonométriques sont unaires et ne nécessitent pas d’arguments supplémentaires.

Acos

Calcule l’arc cosinus des valeurs de colonne.

AcosDegree

Calcule l’arc cosinus des valeurs de colonne, en degrés.

Acosh

Calcule l’arc cosinus hyperbolique des valeurs de colonne.

Acot

Calcule l’arc cotangente des valeurs de colonne.

AcotDegrees

Calcule l’arc cotangente des valeurs de colonne, en degrés.

Acoth

Calcule l’arc cotangente hyperbolique des valeurs de colonne.

Acsc

Calcule l’arc cosécante des valeurs de colonne.

AcscDegrees

Calcule l’arc cosécante des valeurs de colonne, en degrés.

Asec

Calcule l’arc sécante des valeurs de colonne.

AsecDegrees

Calcule l’arc sécante des valeurs de colonne, en degrés.

Asech

Calcule l’arc sécante hyperbolique des valeurs de colonne.

Asin

Calcule l’arc sinus des valeurs de colonne.

AsinDegrees

Calcule l’arc sinus des valeurs de colonne, en degrés.

Asinh

Calcule l’arc sinus hyperbolique des valeurs de colonne.

Atan

Calcule l’arc tangente des valeurs de colonne.

AtanDegrees

Calcule l’arc tangente des valeurs de colonne, en degrés.

Atanh

Calcule l’arc tangente hyperbolique des valeurs de colonne.

Cis

Retourne une fonction à valeur complexe, créée à partir du sinus et du cosinus, avec la définition CIS θ = cos θ + ISIN θ.

Cos

Calcule le cosinus des valeurs de colonne.

CosDegrees

Calcule le cosinus des valeurs de colonne, en degrés.

cosh

Calcule le cosinus hyperbolique des valeurs de colonne.

Cot

Calcule la cotangente des valeurs de colonne.

CotDegrees

Calcule la cotangente des valeurs de colonne, en degrés.

Coth

Calcule la cotangente hyperbolique des valeurs de colonne.

Csc

Calcule la cosécante des valeurs de colonne.

CscDegrees

Calcule la cosécante des valeurs de colonne, en degrés.

Csch

Calcule la cosécante hyperbolique des valeurs de colonne.

DegreesToRadians

Convertit les degrés en radians.

Sec

Calcule la sécante des valeurs de colonne.

aSecDegrees

Calcule la sécante des valeurs de colonne, en degrés.

aSech

Calcule la sécante hyperbolique des valeurs de colonne.

Signer

Retourne le signe des valeurs de colonne.

Sin

Calcule le sinus des valeurs de colonne.

Sinc

Calcule la valeur sinus-cosinus des valeurs de colonne.

SinDegrees

Calcule le sinus des valeurs de colonne, en degrés.

Sinh

Calcule le sinus hyperbolique des valeurs de colonne.

Tan

Calcule la tangente des valeurs de colonne.

TanDegrees

Calcule la tangente de l’argument, en degrés.

Tanh

Calcule la tangente hyperbolique des valeurs de colonne.

Notes techniques

Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.

Opérations sur plusieurs colonnes

Soyez prudent quand vous sélectionnez plusieurs colonnes comme deuxième opérateur. Les résultats sont faciles à comprendre si l’opération est simple, par exemple, ajouter une constante à toutes les colonnes.

Supposons que votre jeu de données comporte plusieurs colonnes et que vous ajoutez le jeu de données à lui-même. Dans les résultats, chaque colonne est ajoutée à elle-même, comme suit :

Num1 Num2 Num3 Add(Num1_Num1) Add(Num2_Num2) Add(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Si vous devez effectuer des calculs plus complexes, vous pouvez chaîner plusieurs instances du module Appliquer une opération mathématique. Par exemple, vous pouvez ajouter deux colonnes en utilisant une instance du module Appliquer une opération mathématique, puis utiliser une autre instance du module Appliquer une opération mathématique pour diviser la somme par une constante afin d’obtenir la moyenne.

vous pouvez également utiliser l’un des modules suivants pour effectuer tous les calculs à la fois, à l’aide de SQL, R ou du script Python :

Fonctions unaires et binaires

Dans une opération unaire, vous créez des calculs basés sur des valeurs de colonne sans faire référence à d’autres colonnes ou constantes.

Par exemple, vous pouvez tronquer les valeurs de la colonne à un certain degré de précision, arrondir les valeurs à la valeur supérieure ou inférieure, ou rechercher des valeurs plafond ou plancher.

Abs(X) est un exemple d'opération unaire, où X correspond à la colonne fournie en entrée.

Dans une opération binaire, vous spécifiez deux ensembles de valeurs. Le premier argument doit toujours être une colonne ou un ensemble de colonnes, tandis que le deuxième argument peut être un nombre que vous spécifiez en tant que constante ou une autre colonne.

Subtract(X,Y) est un exemple d'opération binaire utilisant deux colonnes, où X correspond à la première colonne que vous sélectionnez, et Y à la seconde.

Subtract(X,mean) est un exemple d'utilisation d'une opération binaire qui associe une colonne et une constante, où vous tapez la moyenne de la colonne sous la forme d'une constante que vous soustrayez de chaque valeur de la colonne X.

Gestion des nombres dans les colonnes catégoriques

La prise en charge des valeurs catégoriques présentées sous forme de nombres dépend de la fonction et du nombre d’arguments que prend la fonction.

  • Si votre opération comprend des nombres désignés en tant que colonnes catégoriques, une opération unaire peut être appliquée à des valeurs de données catégoriques.

  • Si une opération unaire est appliquée à une colonne catégorique, les valeurs de données catégoriques de la colonne d’entrée peuvent être transformées en valeurs de données catégoriques associées égales de la colonne de sortie. Dans ce cas, les valeurs sont fusionnées, de sorte que le nombre de valeurs de données catégoriques dans la sortie est toujours inférieur au nombre de valeurs dans l’entrée.

  • Si une opération binaire est appliquée à une colonne catégorique et à une autre colonne, le comportement attendu est le suivant :

    • Si l'autre colonne est dense, la colonne de sortie est catégorielle.

      Les valeurs de données catégorielles présentées dans l'entrée sont perdues.

      La colonne de sortie contient uniquement les valeurs qui sont présentes dans les données de la colonne de sortie.

    • Si l'autre colonne est éparse, la colonne de sortie est éparse.

    • Si les deux arguments d'une opération binaire sont des colonnes éparses, la colonne résultante contient des zéros d'arrière-plan dans toutes les positions où les deux colonnes d'entrée contiennent des zéros d'arrière-plan.

Traitement des colonnes éparses

Dans les opérations unaires, tous les éléments des colonnes éparses qui correspondent aux zéros d’arrière-plan ne sont pas traités.

Dans les opérations binaires, si un argument est une colonne éparse et que l’autre argument est une colonne dense, la colonne résultante est éparse avec tous les zéros d’arrière-plan propagés à partir de l’entrée de la colonne éparse.

Entrées attendues

Nom Type Description
Dataset Table de données Jeu de données d'entrée

Sorties

Nom Type Description
Jeu de données de résultats Table de données Jeu de données de résultats

Voir aussi

Fonctions statistiques
Liste alphabétique des modules