Créer des dépendances de tâches pour exécuter des tâches qui dépendent d’autres tâches

Article
13/06/2024

Avec les dépendances de tâches Batch, vous créez des tâches dont l’exécution est planifiée sur des nœuds de calcul à condition qu’une ou plusieurs tâches parentes aient été exécutées. Par exemple, vous pouvez créer un travail qui restitue chaque image d’un film 3D avec des tâches parallèles distinctes. La dernière tâche fusionne les images restituées dans la vidéo complète uniquement après restitution de toutes les images. En d’autres termes, la tâche finale est dépendante des tâches parentes précédentes.

Voici quelques scénarios dont les dépendances de tâche sont utiles :

des charges de travail MapReduce dans le cloud ;
des travaux dont les tâches de traitement des données peuvent être exprimées sous la forme d’un graphe orienté acyclique (DAG) ;
Processus de pré-rendu et de post-rendu dans lesquels chaque tâche doit s’achever avant que la tâche suivante puisse commencer.
tout autre travail dont les tâches en aval dépendent de la sortie des tâches en amont.

Par défaut, les tâches dépendantes sont planifiées pour que leur exécution ait lieu uniquement après la fin de l’exécution de la tâche parente. Vous pouvez éventuellement indiquer une action de dépendance pour remplacer le comportement par défaut et exécuter la tâche dépendante même en cas d’échec de la tâche parente.

Cet article explique comment configurer les dépendances de tâches à l’aide de la bibliothèque Batch .NET. Nous allons tout d’abord vous montrer comment activer la dépendance de tâches dans vos travaux, puis vous expliquer comment configurer une tâche avec des dépendances. Nous décrivons également comment spécifier une action de dépendance pour exécuter des tâches dépendantes en cas d’échec de la tâche parente. Pour finir, nous passerons en revue les scénarios de dépendance pris en charge par Batch.

Activation des dépendances de tâches

Pour utiliser les dépendances de tâches dans votre application Batch, vous devez d’abord configurer la tâche afin d’utiliser des dépendances de tâches. Dans Batch.NET, activez la dépendance de tâches sur votre CloudJob en définissant sa propriété UsesTaskDependencies sur true :

CloudJob unboundJob = batchClient.JobOperations.CreateJob( "job001",
    new PoolInformation { PoolId = "pool001" });

// IMPORTANT: This is REQUIRED for using task dependencies.
unboundJob.UsesTaskDependencies = true;

Dans l’extrait de code précédent, « batchClient » est une instance de la classe BatchClient.

Création de tâches dépendantes

Pour créer une tâche qui dépend de l’exécution d’une ou plusieurs tâches parentes, vous devez indiquer que la tâche « dépend » des autres tâches. Dans Batch .NET, configurez la propriété CloudTask.DependsOn avec une instance de la classe TaskDependencies :

// Task 'Flowers' depends on completion of both 'Rain' and 'Sun'
// before it is run.
new CloudTask("Flowers", "cmd.exe /c echo Flowers")
{
    DependsOn = TaskDependencies.OnIds("Rain", "Sun")
},

Cet extrait de code crée une tâche dépendante avec l’ID de tâche « Flowers ». La tâche « Flowers » dépend des tâches « Rain » et « Sun ». La tâche « Flowers » est programmée pour s’exécuter sur un nœud de calcul uniquement après la réussite de l’exécution des tâches « Rain » et « Sun ».

Notes

Par défaut, une tâche est considérée comme réussie lorsqu’elle se trouve à l’état terminé et que son code de sortie est 0. Dans Batch .NET, la valeur de propriété CloudTask.State doit être Completed et la valeur de propriété TaskExecutionInformation.ExitCode de CloudTask doit être de 0. Pour découvrir comment changer cela, consultez la section Actions de dépendance.

scénarios de dépendance

Vous pouvez utiliser trois scénarios de dépendance de tâches de base dans Azure Batch : un-à-un, un-à-plusieurs et dépendance de plage d’ID de tâche. Ces trois scénarios peuvent être combinés pour créer un quatrième scénario : plusieurs-à-plusieurs.

Scénario	Exemple	Illustration
Un-à-un	taskB dépend de taskA taskB n’est pas planifié pour être exécuté tant que l’exécution de taskA n’est pas terminée
Un-à-plusieurs	taskC dépend de taskA et taskB taskC n’est pas planifié pour être exécuté tant que l’exécution de taskA et taskB n’est pas terminée
Plage d’ID de tâche	taskD dépend d’une plage de tâches taskD n’est pas planifié pour être exécuté tant que l’exécution des tâches avec l’ID 1 à 10 n’est pas terminée

Conseil

Vous pouvez créer des relations plusieurs-à-plusieurs où, par exemple, les tâches C, D, E et F dépendent toutes des tâches A et B. Cela est utile, par exemple, dans les scénarios de prétraitement parallélisés où vos tâches en aval dépendent de la sortie de plusieurs tâches en amont.

Dans les exemples de cette section, une tâche dépendante s’exécute uniquement après l’achèvement des tâches parentes. Ce comportement est le comportement par défaut d’une tâche dépendante. Vous pouvez exécuter une tâche dépendante après l’échec d’une tâche parente en indiquant l’action de dépendance destinée à se substituer au comportement par défaut.

Un à un

Dans une relation un-à-un, une tâche dépend de la bonne exécution d’une tâche parente. Pour créer la dépendance, fournissez un ID de tâche unique à la méthode statique TaskDependencies.OnId quand vous renseignez la propriété CloudTask.DependsOn.

// Task 'taskA' doesn't depend on any other tasks
new CloudTask("taskA", "cmd.exe /c echo taskA"),

// Task 'taskB' depends on completion of task 'taskA'
new CloudTask("taskB", "cmd.exe /c echo taskB")
{
    DependsOn = TaskDependencies.OnId("taskA")
},

Un-à-plusieurs

Dans une relation un-à-plusieurs, une tâche dépend de la bonne exécution de plusieurs tâches parentes. Pour créer la dépendance, fournissez une collection d’ID de tâche spécifiques à la méthode statique TaskDependencies.OnIds quand vous renseignez la propriété CloudTask.DependsOn.

// 'Rain' and 'Sun' don't depend on any other tasks
new CloudTask("Rain", "cmd.exe /c echo Rain"),
new CloudTask("Sun", "cmd.exe /c echo Sun"),

// Task 'Flowers' depends on completion of both 'Rain' and 'Sun'
// before it is run.
new CloudTask("Flowers", "cmd.exe /c echo Flowers")
{
    DependsOn = TaskDependencies.OnIds("Rain", "Sun")
},

Important

La création de la tâche dépendante échouera si la longueur combinée des ID de tâche parente dépasse 64 000 caractères. Pour spécifier un grand nombre de tâches parentes, envisagez plutôt d’utiliser une plage d’ID de tâche.

Plage d’ID de tâche

En cas de dépendance à une plage de tâches parentes, une tâche dépend de la bonne exécution des tâches dont les ID sont compris dans une plage que vous spécifiez.

Pour créer la dépendance, fournissez le premier et le dernier ID de tâche dans la plage à la méthode statique TaskDependencies.OnIdRange quand vous renseignez la propriété CloudTask.DependsOn.

Important

Lorsque des plages de numéros de tâche sont utilisées pour les dépendances, seules les tâches dont le numéro représente des valeurs entières sont sélectionnées par la plage. Par exemple, la plage 1..10 sélectionne les tâches 3 et 7, mais pas 5flamingoes.

Les zéros de gauche n’étant pas significatifs pour l’évaluation des dépendances aux plages, les tâches ayant pour identificateurs de chaîne 4, 04 et 004 se trouvent toutes dans la plage. Comme elles sont toutes traitées comme correspondant à la tâche 4, la première à se terminer satisfait la dépendance.

Pour que la tâche dépendante soit exécutée, chaque tâche de la plage doit satisfaire la dépendance soit en se terminant avec succès, soit en échouant avec une erreur associée à une action de dépendance définie sur Satisfy.

// Tasks 1, 2, and 3 don't depend on any other tasks. Because
// we will be using them for a task range dependency, we must
// specify string representations of integers as their ids.
new CloudTask("1", "cmd.exe /c echo 1"),
new CloudTask("2", "cmd.exe /c echo 2"),
new CloudTask("3", "cmd.exe /c echo 3"),

// Task 4 depends on a range of tasks, 1 through 3
new CloudTask("4", "cmd.exe /c echo 4")
{
    // To use a range of tasks, their ids must be integer values.
    // Note that we pass integers as parameters to TaskIdRange,
    // but their ids (above) are string representations of the ids.
    DependsOn = TaskDependencies.OnIdRange(1, 3)
},

Actions de dépendance

Par défaut, une tâche dépendante ou un ensemble de tâches s’exécute uniquement après la fin d’une tâche parente. Dans certains scénarios, vous pouvez exécuter des tâches dépendantes même si la tâche parente échoue. Vous pouvez remplacer le comportement par défaut en spécifiant une action de dépendance qui indique si une tâche dépendante peut être exécutée.

Par exemple, supposons qu’une tâche dépendante attend des données de l’achèvement de la tâche amont. Si la tâche en amont échoue, la tâche dépendante peut toujours être en mesure de s’exécuter en utilisant des données plus anciennes. Dans ce cas, une action de dépendance peut spécifier que la tâche dépendante peut être exécutée malgré l’échec de la tâche parente.

Une action de dépendance est basée sur une condition de sortie pour la tâche parente. Vous pouvez indiquer une action de dépendance pour toutes les conditions de sortie suivantes :

Lorsqu’une erreur de prétraitement se produit.
Lorsqu’une erreur de chargement de fichier se produit. Si la tâche se termine avec un code de sortie qui a été spécifié via exitCodes ou exitCodeRanges, puis rencontre une erreur de chargement de fichier, l’action spécifiée par le code de sortie est prioritaire.
Lorsque la tâche se termine avec un code de sortie défini par la propriété ExitCodes.
Lorsque la tâche se termine avec un code de sortie dans une plage définie par la propriété ExitCodeRanges.
Le cas par défaut : si la tâche se termine avec un code de sortie non défini par ExitCodes ou ExitCodeRanges, ou si la tâche se termine avec une erreur de prétraitement et si la propriété PreProcessingError n’est pas définie, ou si la tâche échoue avec une erreur de chargement de fichier et si la propriété FileUploadError n’est pas définie.

Pour .NET, ces conditions sont définies comme propriétés de la classe ExitConditions.

Pour spécifier une action de dépendance, définissez la propriété ExitOptions.DependencyAction pour la condition de sortie sur l’une des valeurs suivantes :

Satisfy : indique que les tâches dépendantes sont autorisées à s’exécuter si la tâche parente se termine avec une erreur spécifiée.
Bloquer : indique que les tâches dépendantes ne sont pas autorisées à s’exécuter.

Le paramètre par défaut de la propriété DependencyAction est Satisfy pour le code de sortie 0 et Block pour toutes les autres conditions de sortie.

L’extrait de code suivant définit la propriété DependencyAction d’une tâche parente. Si la tâche parente se termine avec une erreur de prétraitement ou avec les codes d’erreur spécifiés, la tâche dépendante est bloquée. Si la tâche parente se termine avec une autre erreur non nulle, la tâche dépendante peut être exécutée.

// Task A is the parent task.
new CloudTask("A", "cmd.exe /c echo A")
{
    // Specify exit conditions for task A and their dependency actions.
    ExitConditions = new ExitConditions
    {
        // If task A exits with a pre-processing error, block any downstream tasks (in this example, task B).
        PreProcessingError = new ExitOptions
        {
            DependencyAction = DependencyAction.Block
        },
        // If task A exits with the specified error codes, block any downstream tasks (in this example, task B).
        ExitCodes = new List<ExitCodeMapping>
        {
            new ExitCodeMapping(10, new ExitOptions() { DependencyAction = DependencyAction.Block }),
            new ExitCodeMapping(20, new ExitOptions() { DependencyAction = DependencyAction.Block })
        },
        // If task A succeeds or fails with any other error, any downstream tasks become eligible to run 
        // (in this example, task B).
        Default = new ExitOptions
        {
            DependencyAction = DependencyAction.Satisfy
        }
    }
},
// Task B depends on task A. Whether it becomes eligible to run depends on how task A exits.
new CloudTask("B", "cmd.exe /c echo B")
{
    DependsOn = TaskDependencies.OnId("A")
},

Exemple de code

L’exemple de projet TaskDependencies sur GitHub illustre les éléments suivants :

Comment activer la dépendance d’une tâche
Comment créer des tâches qui dépendent d’autres tâches
Comment exécuter ces tâches sur un pool de nœuds de calcul

Étapes suivantes

Découvrez la fonctionnalité packages d’application de Batch, qui est un moyen facile de déployer et contrôler les versions des applications exécutées par vos tâches sur des nœuds de calcul.
Découvrez la vérification des erreurs pour les travaux et les tâches.

Partager via