Cet article répertorie les principales questions relatives à Microsoft Genomics. Pour plus d’informations sur le service Microsoft Genomics, voir Qu’est-ce que Microsoft Genomics ?. Pour plus d’informations sur la résolution des problèmes, consultez notre Guide de résolution des problèmes.
Comment exécuter des flux de travail GATK4 sur Microsoft Genomics ?
Dans le fichier config.txt du service Microsoft Genomics, définissez l'argument process_name sur gatk4
. Notez que vous serez facturé au tarif standard.
Comment activer la compression de sortie ?
Vous pouvez compresser le fichier VCF ou GVCF de sortie à l’aide d’un argument facultatif pour la compression de sortie. Cela équivaut à exécuter -bgzip
suivi de -tabix
sur la sortie vcf ou gvcf afin de produire des fichiers .gz
(sortie bgzip) et .tbi
(sortie tabix). bgzip
compresse le fichier vcf ou gvcf, et tabix
crée un index pour le fichier compressé. L’argument est une valeur booléenne, qui est définie sur false
par défaut pour la sortie vcf, et sur true
par défaut pour la sortie gcvf. Pour l’utiliser sur la ligne de commande, spécifiez -bz
ou --bgzip-output
comme true
(exécuter bgzip et tabix) ou false
. Pour utiliser cet argument dans le fichier config.txt, ajoutez bgzip_output: true
ou bgzip_output: false
au fichier.
Quel contrat de niveau de service utiliser pour Microsoft Genomics ?
Dans 99,9 % des cas, nous garantissons que le service Microsoft Genomics sera disponible pour recevoir des demandes d’API de workflow. Pour plus d’informations, consultez Contrat de niveau de service.
Comment l’utilisation de Microsoft Genomics apparaît-elle sur ma facture ?
Les factures Microsoft Genomics indiquent le nombre de gigabases traitées par workflow. Pour plus d’informations, voir la tarification.
Où puis-je trouver une liste de l’ensemble des commandes et arguments possibles pour le client « msgen » ?
Vous pouvez obtenir une liste complète des commandes et arguments disponibles en exécutant msgen help
. Si aucun autre argument n’est fourni, vous pouvez vous reporter aux sections d’aide proposées, une pour chaque valeur submit
, list
, cancel
et status
. Pour obtenir de l’aide sur une commande spécifique, tapez msgen help command
. Par exemple, msgen help submit
répertorie toutes les options de type submit.
Quelles sont les commandes les plus couramment utilisées pour le client « msgen » ?
Les commandes les plus couramment utilisées pour le client msgen
sont des arguments :
Commande | Description du champ |
---|---|
list |
Renvoie une liste des travaux soumis. Pour les arguments, consultez msgen help list . |
submit |
Envoie une requête de workflow au service. Pour les arguments, consultez msgen help submit . |
status |
Renvoie l’état du workflow spécifié par --workflow-id . Voir aussi msgen help status . |
cancel |
Envoie une requête d’annulation du traitement du workflow spécifié par --workflow-id . Voir aussi msgen help cancel . |
Où puis-je obtenir la valeur de « --api-url-base » ?
Accédez au portail Azure, puis ouvrez la page de votre compte Microsoft Genomics. Sous le titre Gestion, choisissez Clés d’accès. Vous y trouvez à la fois l’URL de l’API et vos clés d’accès.
Où puis-je obtenir la valeur de « --access-key » ?
Accédez au portail Azure, puis ouvrez la page de votre compte Microsoft Genomics. Sous le titre Gestion, choisissez Clés d’accès. Vous y trouvez à la fois l’URL de l’API et vos clés d’accès.
Pourquoi ai-je besoin de deux clés d’accès ?
Vous avez besoin de deux clés d’accès au cas où vous souhaiteriez les mettre à jour (régénérer) sans interrompre l’utilisation du service. Par exemple, si vous souhaitez mettre à jour la première clé, tous les nouveaux flux de travail doivent utiliser la deuxième clé. Attendez ensuite que tous les flux de travail qui utilisent la première clé soient terminés avant de la mettre à jour.
Enregistrez-vous mes clés de compte de stockage ?
Votre clé de compte de stockage sert à créer des jetons d’accès à court terme pour le service Microsoft Genomics afin de lire les fichiers d’entrée et d’écrire les fichiers de sortie. La durée de vie par défaut d’un jeton est de 48 heures. Vous pouvez modifier la durée du jeton avec l’option -sas/--sas-duration
de la commande submit. La valeur est exprimée en heures.
Le service Microsoft Genomics stocke-t-il les données client ?
Non. Microsoft Genomics ne stocke pas de données client.
Quelle référence au génome puis-je utiliser ?
Voici les références prises en charge :
Informations de référence | Valeur de -pa/--process-args |
---|---|
b37 | R=b37m1 |
hg38 | R=hg38m1 |
hg38 (sans analyse alt) | R=hg38m1x |
hg19 | R=hg19m1 |
Comment formater les arguments de ligne de commande dans un fichier de configuration ?
msgen comprend les fichiers de configuration dont le format est le suivant :
Toutes les options sont fournies en tant que paires clé-valeur, les valeurs étant séparées des clés par le signe deux-points. Un espace blanc est ignoré.
Les lignes commençant par
#
sont ignorées.Tous les arguments de ligne de commande au format long peuvent être convertis en une clé en supprimant les tirets du début et en remplaçant les tirets entre les mots par des traits de soulignement. Voici quelques exemples de conversion :
Argument de ligne de commande Ligne du fichier de configuration -u/--api-url-base https://url
api_url_base:https://url -k/--access-key KEY
access_key:KEY -pa/--process-args R=B37m1
process_args:R-b37m1
Étapes suivantes
Utilisez les ressources suivantes pour prendre en main Microsoft Genomics :
- Commencez par exécuter votre premier workflow via le service Microsoft Genomics. Exécuter un workflow par le biais du service Microsoft Genomics
- Envoyer vos propres données pour traitement par le service Microsoft Genomics : FASTQ couplé | BAM | Plusieurs FASTQ ou BAM