Munkafolyamat elküldése BAM bemeneti fájllal

Ez a cikk bemutatja, hogyan küldhet munkafolyamatot a Microsoft Genomics szolgáltatásnak, ha a bemeneti fájl egyetlen BAM-fájl. Ez a témakör feltételezi, hogy már telepítette és futtatta az msgen klienst, továbbá megismerkedett az Azure Storage használatával. Ha sikeresen elküldött egy munkafolyamatot a megadott mintaadatokkal, készen áll a cikk folytatására.

Előkészületek: BAM-fájl feltöltése az Azure Storage-ba

Tegyük fel, hogy egyetlen BAM-fájllal rendelkezik (reads.bam), amelyet feltöltött saját myaccount nevű tárfiókjába az Azure-ban: https://myaccount.blob.core.windows.net/inputs/reads.bam. Emellett rendelkezik az API URL-címével és a hozzáférési kulccsal. Azt szeretné, hogy a kimenetek a következő helyre kerüljenek: https://myaccount.blob.core.windows.net/outputs.

Feladat elküldése az msgen-ügyfélnek

Itt található az a minimális argumentumkészlet, amelyet meg kell adnia az msgen klienshez (a sortörések az átláthatóság érdekében lettek hozzáadva):

Windows esetén:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads.bam ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

Unix esetén:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads.bam \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

Ha inkább konfigurációs fájlt szeretne használni, annak a következőket kell tartalmaznia:

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads.bam
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

Küldje el a config.txt fájlt a következő hívással: msgen submit -f config.txt

Következő lépések

Ebben a cikkben feltöltött egy BAM-fájlt az Azure Storage-ba, és egy munkafolyamatot küldött a Microsoft Genomics szolgáltatásnak a msgen Python-ügyfélen keresztül. A munkafolyamatok elküldésével, illetve a Microsoft Genomics szolgáltatásban használható egyéb parancsokkal kapcsolatos további információkért tekintse meg a Gyakori kérdések szakaszt.