Munkafolyamat elküldése FASTQ bemeneti fájlokkal a Microsoft Genomics szolgáltatásba
Ez a cikk bemutatja, hogyan küldhet be munkafolyamatot a Microsoft Genomics szolgáltatásnak, ha a bemeneti fájlok egyetlen FASTQ-fájlpárok. Ez a témakör feltételezi, hogy már telepítette és futtatta az msgen
klienst, továbbá megismerkedett az Azure Storage használatával. Ha sikeresen elküldte a munkafolyamatot a megadott mintaadatokkal, készen áll a cikk folytatására.
Előkészületek: FASTQ-fájlok feltöltése az Azure Storage-ba
Tegyük fel, hogy két fájllal rendelkezik (reads_1.fq.gz és reads_2.fq.gz), amelyeket feltöltött saját myaccount nevű tárfiókjába az Azure-ban: https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz és https://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz. Emellett rendelkezik az API URL-címével és a hozzáférési kulccsal. Azt szeretné, hogy a kimenetek a következő helyre kerüljenek: https://myaccount.blob.core.windows.net/outputs.
Feladat elküldése az msgen
-ügyfélnek
Itt található az a minimális argumentumkészlet, amelyet meg kell adnia az msgen
klienshez (a sortörések az átláthatóság érdekében lettek hozzáadva):
Windows esetén:
msgen submit ^
--api-url-base <Genomics API URL> ^
--access-key <Genomics access key> ^
--process-args R=b37m1 ^
--input-storage-account-name myaccount ^
--input-storage-account-key <storage access key to "myaccount"> ^
--input-storage-account-container inputs ^
--input-blob-name-1 reads_1.fq.gz ^
--input-blob-name-2 reads_2.fq.gz ^
--output-storage-account-name myaccount ^
--output-storage-account-key <storage access key to "myaccount"> ^
--output-storage-account-container outputs
Unix esetén:
msgen submit \
--api-url-base <Genomics API URL> \
--access-key <Genomics access key> \
--process-args R=b37m1 \
--input-storage-account-name myaccount \
--input-storage-account-key <storage access key to "myaccount"> \
--input-storage-account-container inputs \
--input-blob-name-1 reads_1.fq.gz \
--input-blob-name-2 reads_2.fq.gz \
--output-storage-account-name myaccount \
--output-storage-account-key <storage access key to "myaccount"> \
--output-storage-account-container outputs
Ha inkább konfigurációs fájlt szeretne használni, annak a következőket kell tartalmaznia:
api_url_base: <Genomics API URL>
access_key: <Genomics access key>
process_args: R=b37m1
input_storage_account_name: myaccount
input_storage_account_key: <storage access key to "myaccount">
input_storage_account_container: inputs
input_blob_name_1: reads_1.fq.gz
input_blob_name_2: reads_2.fq.gz
output_storage_account_name: myaccount
output_storage_account_key: <storage access key to "myaccount">
output_storage_account_container: outputs
Küldje el a config.txt
fájlt a következő hívással: msgen submit -f config.txt
Következő lépések
Ebben a cikkben feltöltött egy pár FASTQ-fájlt az Azure Storage-ba, és egy munkafolyamatot küldött a Microsoft Genomics szolgáltatásnak a msgen
Python-ügyfélen keresztül. A munkafolyamatok beküldésével és a Microsoft Genomics szolgáltatással használható egyéb parancsokkal kapcsolatos további információkért tekintse meg a gyakori kérdéseket.