Mengirimkan alur kerja menggunakan input file FASTQ di Microsoft Genomics
Artikel ini menunjukkan cara mengirimkan alur kerja ke layanan Microsoft Genomics jika file input Anda adalah sepasang file FASTQ. Topik ini mengasumsikan Anda telah menginstal dan menjalankan klien msgen
, dan familier dengan cara menggunakan Azure Storage. Jika telah berhasil mengirimkan alur kerja menggunakan data sampel yang disediakan, Anda siap melanjutkan dengan artikel ini.
Menyiapkan: Mengunggah file FASTQ Anda ke penyimpanan Azure
Misalkan Anda memiliki dua file, reads_1.fq.gz dan reads_2.fq.gz, dan Anda telah mengunggahnya ke akun penyimpanan Anda myaccount di Azure sebagai https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz dan https://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz. Anda memiliki URL API dan kunci akses. Anda ingin memiliki output di https://myaccount.blob.core.windows.net/outputs.
Kirimkan pekerjaan Anda ke klien msgen
Berikut adalah kumpulan argumen minimal yang perlu Anda berikan kepada klien msgen
; pembatas baris ditambahkan untuk kejelasan:
Untuk Windows:
msgen submit ^
--api-url-base <Genomics API URL> ^
--access-key <Genomics access key> ^
--process-args R=b37m1 ^
--input-storage-account-name myaccount ^
--input-storage-account-key <storage access key to "myaccount"> ^
--input-storage-account-container inputs ^
--input-blob-name-1 reads_1.fq.gz ^
--input-blob-name-2 reads_2.fq.gz ^
--output-storage-account-name myaccount ^
--output-storage-account-key <storage access key to "myaccount"> ^
--output-storage-account-container outputs
Untuk Unix:
msgen submit \
--api-url-base <Genomics API URL> \
--access-key <Genomics access key> \
--process-args R=b37m1 \
--input-storage-account-name myaccount \
--input-storage-account-key <storage access key to "myaccount"> \
--input-storage-account-container inputs \
--input-blob-name-1 reads_1.fq.gz \
--input-blob-name-2 reads_2.fq.gz \
--output-storage-account-name myaccount \
--output-storage-account-key <storage access key to "myaccount"> \
--output-storage-account-container outputs
Jika Anda lebih memilih menggunakan file konfigurasi, berikut ini yang akan dimuat:
api_url_base: <Genomics API URL>
access_key: <Genomics access key>
process_args: R=b37m1
input_storage_account_name: myaccount
input_storage_account_key: <storage access key to "myaccount">
input_storage_account_container: inputs
input_blob_name_1: reads_1.fq.gz
input_blob_name_2: reads_2.fq.gz
output_storage_account_name: myaccount
output_storage_account_key: <storage access key to "myaccount">
output_storage_account_container: outputs
Kirimkan file config.txt
dengan pemanggilan ini: msgen submit -f config.txt
Langkah berikutnya
Dalam artikel ini, Anda mengunggah sepasang file FASTQ ke Azure Storage dan mengirimkan alur kerja ke layanan Microsoft Genomics melalui klien python msgen
. Untuk mempelajari selengkapnya tentang pengiriman alur kerja dan perintah lain yang dapat Anda gunakan dengan layanan Microsoft Genomics, lihat FAQ kami.