Bagikan melalui


Mengirimkan alur kerja menggunakan input file FASTQ di Microsoft Genomics

Artikel ini menunjukkan cara mengirimkan alur kerja ke layanan Microsoft Genomics jika file input Anda adalah sepasang file FASTQ. Topik ini mengasumsikan Anda telah menginstal dan menjalankan klien msgen, dan familier dengan cara menggunakan Azure Storage. Jika telah berhasil mengirimkan alur kerja menggunakan data sampel yang disediakan, Anda siap melanjutkan dengan artikel ini.

Menyiapkan: Mengunggah file FASTQ Anda ke penyimpanan Azure

Misalkan Anda memiliki dua file, reads_1.fq.gz dan reads_2.fq.gz, dan Anda telah mengunggahnya ke akun penyimpanan Anda myaccount di Azure sebagai https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz dan https://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz. Anda memiliki URL API dan kunci akses. Anda ingin memiliki output di https://myaccount.blob.core.windows.net/outputs.

Kirimkan pekerjaan Anda ke klien msgen

Berikut adalah kumpulan argumen minimal yang perlu Anda berikan kepada klien msgen; pembatas baris ditambahkan untuk kejelasan:

Untuk Windows:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads_1.fq.gz ^
  --input-blob-name-2 reads_2.fq.gz ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

Untuk Unix:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads_1.fq.gz \
  --input-blob-name-2 reads_2.fq.gz \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

Jika Anda lebih memilih menggunakan file konfigurasi, berikut ini yang akan dimuat:

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads_1.fq.gz
input_blob_name_2:                reads_2.fq.gz
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

Kirimkan file config.txt dengan pemanggilan ini: msgen submit -f config.txt

Langkah berikutnya

Dalam artikel ini, Anda mengunggah sepasang file FASTQ ke Azure Storage dan mengirimkan alur kerja ke layanan Microsoft Genomics melalui klien python msgen. Untuk mempelajari selengkapnya tentang pengiriman alur kerja dan perintah lain yang dapat Anda gunakan dengan layanan Microsoft Genomics, lihat FAQ kami.