Microsoft Genomiks’te FASTQ dosyası girişlerini kullanarak iş akışı gönderme

Bu makalede, giriş dosyalarınız tek bir FASTQ dosyası çiftiyse Microsoft Genomiks hizmetine iş akışı gönderme işlemi gösterilmektedir. Bu konu başlığında msgen istemcisini yükleyip çalıştırdığınız ve Azure Depolama konusunda bilgi sahibi olduğunuz kabul edilmektedir. Sağlanan örnek verileri kullanarak bir iş akışını başarıyla gönderdiyseniz, bu makaleye devam etmeye hazırsınızdır.

Kurulum: FASTQ dosyalarınızı Azure depolamaya yükleme

reads_1.fq.gz ve reads_2.fq.gz olmak üzere iki dosyaya sahip olduğunuzu ve bunları myaccount adlı Azure depolama hesabınıza https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz ve https://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz olarak yüklediğinizi düşünelim. API URL'sine ve erişim anahtarına sahipsiniz. https://myaccount.blob.core.windows.net/outputs içinde iki çıkış olmasını istiyorsunuz.

İşinizi msgen istemcisine gönderme

Burada msgen istemcisine sağlamanız gereken minimum bağımsız değişkenler verilmiştir; kodun daha anlaşılır olması için satır sonları eklenmiştir:

Windows için:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads_1.fq.gz ^
  --input-blob-name-2 reads_2.fq.gz ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

Unix için:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads_1.fq.gz \
  --input-blob-name-2 reads_2.fq.gz \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

Yapılandırma dosyası kullanmayı tercih ediyorsanız şu bileşenleri dahil etmeniz gerekir:

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads_1.fq.gz
input_blob_name_2:                reads_2.fq.gz
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

config.txt dosyasını şu çağrıyla gönderin: msgen submit -f config.txt

Sonraki adımlar

Bu makalede, Azure Depolama'ya bir çift FASTQ dosyası yüklediniz ve Python istemcisi aracılığıyla msgen Microsoft Genomiks hizmetine bir iş akışı gönderdiniz. İş akışı gönderimi ve Microsoft Genomiks hizmetiyle kullanabileceğiniz diğer komutlar hakkında daha fazla bilgi edinmek için SSS bölümüne bakın.