Odeslání pracovní postupu pomocí vstupního souboru BAM

Tento článek ukazuje, jak odeslat pracovní postup do služby Microsoft Genomics, pokud je vaším vstupním souborem jeden soubor BAM. Toto téma předpokládá, že jste už nainstalovali a spustili klienta msgen a že víte, jak používat úložiště Azure Storage. Pokud jste úspěšně odeslali pracovní postup s využitím zadaných ukázkových dat, můžete pokračovat v tomto článku.

Příprava: Odeslání souboru BAM do úložiště Azure

Předpokládejme, že máte jeden soubor BAM, reads.bam, a že jste ho nahráli do svého účtu úložiště myaccount v Azure jako https://myaccount.blob.core.windows.net/inputs/reads.bam. Máte adresu URL rozhraní API a přístupový klíč. Chcete mít výstupy v https://myaccount.blob.core.windows.net/outputs.

Odeslání úlohy do klienta msgen

Tady je minimální sadu argumentů, které budete muset poskytnout klientovi msgen; zalomení řádků jsou přidána pro přehlednost:

Ve Windows:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads.bam ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

V Unixu:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads.bam \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

Pokud dáváte přednost použití konfiguračního souboru, měl by obsahovat:

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads.bam
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

Odešlete soubor config.txt tímto voláním: msgen submit -f config.txt

Další kroky

V tomto článku jste nahráli soubor BAM do služby Azure Storage a odeslali jste pracovní postup do služby Microsoft Genomics prostřednictvím klienta Pythonu msgen . Další informace týkající se odesílání pracovních postupů a dalších příkazů, které můžete použít se službou Microsoft Genomics, najdete v nejčastějších dotazech.