Sdílet prostřednictvím


Odeslání pracovního postupu ve vstupních souborech FASTQ v Microsoft Genomics

Tento článek ukazuje, jak odeslat pracovní postup do služby Microsoft Genomics, pokud jsou vstupní soubory jedním párem souborů FASTQ. Toto téma předpokládá, že jste už nainstalovali a spustili klienta msgen a že víte, jak používat úložiště Azure Storage. Pokud jste úspěšně odeslali pracovní postup s využitím zadaných ukázkových dat, můžete pokračovat v tomto článku.

Příprava: Odeslání souborů FASTQ do úložiště Azure

Předpokládejme, že máte dva soubory reads_1.fq.gz a reads_2.fq.gz, a že jste je nahráli do svého účtu úložiště myaccount v Azure jako https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz a https://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz. Máte adresu URL rozhraní API a přístupový klíč. Chcete mít výstupy v https://myaccount.blob.core.windows.net/outputs.

Odeslání úlohy do klienta msgen

Tady je minimální sadu argumentů, které budete muset poskytnout klientovi msgen; zalomení řádků jsou přidána pro přehlednost:

Ve Windows:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads_1.fq.gz ^
  --input-blob-name-2 reads_2.fq.gz ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

V Unixu:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads_1.fq.gz \
  --input-blob-name-2 reads_2.fq.gz \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

Pokud dáváte přednost použití konfiguračního souboru, měl by obsahovat:

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads_1.fq.gz
input_blob_name_2:                reads_2.fq.gz
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

Odešlete soubor config.txt tímto voláním: msgen submit -f config.txt

Další kroky

V tomto článku jste do služby Azure Storage nahráli dvojici souborů FASTQ a odeslali jste pracovní postup službě Microsoft Genomics prostřednictvím klienta Pythonu msgen . Další informace o odesílání pracovních postupů a dalších příkazech, které můžete použít se službou Microsoft Genomics, najdete v nejčastějších dotazech.