Przesyłanie przepływu pracy przy użyciu plików wejściowych FASTQ w usłudze Microsoft Genomics
W tym artykule pokazano, jak przesłać przepływ pracy do usługi Microsoft Genomics, jeśli pliki wejściowe są jedną parą plików FASTQ. W tym temacie założono, że użytkownik zainstalował i uruchomił klienta msgen
oraz że zna sposób korzystania z usługi Azure Storage. Jeśli przepływ pracy został pomyślnie przesłany przy użyciu podanych przykładowych danych, możesz przystąpić do kontynuowania pracy w tym artykule.
Konfiguracja: przekazywanie plików FASTQ do magazynu platformy Azure
Załóżmy, że mamy dwa pliki, reads_1.fq.gz i reads_2.fq.gz, oraz że zostały one przekazane do konta magazynu myaccount na platformie Azure jako obiekty https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz oraz https://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz. Masz adres URL interfejsu API i klucz dostępu. Chcesz uzyskać dane wyjściowe w lokalizacji https://myaccount.blob.core.windows.net/outputs.
Przesyłanie zadania do klienta msgen
Oto minimalny zestaw argumentów, jakie należy podać do klienta msgen
; podziały wierszy zostały dodane z myślą o przejrzystości:
Dla systemu Windows:
msgen submit ^
--api-url-base <Genomics API URL> ^
--access-key <Genomics access key> ^
--process-args R=b37m1 ^
--input-storage-account-name myaccount ^
--input-storage-account-key <storage access key to "myaccount"> ^
--input-storage-account-container inputs ^
--input-blob-name-1 reads_1.fq.gz ^
--input-blob-name-2 reads_2.fq.gz ^
--output-storage-account-name myaccount ^
--output-storage-account-key <storage access key to "myaccount"> ^
--output-storage-account-container outputs
W przypadku systemu Unix:
msgen submit \
--api-url-base <Genomics API URL> \
--access-key <Genomics access key> \
--process-args R=b37m1 \
--input-storage-account-name myaccount \
--input-storage-account-key <storage access key to "myaccount"> \
--input-storage-account-container inputs \
--input-blob-name-1 reads_1.fq.gz \
--input-blob-name-2 reads_2.fq.gz \
--output-storage-account-name myaccount \
--output-storage-account-key <storage access key to "myaccount"> \
--output-storage-account-container outputs
Jeśli wolisz używać pliku konfiguracji, oto jego zawartość:
api_url_base: <Genomics API URL>
access_key: <Genomics access key>
process_args: R=b37m1
input_storage_account_name: myaccount
input_storage_account_key: <storage access key to "myaccount">
input_storage_account_container: inputs
input_blob_name_1: reads_1.fq.gz
input_blob_name_2: reads_2.fq.gz
output_storage_account_name: myaccount
output_storage_account_key: <storage access key to "myaccount">
output_storage_account_container: outputs
Prześlij plik config.txt
przy użyciu tego wywołania: msgen submit -f config.txt
Następne kroki
W tym artykule przekazano parę plików FASTQ do usługi Azure Storage i przesłano przepływ pracy do usługi Microsoft Genomics za pośrednictwem msgen
klienta języka Python. Aby dowiedzieć się więcej na temat przesyłania przepływu pracy i innych poleceń, których można używać z usługą Microsoft Genomics, zobacz często zadawane pytania.