Microsoft Genomics: Perguntas frequentes

Este artigo lista as principais dúvidas que você pode ter relacionadas ao Microsoft Genomics. Para obter mais informações sobre o serviço do Microsoft Genomics, consulte O que é Microsoft Genomics?. Para obter mais informações sobre Solução de problemas, consulte nosso Guia de solução de problemas.

Como executo os fluxos de trabalho do GATK4 no Microsoft Genomics?

No arquivo config.txt do serviço do Microsoft Genomics, especifique o process_name como gatk4. Observe que você será cobrado de acordo com as taxas de faturamento normais.

Como habilito a compactação de saída?

Você pode compactar a saída vcf ou gvcf usando um argumento opcional para a compactação de saída. É equivalente a executar -bgzip seguido por -tabix na saída vcf ou gvcf para produzir arquivos .gz(saída bgzip) e .tbi (saída tabix). O bgzip compacta o arquivo vcf ou gvcf, e o tabix cria um índice para o arquivo compactado. O argumento é um booliano, que é definido como false por padrão na saída vcf e como true por padrão na saída gvcf. Para usar na linha de comando, especifique -bz ou --bgzip-output como true (execute o bgzip e o tabix) ou false. Para usar esse argumento no arquivo config.txt, adicione bgzip_output: true ou bgzip_output: false ao arquivo.

O que é o SLA para Microsoft Genomics?

Garantimos que em 99,9% do tempo o serviço Microsoft Genomics estará disponível para receber solicitações de API de fluxo de trabalho. Para saber mais, veja SLA.

Como o uso do Microsoft Genomics aparece na minha fatura?

O Microsoft Genomics é faturado de acordo com o número de gigabases processados por fluxo de trabalho. Para saber mais, consulte Preços.

Onde é possível encontrar uma lista de todos os comandos e argumentos possíveis para o cliente `msgen`?

Você pode obter uma lista completa dos comandos e argumentos disponíveis executando msgen help. Se nenhum argumento adicional é fornecido, ele mostra uma lista de seções de ajuda disponíveis, uma para cada um dos submit, list, cancel, e status. Para obter ajuda para um comando específico, digite msgen help command; por exemplo, msgen help submit lista todas as opções de envio.

Quais são os comandos mais comumente usados para o cliente `msgen`?

Os comandos mais usados são argumentos para o msgen cliente incluem:

Comando Descrição do campo
list Retorna uma lista de trabalhos que você enviou. Para argumentos, consulte msgen help list.
submit Envia uma solicitação de fluxo de trabalho para o serviço. Para argumentos, consulte msgen help submit.
status Retorna o status do fluxo de trabalho especificado por --workflow-id. Consulte também msgen help status.
cancel Envia uma solicitação para cancelar o processamento do fluxo de trabalho especificado por --workflow-id. Consulte também msgen help cancel.

Onde é possível obter o valor de `--api-url-base`?

Vá ao portal do Azure e abra a página da sua conta do Genomics. No cabeçalho Gerenciamento, escolha Chaves de acesso. Lá, você encontra a URL de API e suas chaves de acesso.

Onde é possível obter o valor de `--access-key`?

Vá ao portal do Azure e abra a página da sua conta do Genomics. No cabeçalho Gerenciamento, escolha Chaves de acesso. Lá, você encontra a URL de API e suas chaves de acesso.

Por que preciso duas chaves de acesso?

São necessárias duas chaves de acesso no caso de você desejar atualizá-las (gerá-las novamente) sem interromper o uso do serviço. Por exemplo, se você quiser atualizar a primeira chave, você deve ter todos os novos fluxos de trabalho usa a segunda chave. Em seguida, aguarde para todos os fluxos de trabalho usando a primeira chave para concluir antes de atualizar a primeira chave.

Você salva minhas chaves de conta de armazenamento?

Sua chave de conta de armazenamento é usada para criar tokens de acesso de curto prazo para o serviço Microsoft Genomics ler os arquivos de entrada e gravar os arquivos de saída. A vida útil padrão do token é de 48 horas. A duração do token pode ser alterada com a -sas/--sas-duration opção do comando Enviar; o valor é em horas.

O Microsoft Genomics armazena dados do cliente?

Não. O Microsoft Genomics não armazena nenhum dado do cliente.

Quais referências de genoma posso usar?

Há suporte para essas referências:

Referência Valor de -pa/--process-args
b37 R=b37m1
hg38 R=hg38m1
hg38 (nenhuma análise alt) R=hg38m1x
hg19 R=hg19m1

Como formato meus argumentos de linha de comando como um arquivo de configuração?

msgen compreende os arquivos de configuração no seguinte formato:

  • Todas as opções são fornecidas como pares chave-valor com valores separados de chaves por dois-pontos. Espaço em branco é ignorado.

  • Linhas que começam com # serão ignoradas.

  • Qualquer argumento de linha de comando no formato longo pode ser convertido a uma chave retirando seus principais traços e substituindo traços entre palavras com sublinhados. Aqui estão alguns exemplos de conversão:

    Argumento de linha de comando Linha de arquivo de configuração
    -u/--api-url-base https://url api_url_base:https://url
    -k/--access-key KEY access_key:KEY
    -pa/--process-args R=B37m1 process_args:R-b37m1

Próximas etapas

Use os seguintes recursos para começar com o Microsoft Genomics: