Dela via


Felsökningsguide

Här följer några felsökningstips för några av de vanliga problem som du kan stöta på när du använder Microsoft Genomics-tjänsten MSGEN.

Vanliga frågor och svar, som inte är relaterade till felsökning, finns i Vanliga frågor.

Steg 1: Hitta felkoder som är associerade med arbetsflödet

Du kan hitta de felmeddelanden som är associerade med arbetsflödet genom att:

  1. Använda kommandoraden och skriva in msgen status
  2. Undersöka innehållet i standardoutput.txt.

1. Använda kommandoraden msgen status

msgen status -u URL -k KEY -w ID

Det finns tre obligatoriska argument:

  • URL – bas-URI:n för API:et

  • KEY – åtkomstnyckeln för ditt Genomics-konto

    • Om du vill hitta din URL och nyckel går du till Azure-portalen och öppnar din Microsoft Genomics-kontosida. Under rubriken Hantering väljer du Åtkomstnycklar. Där hittar du både API-URL:en och dina åtkomstnycklar.
  • ID – arbetsflödes-ID

    • För att hitta arbetsflödets ID-typ i msgen list kommandot. Förutsatt att konfigurationsfilen innehåller URL:en och dina åtkomstnycklar och finns på samma plats som din msgen exe ser kommandot ut så här:

      msgen list -f "config.txt"
      

      Utdata från det här kommandot ser ut så här:

          Microsoft Genomics command-line client v0.7.4
              Copyright (c) 2018 Microsoft. All rights reserved.
      
              Workflow List
              -------------
              Total Count  : 1
      
              Workflow ID     : 10001
              Status          : Completed successfully
              Message         :
              Process         : snapgatk-20180730_1
              Description     :
              Created Date    : Mon, 27 Aug 2018 20:27:24 GMT
              End Date        : Mon, 27 Aug 2018 20:55:12 GMT
              Wall Clock Time : 0h 27m 48s
              Bases Processed : 1,348,613,600 (1 GBase)
      

    Kommentar

    Du kan också inkludera sökvägen till konfigurationsfilen i stället för att ange URL:en och NYCKELN direkt. Om du inkluderar dessa argument på kommandoraden och konfigurationsfilen har kommandoradsargumenten företräde.

För arbetsflödes-ID 1001 och config.txt fil som placeras i samma sökväg som den körbara msgen-filen ser kommandot ut så här:

msgen status -w 1001 -f "config.txt"

2. Granska innehållet i standardoutput.txt

Leta upp utdatacontainern för arbetsflödet i fråga. MSGEN skapar en [workflowfilename].logs.zip mapp efter varje arbetsflödeskörning. Packa upp mappen för att visa dess innehåll:

  • outputFileList.txt – en lista över utdatafilerna som producerades under arbetsflödet
  • standarderror.txt – filen är tom.
  • standardoutput.txt – loggar alla statusmeddelanden på den översta nivån, inklusive fel som inträffade när arbetsflödet kördes.
  • GATK-loggfiler – alla andra filer i logs mappen

För felsökning undersöker du innehållet i standardoutput.txt och noterar eventuella felmeddelanden som visas.

Det här avsnittet beskriver kortfattat vanliga fel som utdata från Microsoft Genomics-tjänsten (msgen) och de strategier som du kan använda för att lösa dem.

Microsoft Genomics-tjänsten (msgen) kan utlösa följande två typer av fel:

  1. Interna tjänstfel: Fel som är interna för tjänsten, som kanske inte kan lösas genom att åtgärda parametrar eller indatafiler. Ibland kan det åtgärda dessa fel när arbetsflödet skickas på nytt.
  2. Indatafel: Fel som kan lösas med rätt argument eller genom att åtgärda filformat.

1. Interna tjänstfel

Ett internt tjänstfel kan inte användas av användaren. Du kan skicka arbetsflödet igen, men om det inte fungerar kontaktar du Microsoft Genomics support

Felmeddelande Rekommenderade steg för felsökning
Ett internt fel uppstod. Försök att skicka arbetsflödet igen. Om du ser det här felet igen kontaktar du Microsoft Genomics-supporten för att få hjälp Skicka arbetsflödet igen. Kontakta Microsoft Genomics-supporten om problemet kvarstår genom att skapa ett supportärende.

2. Indatafel

Dessa fel kan användas av användaren. Baserat på typen av fil och felkod matar Microsoft Genomics-tjänsten ut distinkta felkoder. Följ de rekommenderade felsökningsstegen nedan.

Typ av fil Felkod Felmeddelande Rekommenderade steg för felsökning
Alla 701 Read [readId] har [numberOfBases]-baser, men gränsen är [maxReadLength] Den vanligaste orsaken till det här felet är filskada som leder till sammanlänkning av två läsningar. Kontrollera dina indatafiler.
BAM 200 Det går inte att läsa filen "[yourFileName]". Kontrollera formatet på BAM-filen. Skicka arbetsflödet igen med en korrekt formaterad fil.
BAM 201 Det gick inte att läsa BAM-filen [File_name]. Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil.
BAM 202 Det gick inte att läsa BAM-filen [File_name]. Filen är för liten och saknar huvud. Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil.
BAM 203 Det gick inte att läsa BAM-filen [File_name]. Filrubriken var skadad. Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil.
BAM 204 Det gick inte att läsa BAM-filen [File_name]. Filrubriken var skadad. Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil.
BAM 205 Det gick inte att läsa BAM-filen [File_name]. Filrubriken var skadad. Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil.
BAM 206 Det gick inte att läsa BAM-filen [File_name]. Filrubriken var skadad. Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil.
BAM 207 Det gick inte att läsa BAM-filen [File_name]. Fil trunkerad nära förskjutning [offset]. Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil.
BAM 208 Ogiltig BAM-fil. ReadID [Read_Id] har ingen sekvens i filen [File_name]. Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil.
FASTQ 300 Det går inte att läsa FASTQ-filen. [File_name] slutar inte med en ny rad. Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.
FASTQ 301 Det går inte att läsa FASTQ-filen [File_name]. FASTQ-posten är större än buffertstorleken vid förskjutning: [_offset] Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.
FASTQ 302 FASTQ-syntaxfel. Filen [File_name] har en tom rad. Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.
FASTQ 303 FASTQ-syntaxfel. Filen[File_name] har ett ogiltigt starttecken vid förskjutningen: [_offset], radtyp: [line_type], tecken: [_char] Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.
FASTQ 304 FASTQ-syntaxfel vid readID [_ReadID]. Första läsningen av batchen har inte readID som slutar på /1 i filen [File_name] Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.
FASTQ 305 FASTQ-syntaxfel vid readID [_readID]. Andra läsningen av batchen har inte readID som slutar i /2 i filen [File_name] Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.
FASTQ 306 FASTQ-syntaxfel vid readID [_ReadID]. Första läsningen av par har inget ID som slutar i /1 i filen [File_name] Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.
FASTQ 307 FASTQ-syntaxfel vid readID [_ReadID]. ReadID slutar inte med /1 eller/2. Filen [File_name] kan inte användas som en länkad FASTQ-fil. Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.
FASTQ 308 FASTQ-läsfel. Läsningar av båda ändar svarade annorlunda. Valde du rätt FASTQ-filer? Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen.

Steg 3: Kontakta supporten för Microsoft Genomics

Om du fortsätter att ha jobbfel eller om du har andra frågor kontaktar du Microsoft Genomics-supporten från Azure-portalen. Mer information om hur du skickar en supportbegäran finns här.

Nästa steg

I den här artikeln har du lärt dig hur du felsöker och löser vanliga problem med Microsoft Genomics-tjänsten. Mer information och mer allmänna vanliga frågor och svar finns i Vanliga frågor.