Felsökningsguide
Här följer några felsökningstips för några av de vanliga problem som du kan stöta på när du använder Microsoft Genomics-tjänsten MSGEN.
Vanliga frågor och svar, som inte är relaterade till felsökning, finns i Vanliga frågor.
Steg 1: Hitta felkoder som är associerade med arbetsflödet
Du kan hitta de felmeddelanden som är associerade med arbetsflödet genom att:
- Använda kommandoraden och skriva in
msgen status
- Undersöka innehållet i standardoutput.txt.
1. Använda kommandoraden msgen status
msgen status -u URL -k KEY -w ID
Det finns tre obligatoriska argument:
URL – bas-URI:n för API:et
KEY – åtkomstnyckeln för ditt Genomics-konto
- Om du vill hitta din URL och nyckel går du till Azure-portalen och öppnar din Microsoft Genomics-kontosida. Under rubriken Hantering väljer du Åtkomstnycklar. Där hittar du både API-URL:en och dina åtkomstnycklar.
ID – arbetsflödes-ID
För att hitta arbetsflödets ID-typ i
msgen list
kommandot. Förutsatt att konfigurationsfilen innehåller URL:en och dina åtkomstnycklar och finns på samma plats som din msgen exe ser kommandot ut så här:msgen list -f "config.txt"
Utdata från det här kommandot ser ut så här:
Microsoft Genomics command-line client v0.7.4 Copyright (c) 2018 Microsoft. All rights reserved. Workflow List ------------- Total Count : 1 Workflow ID : 10001 Status : Completed successfully Message : Process : snapgatk-20180730_1 Description : Created Date : Mon, 27 Aug 2018 20:27:24 GMT End Date : Mon, 27 Aug 2018 20:55:12 GMT Wall Clock Time : 0h 27m 48s Bases Processed : 1,348,613,600 (1 GBase)
Kommentar
Du kan också inkludera sökvägen till konfigurationsfilen i stället för att ange URL:en och NYCKELN direkt. Om du inkluderar dessa argument på kommandoraden och konfigurationsfilen har kommandoradsargumenten företräde.
För arbetsflödes-ID 1001 och config.txt fil som placeras i samma sökväg som den körbara msgen-filen ser kommandot ut så här:
msgen status -w 1001 -f "config.txt"
2. Granska innehållet i standardoutput.txt
Leta upp utdatacontainern för arbetsflödet i fråga. MSGEN skapar en [workflowfilename].logs.zip
mapp efter varje arbetsflödeskörning. Packa upp mappen för att visa dess innehåll:
- outputFileList.txt – en lista över utdatafilerna som producerades under arbetsflödet
- standarderror.txt – filen är tom.
- standardoutput.txt – loggar alla statusmeddelanden på den översta nivån, inklusive fel som inträffade när arbetsflödet kördes.
- GATK-loggfiler – alla andra filer i
logs
mappen
För felsökning undersöker du innehållet i standardoutput.txt och noterar eventuella felmeddelanden som visas.
Steg 2: Prova rekommenderade steg för vanliga fel
Det här avsnittet beskriver kortfattat vanliga fel som utdata från Microsoft Genomics-tjänsten (msgen) och de strategier som du kan använda för att lösa dem.
Microsoft Genomics-tjänsten (msgen) kan utlösa följande två typer av fel:
- Interna tjänstfel: Fel som är interna för tjänsten, som kanske inte kan lösas genom att åtgärda parametrar eller indatafiler. Ibland kan det åtgärda dessa fel när arbetsflödet skickas på nytt.
- Indatafel: Fel som kan lösas med rätt argument eller genom att åtgärda filformat.
1. Interna tjänstfel
Ett internt tjänstfel kan inte användas av användaren. Du kan skicka arbetsflödet igen, men om det inte fungerar kontaktar du Microsoft Genomics support
2. Indatafel
Dessa fel kan användas av användaren. Baserat på typen av fil och felkod matar Microsoft Genomics-tjänsten ut distinkta felkoder. Följ de rekommenderade felsökningsstegen nedan.
Typ av fil | Felkod | Felmeddelande | Rekommenderade steg för felsökning |
---|---|---|---|
Alla | 701 | Read [readId] har [numberOfBases]-baser, men gränsen är [maxReadLength] | Den vanligaste orsaken till det här felet är filskada som leder till sammanlänkning av två läsningar. Kontrollera dina indatafiler. |
BAM | 200 | Det går inte att läsa filen "[yourFileName]". | Kontrollera formatet på BAM-filen. Skicka arbetsflödet igen med en korrekt formaterad fil. |
BAM | 201 | Det gick inte att läsa BAM-filen [File_name]. | Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil. |
BAM | 202 | Det gick inte att läsa BAM-filen [File_name]. Filen är för liten och saknar huvud. | Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil. |
BAM | 203 | Det gick inte att läsa BAM-filen [File_name]. Filrubriken var skadad. | Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil. |
BAM | 204 | Det gick inte att läsa BAM-filen [File_name]. Filrubriken var skadad. | Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil. |
BAM | 205 | Det gick inte att läsa BAM-filen [File_name]. Filrubriken var skadad. | Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil. |
BAM | 206 | Det gick inte att läsa BAM-filen [File_name]. Filrubriken var skadad. | Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil. |
BAM | 207 | Det gick inte att läsa BAM-filen [File_name]. Fil trunkerad nära förskjutning [offset]. | Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil. |
BAM | 208 | Ogiltig BAM-fil. ReadID [Read_Id] har ingen sekvens i filen [File_name]. | Kontrollera formatet på BAM-filen. Skicka arbetsflödet med en korrekt formaterad fil. |
FASTQ | 300 | Det går inte att läsa FASTQ-filen. [File_name] slutar inte med en ny rad. | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
FASTQ | 301 | Det går inte att läsa FASTQ-filen [File_name]. FASTQ-posten är större än buffertstorleken vid förskjutning: [_offset] | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
FASTQ | 302 | FASTQ-syntaxfel. Filen [File_name] har en tom rad. | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
FASTQ | 303 | FASTQ-syntaxfel. Filen[File_name] har ett ogiltigt starttecken vid förskjutningen: [_offset], radtyp: [line_type], tecken: [_char] | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
FASTQ | 304 | FASTQ-syntaxfel vid readID [_ReadID]. Första läsningen av batchen har inte readID som slutar på /1 i filen [File_name] | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
FASTQ | 305 | FASTQ-syntaxfel vid readID [_readID]. Andra läsningen av batchen har inte readID som slutar i /2 i filen [File_name] | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
FASTQ | 306 | FASTQ-syntaxfel vid readID [_ReadID]. Första läsningen av par har inget ID som slutar i /1 i filen [File_name] | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
FASTQ | 307 | FASTQ-syntaxfel vid readID [_ReadID]. ReadID slutar inte med /1 eller/2. Filen [File_name] kan inte användas som en länkad FASTQ-fil. | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
FASTQ | 308 | FASTQ-läsfel. Läsningar av båda ändar svarade annorlunda. Valde du rätt FASTQ-filer? | Korrigera formatet för FASTQ-filen och skicka arbetsflödet igen. |
Steg 3: Kontakta supporten för Microsoft Genomics
Om du fortsätter att ha jobbfel eller om du har andra frågor kontaktar du Microsoft Genomics-supporten från Azure-portalen. Mer information om hur du skickar en supportbegäran finns här.
Nästa steg
I den här artikeln har du lärt dig hur du felsöker och löser vanliga problem med Microsoft Genomics-tjänsten. Mer information och mer allmänna vanliga frågor och svar finns i Vanliga frågor.