שְׁאֵלָה:
כיצד לאמת שהורידו כראוי את ה- BAM?
EB2127
2018-05-09 02:03:46 UTC
view on stackexchange narkive permalink

כרגע יש לי כמה מאות קבצי BAM שהורדו על ידי מישהו אחר. אלה נותרו ללא פגע --- לפני שעבדתי איתם, ברצוני לבדוק שה- BAMs האלה הורדו במלואם.

אני לא MD5 בדיקות סיכום להסתכל.

על מנת לאמת את ה- BAM, הייתי משתמש במשהו כמו ValidateSamFile של Picard, https://broadinstitute.github.io/picard/command-line-overview.html#ValidateSamFile

  java -jar picard.jar ValidateSamFile \ I = input.bam \ MODE = סיכום  

יכולתי לכתוב סקריפט bash ולרוץ דרך ה- BAM האלה ואז קרא את הפלט של פיקארד. זה לבדוק אם ה- BAM תקף, לא אם הוא הורד במלואו (למשל, ניתן להוריד את ה- BAM בצורה נכונה, אך מטבעו להיות פגום בדרך אחרת).

אם ה- BAM הורד באופן מלא, זה לא אין כמה בתים של "סוף הקובץ" שיכולתי לבדוק במהירות? האם ישנן שיטות אחרות יעילות יותר?

אחד תשובה:
Devon Ryan
2018-05-09 02:05:12 UTC
view on stackexchange narkive permalink

samtools quickcheck הוא כל מה שאתה צריך. מהמדריך:

בדוק במהירות שקבצי הקלט נראים שלמים. בודק שראשית הקובץ מכיל כותרת חוקית (כל הפורמטים) המכילה לפחות רצף יעד אחד ואז מבקש לסוף הקובץ ובודק שקצה הקובץ (EOF) קיים ושלם (BAM בלבד).

נתונים באמצע הקובץ לא נקראים מכיוון שזה ייקח הרבה יותר זמן, אז שים לב שפקודה זו לא תאתר שחיתות פנימית, אך שימושית לבדיקה שקבצים אינם נחתכים לפני ביצוע משימות אינטנסיביות יותר עליהן.

פקודה זו תצא עם קוד יציאה שאינו אפס אם לקבצי קלט כלשהם אין כותרת חוקית או חסר חסם EOF. אחרת היא תצא בהצלחה (עם קוד יציאה אפס).

מושלם, לא הבנתי של- samtools יש פונקציונליות זו


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 4.0 עליו הוא מופץ.
Loading...