fast5
הוא גרסה של HDF5
הפורמט המקורי בו מסופקים נתונים גולמיים מאוקספורד ננופור MinION. תוכלו לחלץ את הקריאות בפורמט fast5 בקלות לפורמט fastq רגיל, באמצעות poretools
למשל.
נניח כי יישרתי קריאות אלה בתבנית fastq
לגנום התייחסות חיצוני, וכתוצאה מכך נוצר קובץ SAM
. נניח שלקחתי אז קבוצת משנה של הקובץ SAM
, על פי הדגל הסיבית, כדי לכלול רק את הקריאות שממפות להפניה. בעזרת מזהה הקריאה, אז אוכל לשלוף אותם מהקובץ המכיל את הקריאות בתבנית fastq
, וליצור קובץ תת קבוצה בתבנית fastq
המכיל רק את המזהים שמופנו אל ההתייחסות.
עכשיו השאלה שלי היא, האם נוכל לקבוע קריאות משנה מהארכיון fast5
על פי רשימת קריאות המיפוי כפי שנלקחה מהקובץ עם קריאות ב- fastq
פוּרמָט? זה למטרות חינוכיות, כך שיהיה לנו ארכיון התחלתי קטן יותר, והמיצוי fast5
-> fastq
לוקח פחות זמן מעבד.