מדוע תוצאות הקליסטו והסלמון שלי שונות כל כך רק בתמלילי lncRNA?

Marta Silva

2019-04-23 21:20:36 UTC

view on stackexchange narkive permalink

אני מבצע ניתוח כלשהו על מערך נתונים של RNA-seq. יש לי רשימה של תמלילים שהם lncRNA פוטנציאליים שעבורם ניהלתי גם מיישרים של קליסטו וגם של סלמון. נתוני הקלט לבניית האינדקס ולכימות כוללים mRNA וכן את ה- lncRNA הפוטנציאלי.

פקודות לשכפול אחד:

סלמון

  אינדקס סלמון - -keepDuplicates -t transcripts.fasta -i index_directory / -k 31salmon quant --seqBias --gcBias -i index_directory / --libType ISR --auxDir index_directory / -1 sample_R1.fastq.gz -2 sample_R2.fastq.gz -o output_name

Kallisto

  kallisto index -i kallisto_index.idx transcripts. fastakallisto quant -i kallisto_index.idx -o output_name - rf-stranded sample_R1.fastq .gz sample_R2.fastq.gz

ואז השתמשתי בערכי ה- tpm, עותקים משוכפלים בממוצע (3) ותיכנתי את מספר התמלילים לכל תנאי שהיו להם tpm> 2. אותה תוצאה עבור tpm> 5.

הגרף הבא מציג את ה- mRNA:

וגם עבור lncRNA:

שוב, הניתוח נעשה עם תמלילי lncRNA ו- mRNA יחד באותו קובץ fasta.

החפיפה לא מוצגת פה אך הוא תמיד קטן יותר מהספירה עבור Kallisto, עבור lncRNA.

בספרות נראה כי לשני הכלים יש תוצאות דומות. אני לא יכול למצוא סיבה לכך. אם תהיה שגיאה איפשהו הייתי מצפה לראות גם הבדלים ברנ"א העיבוי שלא קורים.

למרות שהשאלה נראית נהדרת, אני בספק אם נוכל לספק תשובה מבלי לדעת את הנתונים. האם תוכל לשכפל זאת במערך נתונים ציבורי? (אני חושב שלא תוכלו לשתף את הנתונים (המעובדים) לא?) אבל אולי השגיאות טמונות איפשהו בקוד המשמש ליצירת העלילות (נדיר, אבל זה יכול לקרות) ...

נכון, אני לא מסוגל לשתף פרטים על הנתונים. עם זאת אני יכול לנסות לשחזר את התוצאות באמצעות מערך נתונים ציבורי. לא רק כדי לערוך את השאלה, אלא למעשה זה יכול לתת כמה רמזים לגבי המתרחש במקרה של שגיאת קוד או בגלל סוג הנתונים. תודה על ההערה. רציתי לבדוק אם מישהו נתקל בבעיה זו מכיוון שהיא אינה המוקד העיקרי של הפרויקט שלי ולכן אני לא בטוח מתי אוכל לטפל בזה

אני חושב שעלילת פיזור של אומדני השפע מכל שיטה עשויה להיות השוואה אינפורמטיבית יותר. כלומר, עבור כל lncRNA, התווה את הערכתו של kallisto לעומת סלמון. האם הערכות הקליסטו נמוכות יותר באופן שיטתי או שאינן קיימות?

ששש, אל תגיד [ליאור פאצ'ר] (https://liorpachter.wordpress.com/2017/08/02/how-not-to-perform-a-differential-expression-analysis-or-science/).