שְׁאֵלָה:
מדוע תוצאות הקליסטו והסלמון שלי שונות כל כך רק בתמלילי lncRNA?
Marta Silva
2019-04-23 21:20:36 UTC
view on stackexchange narkive permalink

אני מבצע ניתוח כלשהו על מערך נתונים של RNA-seq. יש לי רשימה של תמלילים שהם lncRNA פוטנציאליים שעבורם ניהלתי גם מיישרים של קליסטו וגם של סלמון. נתוני הקלט לבניית האינדקס ולכימות כוללים mRNA וכן את ה- lncRNA הפוטנציאלי.

פקודות לשכפול אחד:

סלמון

  אינדקס סלמון - -keepDuplicates -t transcripts.fasta -i index_directory / -k 31salmon quant --seqBias --gcBias -i index_directory / --libType ISR --auxDir index_directory / -1 sample_R1.fastq.gz -2 sample_R2.fastq.gz -o output_name  

Kallisto

  kallisto index -i kallisto_index.idx transcripts. fastakallisto quant -i kallisto_index.idx -o output_name - rf-stranded sample_R1.fastq .gz sample_R2.fastq.gz  

ואז השתמשתי בערכי ה- tpm, עותקים משוכפלים בממוצע (3) ותיכנתי את מספר התמלילים לכל תנאי שהיו להם tpm> 2. אותה תוצאה עבור tpm> 5.

הגרף הבא מציג את ה- mRNA:

enter image description here

וגם עבור lncRNA:

enter image description here

שוב, הניתוח נעשה עם תמלילי lncRNA ו- mRNA יחד באותו קובץ fasta.

החפיפה לא מוצגת פה אך הוא תמיד קטן יותר מהספירה עבור Kallisto, עבור lncRNA.

בספרות נראה כי לשני הכלים יש תוצאות דומות. אני לא יכול למצוא סיבה לכך. אם תהיה שגיאה איפשהו הייתי מצפה לראות גם הבדלים ברנ"א העיבוי שלא קורים.

למרות שהשאלה נראית נהדרת, אני בספק אם נוכל לספק תשובה מבלי לדעת את הנתונים. האם תוכל לשכפל זאת במערך נתונים ציבורי? (אני חושב שלא תוכלו לשתף את הנתונים (המעובדים) לא?) אבל אולי השגיאות טמונות איפשהו בקוד המשמש ליצירת העלילות (נדיר, אבל זה יכול לקרות) ...
נכון, אני לא מסוגל לשתף פרטים על הנתונים. עם זאת אני יכול לנסות לשחזר את התוצאות באמצעות מערך נתונים ציבורי. לא רק כדי לערוך את השאלה, אלא למעשה זה יכול לתת כמה רמזים לגבי המתרחש במקרה של שגיאת קוד או בגלל סוג הנתונים. תודה על ההערה. רציתי לבדוק אם מישהו נתקל בבעיה זו מכיוון שהיא אינה המוקד העיקרי של הפרויקט שלי ולכן אני לא בטוח מתי אוכל לטפל בזה
אני חושב שעלילת פיזור של אומדני השפע מכל שיטה עשויה להיות השוואה אינפורמטיבית יותר. כלומר, עבור כל lncRNA, התווה את הערכתו של kallisto לעומת סלמון. האם הערכות הקליסטו נמוכות יותר באופן שיטתי או שאינן קיימות?
ששש, אל תגיד [ליאור פאצ'ר] (https://liorpachter.wordpress.com/2017/08/02/how-not-to-perform-a-differential-expression-analysis-or-science/).
אחד תשובה:
Lior Pachter
2019-05-15 03:14:16 UTC
view on stackexchange narkive permalink

נערכה השוואה מפורטת של kallisto וסלמון לתמלילי lncRNA על ידי Zheng et al. https://www.biorxiv.org/content/biorxiv/early/2018/01/09/241869.full.pdf

זה מראה שהם כמעט זהים. זה מרמז שיש בעיה כלשהי בדרך בה ביצעת את ההשוואה / העלילה.

היו לי תוצאות דומות להדפסה המקדימה כאשר ביצעתי השוואות בין שתי השיטות.


שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 4.0 עליו הוא מופץ.
Loading...