שְׁאֵלָה:
דגימת הפלוטיפים
Kozolovska
2018-08-08 15:01:07 UTC
view on stackexchange narkive permalink

אני מנסה לדמות גנום אחר של עמים, יש לי נתונים (קבצי VCF) של גנים שונים מפרויקט הגן 1000K.

אני רוצה לדמות גנומים שלמים שונים כלומר לייצר אוכלוסיה חדשה על ידי שילוב של הפלוטיפים אמיתיים שיש לי. אני תוהה מה הדרך הטובה ביותר להתמודד עם הבעיה. זוהי שיטה יעילה ליצירת גנוטיפים חדשים מציאותיים (לא רק לבחור חלקים באופן אקראי ולשלב אותם מחדש) על בסיס הגנוטיפים האמיתיים שכבר יש לי.

אני משתמש בחבילות Bioconductor VariantAnnotation כדי לקרוא ולתפעל את קבצי VCF ו- TxDb.Hsapiens.UCSC.hg19.knownGene כדי לקבוע את עמדות הגנים.

הנתונים נראים כך:

  > gene58 @ rowRangesGRanges אובייקט עם 91 טווחים ועמודה אחת של מטא נתונים: seqnames ranges strands strand | paramRangeID <Rle> <IRanges> <Rle> | <factor> rs551585351 1 229566998 * | <NA> rs528384854 1 229567027 * | <NA> rs542093083 1 229567063 * | <NA> rs561849701 1 229567128 * | <NA> rs531042647 1 229567160 * | <NA> ... ... ... .... ... rs565479298 1 229569784 * | <NA> rs572772527 1 229569785 * | <NA> rs605430 1 229569803 * | <NA> rs605428 1 229569804 * | <NA> rs368699658 1 229569810 * | <NA> ------- seqinfo: 86 רצפים מהגנום "hg19"  

מטריצת הגנוטיפ של הגן:

  > gene.mat [ 1: 5, 1: 5] HG00867 HG02371 HG00759 HG00766 HG00844
rs551585351 "0 | 0" "0 | 0" "0 | 0" "0 | 0" "0 | 0" rs528384854 "0 | 0" "0 | 0" "0 | 0" "0 | 0" "0 | 0 "rs542093083" 0 | 0 "" 0 | 0 "" 0 | 0 "" 0 | 0 "" 0 | 0 "rs561849701" 0 | 0 "" 0 | 0 "" 0 | 0 "" 0 | 0 "" 0 | 0 "rs531042647" 0 | 0 "" 0 | 0 "" 0 | 0 "" 0 | 0 "" 0 | 0 " 
שְׁלוֹשָׁה תשובות:
winni2k
2018-11-28 01:28:02 UTC
view on stackexchange narkive permalink

נראה שהנתונים במטריצה ​​שלך מקובץ VCF (לעיון, ראה https://github.com/samtools/hts-specs/blob/master/VCFv4.3.pdf ).

במפרט VCF ניתן לציין גנוטיפ הטרוזיגוטי כ- 0 | 1 . האפס והאחד מציינים את מספרי האללים (0 = ref, 1 = alt ראשון) המרכיבים את הגנוטיפ. ה"צינור "( | ) משמש לציון שהאללים נמצאים בשלב עם הערך הקודם בקובץ. לכן, אם אתה צופה בנתונים כאלה:

  "0 | 1" "0 | 0" "0 | 1" "1 | 1" "0 | 1" "1 | 1"  

אז זה אומר שלמדגם הראשון יש הפלוטיפים [0,0,0] ו- [1,1,1]; וכי המדגם השני מכיל את הפלוטיפים [0,1,1] ו- [0,1,1].

תודה, אבל זה לא למה שהתכוונתי, רציתי לדעת לשלב מחדש את הפלוטיפים כדי לייצר אוכלוסייה חדשה מתוכו. האם יש מקום בו סבירות גבוהה יותר להתרחש מחדש? האם יש תוכנית שבה אוכל להזין הפלוטיפים אמיתיים והיא תייצר אוכלוסייה?
הו! ובכן בהחלט יש תוכניות לכך. יש סיכוי שתוכל לנסח מחדש את ההודעה שלך כך שתכיל את השאלה הזו?
מקווה שכדאי להיטיב, תודיע לי אם השארתי משהו לא ברור.
winni2k
2018-12-06 23:28:37 UTC
view on stackexchange narkive permalink

עבור הדמיית הפלוטיפ פשוטה של ​​אנשים שאינם קשורים, יש את HapSim הנכבד של מונטנה. המודל המשמש בכלי זה הוא פשוט ועשוי להיות טוב מספיק למטרותיך. יהיה עליכם לרכוש מפת שיעורי רקומבינציה למשל מקונסורציום HapMap או מ- 1000G. חיפוש גוגל חטוף חשף גם את הכלי הזה וההדרכה שעשויים להתאים לבעיה שלך: https://adimitromanolakis.github.io/sim1000G/inst/doc/SimulatingFamilyData.html

יש עוד המון כלים עם דגמים מתקדמים יותר, אבל נשמע שכאלה יהיו מוגזמים כאן.

Emily_Ensembl
2018-08-13 12:29:44 UTC
view on stackexchange narkive permalink

להרכב יש הפלוטיפים מ -1000 גנומים שזמינים באמצעות תמליל.



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 4.0 עליו הוא מופץ.
Loading...