שְׁאֵלָה:
כיצד להמיר את הקובץ .vcf (נזקף) בתבנית GT: GP ל- GT: DS?
Nilufer
2017-06-29 20:45:09 UTC
view on stackexchange narkive permalink

יש לי את הנתונים הגנוטיפיים מפלט impute2 בפורמט .gen (נזקף ל- 1000G P3). לקובץ יש הסתברויות אחוריות של גנוטיפ (GP: 3 ערכים לגרסה). הסברתי את .gen ל- .vcf באמצעות qctools ולקובץ .vcf יש פורמט GT: GP. אני צריך להמיר את קובץ ה- .vcf בפורמט GT: GP ל- GT: DS. מומלץ להשתמש במינונים של גנוטיפ לשימוש בניתוח qtltools / fastqtl. עם זאת, אני לא יכול למצוא כלי שישמור על פורמט .vcf וימיר GP ל- DS. כל עזרה מוערכת מאוד!

שְׁלוֹשָׁה תשובות:
Tim
2017-06-29 21:57:57 UTC
view on stackexchange narkive permalink

אתה יכול לעשות זאת ב- שלום.

הנה הקוד הגס לעשות זאת (0.1 גרסאות).

הגדרה:

מייבוא ​​ברד * hc = HailContext ()

ייבא את קובץ ה- .gen. VCF עובד גם הוא:

  dataset = hc.import_gen ('src / test / resources / example.gen', 'src / test / resources / example.sample')   קדם> 

הפוך מחדש את סכימת הגנוטיפ וייצא ל- VCF:

  dataset.annotate_genotypes_expr ('g = {GT: g.call (), DS: g.dosage ()}') \ .export_vcf ('/ tmp / out.vcf.bgz')  

התבונן בדף התחלת העבודה אם ברצונך לנסות זאת!

עלי לציין כי יתכן שתוכל לבצע ניתוחי QTL ב- Hail, תלוי בשיטה בה ברצונך להשתמש. ראה פוסט בבלוג כאן.

Hannah
2017-07-25 00:52:44 UTC
view on stackexchange narkive permalink

הממ, לא ידעתי שהתוסף קיים ולכן כתבתי סקריפט משלי כדי להמיר GP למינון אללים מינורי ב- github. אולי מישהו אחר ימצא את זה שימושי :) https://github.com/7methylg/VCF-GP-to-DS

winni2k
2017-06-30 17:44:22 UTC
view on stackexchange narkive permalink

יש תוסף המינון ל- bcftools, אך הוא מוציא רק ערכים המופרדים בין הכרטיסיות. לא יהיה קשה מדי להאריך את התוסף כדי להפיק VCF עם תג DS במקום זאת, אך זה עדיין לא נעשה. יש סיכוי טוב שה- bcftools devs יגיבו ל בקשת תכונות...

בכל מקרה, קוד זה:

  curl https: //raw.githubusercontent.com/samtools/bcftools/develop/test/convert.vcf > convert.vcfbcftools + מינון convert.vcf > output.tsvhead -2 output.tsv 

יש את פלט:

  # [1] CHROM [2] POS [3] REF [4] ALT [5] NA00001 [6] NA00002 [7] NA00003 [8] NA00004 [9] NA00005 [ 10] NA00006 [11] NA00007 [12] NA00008 [13] NA00009 [14] NA00010X 2698560 GA 0.1 0.0 0.1 0.2 0.3 0.2 0.2 0.2 0.2 0.1  

זה משתמש ב- bcftools גרסה 1.3.1 .

הנה קטע מהמדריך bcftools לתוסף המינון:

מינון

מינון הדפס גנוטיפ. כברירת מחדל התוסף מחפש PL, GL ו- GT, לפי הסדר הזה.



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...