记录转录组遇到的一个坑

跑水稻的转录组,96个样品。

前面的所有流程都没有问题,跑到Counts计数的时候,全部都是0!!!不管是HtSeq还是FeatureCounts,计算出来全部都是0。然后我重新下载了别的参考基因组和注释信息,跑出来完全没有问题。一直不知道是哪里出现了问题。我也忘记是怎么排查的了,发现基因组染色体的名称和gtf文件里面的不一样:

  • 基因组文件的染色体编号:
1
2
3
4
5
6
7
8
9
10
11
12
>Chr1_IR64
>Chr2_IR64
>Chr3_IR64
>Chr4_IR64
>Chr5_IR64
>Chr6_IR64
>Chr7_IR64
>Chr8_IR64
>Chr9_IR64
>Chr10_IR64
>Chr11_IR64
>Chr12_IR64
  • gtf文件长这样:
1
2
3
4
5
6
7
8
9
10
Chr1    IR64    transcript      1870    3544    .       +       .       transcript_id "OsIR64G0100000100.01.T04"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 exon 1870 2207 . + . transcript_id "OsIR64G0100000100.01.T04"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 exon 2293 2555 . + . transcript_id "OsIR64G0100000100.01.T04"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 exon 3296 3544 . + . transcript_id "OsIR64G0100000100.01.T04"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 CDS 2388 2555 . + 0 transcript_id "OsIR64G0100000100.01.T04"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 CDS 3296 3403 . + 0 transcript_id "OsIR64G0100000100.01.T04"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 transcript 1870 7601 . + . transcript_id "OsIR64G0100000100.01.T03"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 exon 1870 2207 . + . transcript_id "OsIR64G0100000100.01.T03"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 exon 2293 2555 . + . transcript_id "OsIR64G0100000100.01.T03"; gene_id "OsIR64G0100000100.01";
Chr1 IR64 exon 3296 3394 . + . transcript_id "OsIR64G0100000100.01.T03"; gene_id "OsIR64G0100000100.01";

索性直接把基因组里面的ID换掉,和gtf文件保持一致。

然后,居然就OK了,真的是万万没想到阿!😄


💌lixiang117423@foxmail.com
💌lixiang117423@gmail.com


记录转录组遇到的一个坑
https://lixiang117423.github.io/article/onebug4rnaseq/
作者
小蓝哥
发布于
2022年1月15日
许可协议