我的生信之路
一直想写写自己的生信之路,一直耽误,一直没有完成,今天收完实验室,晚上写写这个,就当放松了。
我的生信水平
按照行业的说法,我现在的水平就是Level 0。简单来说就是跑流程。转录组、微生物组、代谢组啥的都能跑跑流程。
初识生信
那是我刚刚本科毕业的时候,2018年7月的时候,由于考研考的本校,本科毕业就直接进实验室继续做实验学习。那时候我根本不知道什么是生物信息学,只是听导师偶尔提提。当时手里在做的项目是水稻的群体遗传学,肯定不会让我分析,我干的活是提DNA。大概是800+的DNA样品,工作就是种水稻,提DNA。假期的时候,导师让我去一个师兄的公司学习生物信息学,因为当时是想做那个水稻材料的GWAS,就想着让我去学GWAS。去的前几天,那个师兄让我安装个虚拟机,学学R和perl。然后就是折腾虚拟机的安装,那时候电脑性能一般,虚拟机卡的不行。也没学到个啥。大概是7月15号左右,就去师兄的公司了。去到公司,师兄把我交给另外一个工作人员,让我不懂的问他。那个工作人员随机给我开通了公司服务器的账号,可是我死活都连不上。快到中午的时候实在是没办法了,就请教那个兄弟,他问我连接的是不是公司的网络,我说不是,他告诉我要公司的网络才能连接上服务器。真的是太囧了嘞。师兄告诉我说不建议一上来就学GWAS,建议先从转录组开始。就让我自己从网上下载数据跑转录组流程。怎么说呢,那时候接触Linux不久,对命令行了解真的是小白水平,好多东西都无法解决。我忘不了成功下载NCBI原始数据的喜悦,真的是太开心了,也感叹公司的网络真好,下载速度那么快。然后是原始数据的质控,看到自己跑出来的质控结果,非常开心。最难的一步,是转录本定量吧,我一直没搞定,从网上看了好多方法都没有成功定量到counts值。直到我开学离开公司都没有完成这步。由于要开学,就先离开公司回学校了。这也算是我跟生信的初识吧。我一直记得那个园区的食堂是真的很难吃,每天下午下班我都会走路去吃一家重庆燃面,然后坐公交车回住的地方。郊区的公路是真的很灰,跑步都会搞得灰头土脸的那种。
R相伴
在整个过程中,不管是网上的教程还是公司的朋友们,都在说R语言。我压根不知道这东西能干啥。看了网上很多帖子都说R语言很重要,那就学习吧。不知道有多少人跟我一样学R是从《R语言实战2》开始的。首先,感谢这本书教会我R的基础;但是,这本书是真的写得一般。我还记得画个图要先各种设置画布,超级麻烦。直到后来学习ggplot2、tidyverse这些书籍,真的是大开眼界。在学习R以前,我的电脑里面装了各种破解软件,SPSS啊,origin lab啊啥的。现在的新电脑了没有这些软件了。学习R给我带来什么好处呢?
- 批量处理数据,解放自己。有个师姐要从一大个EXcel表格中筛选出每个采样点的采样数量,点鼠标好几天了还没有统计完,我说可以试试,写了个循环,
经验Tips
- 学会分享。三年前在简书的博客(https://www.jianshu.com/p/16d6c22ef71e)被阅读19k+次,其实整个就是我自己学了以后在简书上分享的,不知道我的这个文章帮助了多少人,我一定知道的是我被无数人的文章帮助过。感谢那些无私分享的人。
- 学会检索。一路学习过来,我觉得最重要的就是学会检索吧,现在不管遇到啥我都是先上谷歌搜索一番,通常都能找到答案的。
💌lixiang117423@foxmail.com
💌lixiang117423@gmail.com