植物科学常用数据库和生物信息学工具 通用数据库http://bigd.big.ac.cn/databasecommons/ 国家基因库下属数据库,涵盖各种生物的全面公开可用的数据信息 2020-12-17 数据库 #数据库
安装hexo遇到的bug及解决方法 如果在运行hexo init和npm install报错的话,用 Node.js 自带的 Node.js command prompt 执行这两个命令就行了。 在cmd命令行中且切换目录:cd /d d: 2020-12-17 hexo #hexo
OPLS-DA在R语言中的实现 主成分分析(Principal Component Analysis,PCA)是一种无监督降维方法,能够有效对高维数据进行处理。但PCA对相关性较小的变量不敏感,而PLS-DA(Partial Least Squares-Discriminant Analysis,偏最小二乘判别分析)能够有效解决这个问题。而OPLS-DA(正交偏最小二乘判别分析)结合了正交信号和PLS-DA来筛选差异变量。 2020-12-13 R语言 #R语言
开发一个R包 R最强大的莫过于统计分析和可视化,关键是完全的开源免费啊。有时候使用多了以后,会积累一些函数或者是数据库,而这些函数和数据库通常能够帮助到别人,这时候就可以把这些函数或者是数据库打包成R包,上传到CRAN、Bioconductor或者是GitHub,让 其他的使用者使用自己的包。 2020-01-10 R语言 #R语言
iTOL修饰进化树 绘制进化树的软件很多,窗口界面的MEGA$^{[1]}$、Y叔R包ggtree$^{[2]}$等。MEGA属于神仙级别的软件,一篇文章拉高期刊的影响因子。而Y的ggtree更受R爱好者的青睐,可以各种尽情修饰进化树。相对来说,MEGA建的树就不是那么好看,需要后期修饰一下。修饰的软件推荐iTOL$^{[3]}$。大多数的参数直接在右边界面就能修改,但是如果需要批量修改颜色等信息的话,就需要写配置文 2020-01-09 生物信息学 #生物信息学
R语言批量合并Excel文件 离开实验室的时候一个同学在合并他们班的某个汇总表。常规操作,一个一个的复制粘贴的。我就想,这个肯定可以用编程搞定啊,Python或者R都行。回来就 R写了个代码,编了10000个文件用于代码测试。代码如下。 2020-01-07 R语言 #R语言
Python 爬取知乎问题 即将步入研究生,有什么忠告? 所有回答后将数据写入 Excel 并生成.html 文件 学Python爬虫一周多,今天练练手,爬取了一个自己感兴趣的知乎话题即将步入研究生,有什么忠告?。一共是272个答案,本次爬取的目的是爬取到所有回答者的昵称、个性签名、赞同数以及具体的内容。 2020-01-07 Python #Python
通过Linux命令行使用Aspera全速上传测序数据到NCBI数据库 每试错一次,就离本质就更近一步。——小蓝哥 为什么要上传数据实验室同学找我帮忙上传宏基因组数据到NCBI,大概是45G。NCBI提供了很多种可供选择的上传方式: 2020-01-07 生物信息学 #生物信息学