统计建模学习笔记 统计建模什么是统计模型所有的假设统计检验和参数的统计估计都来源于统计模型。那么,什么是统计模型呢?可以将统计模型简单理解为一个数学等式。 概率的类型基本上可以分为两类: aleatory probability:可以理解为客观的概率,不受人为影响,如骰子出现的数字; epistemic probability:主观概率,比如提前知道骰子被动了手脚,那么每个数字出现的概率就不相等了。 概率和统计 2023-05-11 生物信息学 #生物信息学
群体遗传学与重测序分析 分子层面对生物的研究,在个体水平上主要是看单个基因的变化以及全转录本的变化(RNA-seq);在对个体的研究的基础上,开始了群体水平的研究。如果说常规的遗传学主要的研究对象是个体或者个体家系的话,那么群体遗传学则是主要研究由不同个体组成的群体的遗传规律。在测序技术大力发展之前,对群体主要是依靠表型进行研究,如加拉巴哥群岛的13中鸟雀有着不同的喙,达尔文认为这是自然选择造成的后果1。达尔文的进化论对 2020-01-07 生物信息学 #生物信息学
转录组+代谢组筛选柳枝稷耐旱相关代谢物 柳枝稷简介柳枝稷是多年生草本植物,主要有南北两个生态型。 重要的生物燃料:较高的能量效率+较好耐旱性; 合适的牛饲料; 水土保持功能; 鸟类保育功能。 研究目的柳枝稷是单子叶植物,同为单子叶植物的玉米和水稻在响应干旱胁迫时都有着特异性的代谢反应,但是还没有柳枝稷响应干旱胁迫时特异性代谢的相关研究。 研究方法 研究结果在干旱胁迫3~4周的时候两个柳枝稷展示出明显的耐旱差异(上图,左侧为处理,右 2022-09-05 文献阅读 #转录组 #代谢组
转录组Ballgown流程 前处理: gff转换成gtf: 1gffread Oryza_sativa.IRGSP-1.0.51.gff3 -T -o rice.gtf 提取外显子和可变剪切: 123hisat2_extract_exons.py IRGSP-1.0_representative_transcript_exon_2021-05-10.gtf >IRGSP-1.0.exon hisat2_extract 2021-11-23 生物信息学 #生物信息学 #软件安装 #RNA-Seq
通过Linux命令行使用Aspera全速上传测序数据到NCBI数据库 每试错一次,就离本质就更近一步。——小蓝哥 为什么要上传数据实验室同学找我帮忙上传宏基因组数据到NCBI,大概是45G。NCBI提供了很多种可供选择的上传方式: 2020-01-07 生物信息学 #生物信息学
转录组Htseq流程 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210 2021-11-23 生物信息学 #生物信息学 #软件使用 #RNA-Seq #Htseq
重测序分析脚本 重测序与群体遗传学 云南农业大学 云南生物资源保护与利用国家重点实验室 (李详 2019年12月31日) 软件安装该部分软件很难用conda直接安装,安装步骤比较特殊。 2021-11-23 生物信息学 - 群体遗传学 - Linux #生物信息学 #Linux
韦恩图 在R语言中绘制韦恩图通常有两种方法,小于5个集合的用R包VennDiagram即可完成绘制;超过5个的使用R包UpSetR进行绘制。 VennDiagram12345678910111213141516171819202122232425262728rm(list = ls())data.test = data.frame(A = rep(c('a','b','c'),c(10,23,17)), 2022-01-20 生物信息学 #生物信息学 #R
PCA在R语言中的实现 PCA 简介PCA(Principal Component Analysis),即主成分分析。PCA是一种研究数据相似性或差异性的可视化方法,采取降维的思想,PCA 可以找到距离矩阵中最主要的坐标,把复杂的数据用一系列的特征值和特征向量进行排序后,选择主要的前几位特征值,来表示样品之间的关系。通过 PCA 可以观察个体或群体间的差异。PC 后面的百分数表示对应特征向量对数据的解释量,此值越大越好。 2020-01-07 R语言 #R语言
Python 爬取知乎问题 即将步入研究生,有什么忠告? 所有回答后将数据写入 Excel 并生成.html 文件 学Python爬虫一周多,今天练练手,爬取了一个自己感兴趣的知乎话题即将步入研究生,有什么忠告?。一共是272个答案,本次爬取的目的是爬取到所有回答者的昵称、个性签名、赞同数以及具体的内容。 2020-01-07 Python #Python