TASSEL进行GWAS分析 一开始折腾的是GAPIT,可是老是报错,实在是没办法了,就折腾TASSEL. 参考文献 Bradbury P J, Zhang Z, Kroon D E, et al. TASSEL: software for association mapping of complex traits in diverse samples[J]. Bioinformatics, 2007, 23(19): 263 2024-01-04 生物信息学 #生物信息学
真菌分泌蛋白预测流程 软件配置DeepLoc 2.0参考文献: Thumuluri V, Almagro Armenteros J J, Johansen A R, et al. DeepLoc 2.0: multi-label subcellular localization prediction using protein language models[J]. Nucleic acids research, 2 2024-08-29 生物信息学 #生物信息学
遗传力的概念和计算 前言在作物育种过程中,通常会有多年多点的试验,这种试验通常叫做多环境试验(multi-environment trial,MET)。为了对MET进行准确的测量、最终实现实现MET的准确比较,育种学家通常会计算广义遗传力和狭义遗传力。这个文档主要有三个目的: 说清楚遗传力的概念; 展示使用合适的方法计算遗传力; 提供稳定的方法计算和比较田间试验的准确信。 遗传力的定义下图A中的公式表示表型可以用 2024-08-27 生物信息学 #生物信息学
自动下载校验fastq文件 首先,直接在ENA上检索想要下载的数据,如: 有两个信息很重要,MD5值和Aspera链接。 选择TSV下载格式将信息下载下来,然后使用R进行处理,获得最终要的数据格式。R代码如下: 1234567891011121314151617181920212223rm(list = ls())dir("data/生信挖掘/水稻多效基因/data/ENA下载信息/") %>% as.data. 2024-08-21 生物信息学 #生物信息学
BLUP和BLUE 为何要计算 BLUE 值?一年多点或者多年多点的植物数据中,一个基因型(品种)往往有多个表型数据,但只有一个基因型,在 GWAS 关联分析中,就需要一个基因型对应一个表型数据。 之所以有多个表型数据的原因: 或者是多个重复 或者是多个地点的数据 或者是多个年份的数据 问题:如何计算得到一个表型数据呢? 解答:可以使用多个表型值的平均值,作为品种的表型值,现在有更好的方法:BLUE 值。 为何使 2024-08-07 生物信息学 #生物信息学
Positron设置快捷键 毫无疑问,Positron是非常好用的,可是一些快捷键无法设置,那就直接编辑快捷键吧。 找到Positron的安装路径下的这个文件keybindings.json,我的路径是: 1C:\Users\xxx\AppData\Roaming\Positron\User\keybindings.json 我编辑的是我自己常用的三个快捷键: 123456789101112131415{ "k 2024-07-10 生物信息学 #生物信息学
NCBI数据库BioProject中的Description 1234567891011121314151617181920212223242526272829303132333435363738394041424344import requestsfrom bs4 import BeautifulSoupfile_path = "D:/OneDrive/NAS/科研相关/PhData/data/生信挖掘/水稻多效基因/data/NCBI.BioProjec 2024-06-16 生物信息学 #生物信息学
代谢物鉴定函数 123456callDAMs(metabolites.table = metabolites.table, phenotype.table = phenotype.table, group.table = group.table, use.lm = TRUE, use.cor = TRUE, lm.R2 = 0.5) 2024-06-12 生物信息学 #生物信息学
JASPAR爬取Class信息 12345678910111213141516171819202122232425262728import requestsfrom bs4 import BeautifulSoupfile_out = open("D:/群晖NAS/Desktop/MEME网站结果/JASPAR.爬虫结果.txt", "w")with open("D:/群晖NAS/Desktop/MEME网站结果/JASPAR. 2024-03-22 生物信息学 #生物信息学
Rstudio-Server安装igraph报错解决 加载igraph时报错: 123错误: package or namespace load failed for ‘phyloseq’ in dyn.load(file, DLLpath = DLLpath, ...): 无法载入共享目标对象‘/usr/local/lib/R/site-library/igraph/libs/igraph.so’:: libglpk.so.40: 无法打开共享对 2024-03-07 生物信息学 #生物信息学
微生物组VSEARCH学习笔记 文献 Rognes T, Flouri T, Nichols B, et al. VSEARCH: a versatile open source tool for metagenomics[J]. PeerJ, 2016, 4: e2584. 安装直接使用mamba安装: 1mamba install bioconda::vsearch 流程常规的扩增子流程: 序列双端合并;去除两端接头,F 2024-02-20 生物信息学 #生物信息学