如何批量从NCBI下载基因组数据 想下载几千个细菌的基因组做泛基因组分析,结果啊总是网络错误下载失败。于是我就搜了搜,发现这个: Genomes Download (FTP) FAQ 发现这个链接的命名非常有规律可循。 那就R语言伺候: 1234567891011121314df.bins.pan.info %>% dplyr::select(`Assembly Accession`, `Assembly Name` 2023-07-06 #生物信息学
Conda安装最新版R 1234conda config --add channels conda-forgeconda config --set channel_priority strictconda search r-baseconda install -c conda-forge r-base=4.1.2 💌lixiang117423@foxmail.com💌lixiang117423@gmail.com 2022-03-28 生物信息学 #生物信息学
微生物组VSEARCH学习笔记 文献 Rognes T, Flouri T, Nichols B, et al. VSEARCH: a versatile open source tool for metagenomics[J]. PeerJ, 2016, 4: e2584. 安装直接使用mamba安装: 1mamba install bioconda::vsearch 流程常规的扩增子流程: 序列双端合并;去除两端接头,F 2024-02-20 生物信息学 #生物信息学
自动下载校验fastq文件 首先,直接在ENA上检索想要下载的数据,如: 有两个信息很重要,MD5值和Aspera链接。 选择TSV下载格式将信息下载下来,然后使用R进行处理,获得最终要的数据格式。R代码如下: 1234567891011121314151617181920212223rm(list = ls())dir("data/生信挖掘/水稻多效基因/data/ENA下载信息/") %>% as.data. 2024-08-21 生物信息学 #生物信息学
Blossom配置 准备在NAS上折腾的,各种端口开放不方便,直接就用腾讯云服务器折腾吧。。。。。。 安装并运行数据库安装: 1docker pull mysql:8.0.31 运行: 官方模板 123456789101112docker run \-d \--name mysql \#【可选修改】数据库 root 用户的密码 -e MYSQL_ROOT_PASSWORD=jasmine888 \-p 3306: 2023-12-10 生物信息学 #生物信息学
细菌泛基因组分析工具panX 下载安装 Ding W, Baumdicker F, Neher R A. panX: pan-genome analysis and exploration[J]. Nucleic acids research, 2018, 46(1): e5-e5. 我是用mamba安装的: 123mamba create --name panXmamba activate panXmamba insta 2023-07-08 生物信息学 #生物信息学
Kraken taxonomic sequence classification system Version 2.1.3 Operating Manual Table of Contents Introduction System Requirements Installation Kraken 2 Databases Standard Kraken 2 Databa 2025-11-14
Docker配置阿里云镜像 登录阿里云获取专用镜像链接:https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors 修改配置文件 1sudo vi /etc/docker/daemon.json 加入下面的内容: 123{ "registry-mirrors": ["https://xxxxxxx.mirror.aliyuncs.com"]} 💌l 2022-06-19 生物信息学 #生物信息学
R语言自动跳过Error实现循环 经常要批量读取网页文件,有时候URL会报错,循环的程序就断开了,很麻烦。学习到一种tryCatch的方法。 12345678910111213141516171819202122for (i in 1:nrow(kegg.id)) { tryCatch({ Sys.sleep(0.5) KEGGREST::keggGet(kegg.id$id[i]) -> temp 2023-03-02 生物信息学 #生物信息学
分类-回归树(CART)在R语言中的实现 CART 模型 ,即 Classification And Regression Trees。它和一般回归分析类似,是用来对变量进行解释和预测的工具,也是数据挖掘中的一种常用算法。如果因变量是连续数据,相对应的分析称为回归树,如果因变量是分类数据,则相应的分析称为分类树。 2020-12-22 R语言 #R语言