系统发育树构建中的模型选择-ChatGPT版本
系统发育树构建中的不同模型指的是在建立系统发育树(phylogenetic tree)时所使用的不同计算模型,这些模型用于描述不同的进化历程。它们通常基于分子序列数据或形态特征数据,并用来估计进化距离、基因替换率、分支长度和概率等参数。
一些常见的系统发育树构建模型包括:
- JC69 模型:最简单的核苷酸取代模型,假设所有碱基变异的概率相等。
- K80 模型:假设两种碱基之间的取代率可能不同。
- F81 模型:假设在整个进化过程中,各种碱基的频率保持不变。
- HKY85 模型:结合了 K80 和 F81 两个模型。
- GTR 模型:广义时间反转模型,假设在不同的 DNA 序列位置上具有不同的碱基频率和取代率。
- JTT 模型:氨基酸序列变异模型,假定氨基酸之间的取代率是不同的。
- WAG 模型:结合了 Jones-Taylor-Thornton 模型和 Whelan-And Goldman 模型。
- LG 模型:Le and Gascuel 模型,基于大量的蛋白质序列信息,用于研究复杂的分子进化过程。
这些模型在系统发育树的构建中发挥着关键作用,可以帮助研究人员更好地理解物种之间的进化关系和演化历史。
当涉及到用于构建系统发育树的氨基酸替代模型时,以下是一些常用的模型:
- Dayhoff 模型:由 Margaret Dayhoff 等人于 1978 年首次介绍,在蛋白质序列相似性研究中广泛使用。Dayhoff 模型将氨基酸分成五个分类,从最多不同到最相似的等级,使用一个氨基酸替代矩阵,用于描述每个分类之间的氨基酸替代概率。Dayhoff 模型被视为是 PAM 和 JTT 模型的前身,且与这些模型相比较已经过时。
- PAM 模型:由 Margaret Dayhoff 和 Robert V. Eck 等人于 1965 年提出,是最早广泛使用的氨基酸替代模型之一。PAM 模型使用一组大小为 1 的基础对数几率,然后使用在百万年(PAM:point accepted mutation)内氨基酸替代情况的比率,计算不同的氨基酸之间的一个置换矩阵。由此,PAM 模型基于相当长时间内的进化历史,用于描述氨基酸之间的替代率,因此在某些场景下已过时。
- JTT 模型:由 Jones 和 Taylor 在 1990 年提出,是基于最小二乘法的统计方法,也称之为 Jones–Taylor–Thornton 模型。它基于已知氨基酸序列采集数据,对不同氨基酸对之间的替代率进行建模。
- WAG 模型:由 Whelan 和 Goldman 于 2001 年提出,是一个更复杂的模型,在相似的氨基酸对之间,它使用一个独立的校正因子作为修正系数。该模型较适用于从一个群体里不同种的近亲中选出的窄群体的簇间区间树的建立。
- LG 模型:由 Le 和 Gascuel 在 2008 年提出,计算干扰之间氨基酸之间距离的信息进行系统发育树构建。它是 JTT 模型的扩展版本,使用更大的数据来精确地定义氨基酸之间的相似性。
- CAT 模型:复合自适应型细分替换模型(CAT),是由 Lartillot 和 Philippe 在 2004 年提出。它是一种广义和强大的氨基酸替代模型,能够通过独立地处理每个氨基酸站点,区分平滑和分段的现象。CAT 模型使用了一种混合模型,调整了氨基酸替换概率。它是一种先进的进化分析方法,较适用于复杂的氨基酸过程,尤其是在比较不相关的序列时。
这些模型是用于系统发育树构建中最常用的氨基酸替代模型之一。需要注意的是,不同模型的适用场景因数据类型、数据大小等因素的不同而有所不同。因此,在使用模型时,需要选择适合目标数据的模型,并比较模型的效果和准确性。
系统发育树构建中的模型选择-ChatGPT版本
https://lixiang117423.github.io/article/phylotree/