首页 / 知乎精选 / 正文

如果亲生孩子跟父亲的基因相似度高达99.9,和母亲的也99.9,那岂不是父亲和母亲的也高达99.9?

知乎精选 2025-06-02 16:30:09

这取决于你用什么标准衡量“基因相似度”。让题述的“如果”成立的标准是粗糙的,提问者对此产生怀疑是有道理的。不过,“岂不是”后面的部分在数学上不准确,孩子与父母的差异可以出在不同序列上。

历史上,一些人类基因组测序方面的研究发现,人类基因组里每 1000 个碱基对平均而言包含 1 处单核苷酸多态性(Single-Nucleotide Polymorphism, SNP)。一些来源据此声称,从大街上任取两个人,基因相似度都有 99.9%——用这个标准,某人的父母当然彼此有 99.9% 的基因相似度了,但是这意味着某人跟萨达姆、本拉登、希特勒也有 99.9% 的基因相似度。显然,基于 DNA 的亲子鉴定不可能是这样运作的。

  • DNA 亲子鉴定通常比对常染色体上的若干短串联重复序列[1]的碱基序列,“匹配”指检测范围内的序列相同(尤其是有相同的单核苷酸多态性),父母和子女通常各自约 50% 匹配、父母双方都提供样本时准确率较高。同卵双胞胎接近 100% 匹配,其余兄弟姐妹(包括异卵双胞胎)约 37.5% 到 50% 匹配,诸如此类。

如果用现有技术对从大街上任取的两个人进行测序、比较全长序列,那么核苷酸序列完全重合的比例大抵不会有 99.9% 这么高。

  • 例如,2010 年发表的一篇文章比较了科学家克雷格·文特尔的基因组和共有参考序列,发现插入、缺失、拷贝数多型性[2]提供至多 1.2% 的差异,单核苷酸多态性提供约 0.1% 的差异,倒位[3]提供至多 0.3% 的差异——差异至多约 1.6%,重合至少约 98.4%[4].

在谈论这些之前,读者就可以注意到,如果不考虑染色体畸变、SRY 基因相关突变等情况,那么某人的父亲和母亲通常具有不同的核型:父亲是 46 XY,母亲是 46 XX. 根据 2022 年的端粒到端粒的人类参考基因组 CHMv2.0,X 染色体占人类单倍体基因组全长的约 5.04%,包含大致相同百分比的已知基因。相比之下,Y 染色体占人类单倍体基因组全长的不到 1%——那么,你觉得某人的父亲和母亲的二倍体全长序列会不会因为 X 染色体与 Y 染色体的差异而具有高于 1% 的差异呢?

  • 在这个场合,一些人可能会提出,父亲的 1 个 X 染色体与母亲的任意一个 X 染色体有很高的序列相似度,母亲体内随机发生的 X 失活让母亲的大多数正常有核体细胞表达的 X 染色体基因与父亲的正常有核体细胞表达的 X 染色体基因高度相似——这不是比较全长序列的方法。若是比较转录组,非编码序列的大多数差异和编码序列里的同义突变可能会被忽略。
  • 类似地,父亲和女儿、母亲和儿子在正常情况下都会有核型导致的序列差异。
  • 如果忽略不影响翻译产物的差异,那么任取两个正常人,DNA 序列相似度通常有 99.4% 以上。使用这种标准,正常情况下,父亲与儿子、母亲与女儿的相似度会比这更高,但不一定有 99.9% 那么高;父母之间的基因相似度通常会接近 99.4%,近亲结合的父母彼此也没有 99.9% 的相似度。

顺便说,Natasha Glover 以 Ensembl Compara 的数据为人与黑猩猩、人与老鼠、人与斑马鱼进行全基因组比对,发现人和斑马鱼的全基因组序列重合约 1%[5],人和黑猩猩的全基因组序列重合约 91%,人和老鼠的全基因组序列重合约 32%~

时讯快报

5.5亿用户的选择

立即打开