长得像的人 DNA 也相似,这事儿有科学实锤了

「诶,你跟我前女友长得挺像,我差点认错」

男生搭讪女孩,总有人用这种烂俗套近乎招数,整得大家仿佛很熟,仿佛很有缘分(手动狗头)。

当然,不止现实搭讪,长得像「异父异母亲兄弟姐妹」这件事,从来是网上玩梗打趣的热门话题…

比如,林东临和郭俊杰…

不光你我关心,这事儿被科学家拿来当成了研究问题,还有了结论:相似长相的人确实「有缘」,他们可能有相似 DNA

最新一份发表在 Cell 子刊的文章显示,面部相似的人共享着相同基因序列。这结论他们怎么得出的?靠谱么?一起来看看。

请机器来找「异父异母的亲兄弟」

首先要找一堆长相几乎一模一样的人作样本。面对全球 70 亿茫茫人海,怎么找是个问题。

科学家找到了加拿大艺术家弗朗索瓦布鲁内尔 (François Brunelle)。从 1999 年,这位艺术家就在全球收集相似人相。靠着「找对门路」,科学家获取了 32 对长相酷似的样本,并请参与者提供了详细的生物特征、所在地及生活方式问卷。

为保证脸部比对更客观,科学家找来三种算法 / 模型,共同「拆解」脸部细节,判断相似度。

其中包括了 ——

(1)自定义深度卷积神经网络 Custom-Net,一种来自 AI 公司 Herta,主用于监控领域的 CNN 模型;

(2)应用在 Matlab 上,常用于面部分类任务的 MatConvNet

(3)来自微软 Azure 的 Microsoft Oxford Project 人脸 API,常用于面部分析;

这些模型内置数百万参数,且历经上千主题下的数百万张面部图像训(折)练(磨),能识别姿势、发型、表情、年龄、配饰等诸多特征,对相似图像,模型将给出从 0 到 1 的一个相似度区间。

如果机器们三方「会审」一致判断极为相似,那科学家就会将样本作为重点研究对象。最终在 32 对样本中,有 16 对被三方认可。

之后是 DNA 比对环节。科学家利用一种名为单核苷酸多态性(SNP)的基因特征,比对各组长相高度相似人的唾液内 DNA 样本。

此后,再通过无监督聚类热图检测,让机器判断每对 DNA 是否属于一个类型(即相似)

结论有点因吹斯汀

结果显示,在 16 对「被机器全部认可」样本 DNA 中,科学家发现,有 9 对被聚成一类,他们在 3700 个基因中,共享了超过 19200 个 SNP。同样,在 K-means 算法中,最终结论也类似。

此外,科学家还研究了相似配对的生物特征及生活方式。他们在体重、身高、是否吸烟、教育水平等方面也在配对组中相互有关联,这说明,共享的遗传变异不仅影响长相,也造成相似的行为和习惯。

研究者形容该结果十分「striking」。研究者还排除了近亲关系的可能,并发现,这些样本比长相不同的双胞胎,基因相似度更高

更有意思的是,剩下 16 组未通过三方机器视觉特征认可的样本中,也只有一对样本 DNA 被聚类在一个集合。

在人种和地域方面,科学家还进行祖先溯源,他们观察到,几乎所有相似配对样本的祖上生活地区都很靠近。

但需要指出,本文主题在其他多组学研究中,却有着不同结论

比如 DNA 甲基化模式下,16 对高度相似样本只有一堆匹配;

再比如从微生物角度看,16 对相似样本中,口腔菌群相似的仅一对,且这对样本通过 SNP 也没被聚类到一起。该领域有研究认为,口腔微生物相似度与皮下脂肪有关,可能导致相似长相(如:脸上肉多)特征的人,有相似的口腔微生物特征。

团队介绍

本文一作 Ricky S. Joshi,计算生物学家,来自西班牙巴萨罗那 Josep Carreras 白血病研究所 (IJC),研究方向主要为遗传学和表现遗传学,其个人页面显示,Ricky 致力于发现人类基因组中的病理性变异。

二作 Maria Rigau ,同样 Base 在西班牙,是巴塞罗那超级计算中心 (BSC) 的博士,专业为生命科学,主页头像显示,这是一位蛮喜欢狗狗的女研究者。

One More Thing

有网友指出,马斯克长相有点像爱迪生,还 Po 了下面这张图 ——

不知你怎么看?(手动狗头)

参考链接:

https://www.cell.com/cell-reports/fulltext/S2211-1247(22)01075-0

https://neurosciencenews.com/genetics-look-alikes-21283/

https://hertasecurity.com/

https://bigthink.com/health/look-alike-genetics-behavior/