根据最近的一项研究,一旦个人达到65岁,也就是阿尔茨海默病的发病门槛,他们的遗传风险可能在决定他们是否会患上这种致命的大脑疾病方面发挥更大的作用,而不仅仅是他们的年龄。最近发表在《科学报告》杂志上的这项研究利用机器学习模型对患阿尔茨海默病的风险因素进行排序。
这是通过使用遗传风险分数、非遗传信息和近50万个人的电子健康记录数据实现的。这项研究是第一个将这些数据来源结合起来并根据其与阿尔茨海默病的关联强度对风险因素进行排名的研究。
研究人员利用这些模型对英国生物库中的两个人群的预测性风险因素进行排序: 40岁及以上的白人,以及65岁或以上的成年人的子集。
结果显示,年龄--根据阿尔茨海默氏症协会的说法,到85岁时构成总风险的三分之一--是整个人群中阿尔茨海默氏症的最大风险因素,但对于老年人来说,由多基因风险得分决定的遗传风险更具预测性。
"我们都知道阿尔茨海默病是一种晚发疾病,所以我们知道年龄是一个重要的风险因素。但是当我们只考虑65岁或以上的人的风险时,那么由多基因风险评分所捕获的遗传信息就比年龄高,"研究的主要作者、俄亥俄州立大学医学院眼科和视觉科学以及生物医学信息学的副教授Xiaoyi Raymond Gao说。"这意味着当我们研究阿尔茨海默病时,考虑遗传信息真的很重要。"
家庭收入低也是一个重要的风险因素,在年龄和遗传的影响之后排名第三或第四。
"与收入有关的发现是非常非常有趣的,"高说,他也是俄亥俄州立大学人类遗传学系的成员,他的实验室使用生物医学大数据和人工智能来研究阿尔茨海默病和眼部疾病背后的遗传学。我们都希望有健康的生活,而收入可能是一个如此重要的因素,决定你能吃得起什么,你能住得起哪里,教育水平,获得护理 - 所有这些都可能导致阿尔茨海默氏病。"
在样本中的457936名英国生物银行参与者中,2177人已经患上阿尔茨海默病,455759人没有,88309人是65岁或以上。
一些在阿尔茨海默病(AD)患者和非患者之间存在差异的非遗传风险因素非常突出: 结果显示,在阿尔茨海默病患者中,较高的收缩压和较低的舒张压更为常见,糖尿病更为普遍,家庭收入和教育程度较低,而最近的跌倒、听力困难和母亲有阿尔茨海默病的历史则更高。
全部成人样本的前20名风险因素清单还包括诊断为高血压、尿路感染、抑郁症发作、昏厥、未指明的胸痛、迷失方向和异常体重减轻。65岁及以上人群中排名前20的其他风险因素包括高胆固醇和步态异常。这些发现显示了将电子健康记录中的病情代码加入模型的力量。
"机器学习可以探索所有这些特征或变量之间的关系,挑选重要的特征,并将某些对阿尔茨海默病风险的贡献比其他特征大得多的特征排在最前面,"Gao说。"通常来说,高度肥胖是不好的,但我们在这里也看到,较低的身体质量指数是不好的。高血压通常不是好事,但在这里我们看到较低的舒张压也不是好事。这些模型揭示了一些有趣的模式"。
建立这些模型是一个两步的过程。该团队首先利用阿尔茨海默病遗传学联盟的数据进行了全基因组关联研究,以确定与阿尔茨海默病总体风险和特定年龄后疾病发展有关的遗传变异。这些独立的变体集合被用来建立两个多基因风险评分,将整个基因组的遗传效应汇总为每个人的单一风险衡量。
这些分数被应用于英国生物银行参与者的DNA数据,并与生物银行的常规风险因素(如性别、教育、体重指数和血压)以及个人记录中引用的11000多个电子健康记录条件代码相结合。
该团队在解释模型的输出时还使用了一种算法,以确保风险因素变量在分析中被客观地加权。
他说,我们出生时的疾病遗传风险已经确定,但是关于其他健康和社会经济因素如何影响我们患阿尔茨海默氏症的风险的信息--以及高氏也研究的青光眼--给了我们采取预防措施的力量。
"如果人们对风险因素有更多了解,他们就有可能调整自己的生活方式。对于阿尔茨海默氏症和青光眼来说,没有治疗方法,所以预防可以有很大的帮助,"Gao说。"我也希望构建模型来进行这些预测可以帮助药物开发和有效的、低成本的筛查项目。"