从“垃圾”DNA中发现自闭症的新病因 《轻度自闭症》
这项研究首次确定了由非遗传性非编码突变引起的复杂人类疾病,具有重要意义。同样,科学家可以在研究中应用新技术,探索非编码突变在癌症和心脏病等疾病中的作用。这将使人们对许多人类疾病的原因有新的认识。
分析模型还预测了每个自闭症儿童的非遗传性非编码突变,即前面提到的“垃圾DNA”的影响。然后,研究人员将这些预测结果与其他未受影响的兄弟姐妹的非编码非突变区域进行了比较。结果发现,与非编码区突变相关的自闭症病例数量与编码区突变数量相等!换句话说,非编码突变是自闭症的另一个重要原因。
研究还发现,这些非编码突变不仅改变了基因调控,还影响了大脑中的基因表达和已知与自闭症有关的基因,如负责神经元迁移和发育的基因。
在这项最新研究中,研究团队训练了人工智能学习模型,以预测给定序列如何影响基因表达。然后他们使用机器学习分析了1790名自闭症患者、他们的父母和没有患病的兄弟姐妹的整个基因组。选择这些患者是因为他们的自闭症是一种新的突变,与遗传无关。
突破自闭症一直是遗传学家面临的棘手挑战。遗传规律表明它有很强的遗传因素。已知在自闭症中起作用的基因变异只能解释大约20%的病例。寻找可能导致自闭症的其他变异需要从与25,000个其他人类基因和周围DNA相关的数据中找到线索。对于研究人员来说,这是一个艰巨的挑战。通过使用人工智能构建基因相互作用的图谱,可以将识别出的自闭症风险基因与成千上万个与自闭症相关的未知基因进行比较,并快速找出它们的相似之处。
最早的研究“非编码DNA突变可能导致遗传性自闭症风险”发现,新基因突变(de novo mutation)只能解释约三分之一的自闭症谱系障碍(ASD)病例,而剩余的风险可能解释为非编码DNA的罕见遗传变异。
然而,正如遗传学家最近认识到的那样,基因并不是“孤独的”。它们的行为受到附近数百万非编码碱基的影响。这些非编码碱基与DNA结合蛋白和其他因子相互作用。人工智能可以用来确认哪些非编码变异可能影响附近的自闭症基因。
由于信息数据巨大,而对非编码区功能的了解却很少,因此对自闭症非编码区的功能进行图谱绘制极其困难。
在基因组计划中发现,基因组中能编码蛋白质的部分仅占人类基因组的2%左右,其余98%的基因组为非编码区,既不能转录成相应的信使RNA,也不能用来指导蛋白质的合成。一度被认为是“垃圾DNA”,无人问津。
目前,人工智能(AI)可谓科学界排名第一的“网络名人”,从沃斯顿机器人不到10分钟确诊白血病,到阿尔法狗击败世界排名第一的围棋选手;从战场到太空,随处可见。美国《科学》杂志在最近的一篇报道中指出,人工智能已经渗透到科学研究领域,它正在以各种方式玩弄医疗。
近日,发表在《自然遗传学》杂志上的一项研究,结合人工智能的技术优势,首次将非编码DNA突变与神经发育联系起来,也首次明确了非遗传非编码DNA突变可能是人类各种复杂疾病的新病因。
随后,研究人员对近2000个家庭进行了全基因组测序研究。结果发现,自闭症儿童的启动子区(非编码区)比他们的兄弟姐妹有更多的新突变,而不是他们父母的遗传。这也表明了非编码区的新突变可能导致自闭症的可能性。
这个基因研究的分析中引入了一个新的观点。这里应用了一套智能而复杂的工具,任何特定的突变都会发生什么,甚至是那些罕见的或者以前从未观察到的。

- 发表评论
-
- 最新评论 进入详细评论页>>

