深学习以惊人的速度解决生物学上最深的秘密。

刚刚一个月前,深刻打破了一个50岁的大挑战:蛋白质折叠。一周后,它们产生了一个超过350,000个蛋白质结构的完全变化的数据库,包括98%的已知人类蛋白质。结构是生物学功能的核心。数据转储,设置为爆炸1.3亿在年底到年底,允许科学家们将前面的“暗物质” - 蛋白质看不见,未经人体的化妆。

最终的结果是革命性的无异。从基础生命科学研究开发新的药物来对抗我们的最棘手的敌人疾病,如癌症,深度学习给了我们一个千载难逢键解锁新的生物机制 - 天然或合成 - 以前是无法实现的。

现在,AI宠儿被设置为RNA做同样的。

作为“DNA至RNA至蛋白质”中央教条的中间孩子,RNA直到它的Covid-19疫苗贡献。但是,分子是一种双英雄:它既携带的遗传信息,而且,根据其结构可以催化生物功能,调节哪些基因被开启,调整你的免疫系统,甚至是疯狂的,潜在的传下“回忆”通过世代。

这也是令人沮丧很难理解。

类似的蛋白质,RNA也折叠成复杂的三维结构。差,根据博士。Rhiju DAS和罗恩·德罗尔在斯坦福大学,是我们比较小的知道这些分子。有30倍,许多类型的RNA作为有蛋白质,但相比于蛋白质破译RNA结构的数量小于百分之一。

斯坦福大学的团队决定弥补这一差距。在一个上周公布的科学,它们描述的深学习算法称为ARES(原子回转类等效射手),其有效地解决RNA结构,爆破以前的尝试出来的水。

作者“已经在这已被证明难以进行变革的进步一个领域取得了显着的进步,说:”凯文博士周北卡罗莱纳大学,谁没有参与这项研究。

甚至更令人印象深刻,Ares仅在18个RNA结构培训,但能够在实验实验室中进一步测试的RNA折叠的大量“构建块”规则。ARE也是无症状的,因为它没有特别定制于RNA。

“这种方法适用于结构生物学,化学,材料科学等各种问题,”作者说。

符合RNA

这种生物分子对我们日常生活的重要性可能总结为“Covid疫苗,MIC下降”。

但是它更多。

与蛋白质一样,RNA从DNA转录。它还具有四个字母,a,u,c和g,抓住u和c系束至g.rna是一个整个家庭,具有最着名的类型是信使RNA或mRNA,其携带遗传指示构建蛋白质。但还有转移RNA或TRNA - 我喜欢将此视为一种运输无人机 - 抓住氨基酸,并将其捕获到蛋白质工厂,控制基因表达的MicroRNA,甚至陌生人堂兄甚至我们理解的陌生人。

底线:RNA既是一个强大的目标和灵感基因药物或疫苗。要关闭一个基因没有实际接触的一种方式,例如,是杀死它的信使RNA。相对于基因疗法,靶向RNA可能有更少的意外影响,同时保持所有的我们的遗传蓝图完好。

在我的头上,RNA通常类似于纠结的耳机。它开始作为字符串,但随后缠结成环脱环状捻合橡胶带。这曲折的结构,然后用周围循环,形成了三级结构再次扭曲。

不像令人沮丧烦人的耳机,RNA扭曲半预见的方式。它往往融入一些建筑之一。这是一种像形状你的身体扭曲了成一堆的舞蹈动作中。三级RNA结构,然后缝合这些舞蹈动作汇集成一个“主题”。

“每个RNA可能具有不同的结构性人格,”几周。

这种表面上的简单让研究人员抓狂。RNA的构建模块很简单——只有四个字母。在变成更复杂的三级模型之前,它们也会折叠成半刚性结构。然而,“尽管有这些简化的特征,复杂RNA结构的建模已经被证明是困难的,”Weeks说。

预测难题

目前深度学习解决方案通常与一个需求入手:一吨的训练实例,使神经网络的每一层可以开始学习如何有效地提取特征信息,允许AI.做出坚实的预测。

这是一个不走的RNA。不同于蛋白质结构,RNA根本没有足够的实验尝试和真实的例子。

与战神,作者采取了眉毛筹集的办法。该算法不关心RNA。它摒弃什么,我们已经知道分子及其功能。相反,它仅集中在原子排列。

首次用以前的RNA结构中熟知的一小套主题培训。该团队还添加了一个相同结构的大量替代例子,这是不正确的。消化这些示例,ARES缓慢地调整了其神经网络参数,以便该程序开始了解每个原子和其放置如何有助于整体分子的功能。

类似于经典计算机视觉算法,逐渐提取特征 - 从像素到线条,形状-ARE相同。其神经网络中的层覆盖了精细和粗略的尺度。当用一组新的RNA结构挑战时,其中许多比训练更复杂,Ares能够蒸馏模式和新颖的主题,识别字母的结合方式。

“它从原子结构完全学习,不使用其他资料...和它没有什么结构特点可能是重要的假设,”作者说。他们甚至没有提供任何基本信息的算法,如RNA是由四个字母链了。

作为另一个基准,球队接下来挑战了RNA谜题。2011年被启动,RNA拼图为结构生物学家要测试的已知的实验RNA结构的预测算法社区挑战。ARES自爆在竞争中脱颖而出。

几周,平均分辨率“已经保持顽固地陷入顽固地卡住”少10倍。ares提高了大约30%的准确性。这是一个看似小的步骤,但是一个生物学最顽固的问题的巨大飞跃。

一种RNA结构代码

相比蛋白质结构预测,RNA是困难得多。现在来看,ARES仍然无法获得所需的药物发现工作精度水平,或者找到能够调整我们的生物RNA分子新的“热点”。

但是ARES是向前迈出的一步强大“揭开迷雾” RNA,一个年代的“风水宝地改造RNA的结构和功能的发现,说:”周。一个改进的算法可能是一些实验数据合并到另一模型这些复杂的结构。什么是明确的是,RNA似乎有一种“结构码”,可以帮助调节基因电路,一些ARES和其下一代可能有助于解析。

RNA的大部分是生物学的“暗物质”。我们知道它在那里,但很难想象甚至更难学习。ARES代表了下一个望远镜进入该雾。“因为可以测量(深深)学习,并预测第三级RNA结构的细节 - 在生物机制中的各种新发现等待着,”周数。

图像信用:新潭/Pixabay