首页  >  热点  >  新闻特写  >  文章正文
shRNA表达克隆

人工智能助力药物开发

Jun 05, 2018 No Comments

人工智能助力药物开发

机器学习和其它技术有望低成本,并高效地加快药物研发。

寻找新药的科学家都面临着一个大问题:开发一个新药的成本预计在26亿美元左右。不过其中很大一部分金钱都打水漂了,这是因为10个候选疗法中至少有9个不会上市,并在1期临床试验到监管批准之间的各个阶段遭遇滑铁卢。事实上,药物开发领域迫切需要一场变革。

制药巨头相信,解决方案即将到来。Pfizer公司正在使用IBM公司的Watson——一种使用机器学习的系统,来推动其免疫肿瘤药物的研究工作。Sanofi已经和英国初创公司Exscientia签署了协议,付费使用Exscientia的人工智能(artificial-intelligence, AI)平台来寻找代谢疾病的治疗药物。而Roche的子公司Genentech正在使用GNS Healthcare公司的AI系统,帮助Roche开发癌症治疗药物。事实上,大部分生物制药巨头都有类似的合作或内部计划。

如果这些技术的支持者是正确的,那么AI和机器学习将开启一个更快、更便宜和更有效的药物研发时代。尽管有些人持怀疑态度,但大多数专家都认为,这些AI工具会变得越来越重要。这种转变给科学家带来了挑战和机遇,特别是把这些技术与自动化相结合,将会为药物研发带来重要变革(文末“更多阅读:机器人来了”)。处于职业早期的药物开发人员尤其需要掌握AI技术,才能在求职市场中立于不败之地。

20世纪50年代的AI开拓者幻想着构建可以像人一样感知、推理和思考的机器。这个概念被称为“广义AI”,并一度风靡科幻小说领域。然而,过去20年,计算机处理能力的持续快速增长,大量数据集的可用性以及先进算法的开发,大大推动了机器学习的发展。由此,专注于具体任务的“狭义人工智能”得以实现。这其中就包括分析、理解和生成文本和语言的AI技术分析——自然语言处理技术,以及旨在模仿我们大脑理解世界的方式的人工神经网络(artificial neural network)技术。这些技术已经被广泛应用于计算机视觉、语音分析和路线选择等领域。这一进展也吸引了一大批初创公司使用AI进行药物开发,其中许多公司使用AI来识别隐藏在大量数据中的线索。

例如,美国波士顿附近的Berg生物技术公司的研究人员开发了一种模型,测试了1000多位癌症和健康人类细胞样品,确定了新的癌症机制。他们改变了细胞培养环境中的糖和氧的水平,然后追踪细胞的脂质、代谢物、酶和蛋白质谱。同时,该团队使用AI平台来生成和分析来自患者的大量生物学和实验数据,对比找出肿瘤细胞和健康细胞之间的关键区别。

Berg的方法是根据疾病的确切生物学原因找到潜在的治疗方法。Berg的联合创始人兼首席执行官Niven Narain表示,他们正在通过使用以患者为导向的生物学和数据来获得更多预测假设,而没有采用传统的试错方法,这相当于将药物发现范式颠倒过来。

使用这种方法,Narain的团队确定了某些天然分子在癌症代谢中的重要性。这导致该小组发现了一条新的治疗思路,并指出了一些可能的治疗用途。该公司的候选药物BPM31510目前正处于临床试验2期,旨在治疗晚期胰腺癌患者。该公司还在使用AI系统寻找其它疾病的药物靶点和治疗方法,包括糖尿病和帕金森病。

总部位于伦敦的初创公司BenevolentBio拥有自己的AI平台,该平台拥有包括研究论文、专利、临床试验和患者记录等在内的诸多数据。这形成了一个以云计算为基础的,包括基因、症状、疾病、蛋白质、组织、物种和候选药物之间超过10亿个关联的网络。用户可以像搜索引擎一样查询,得到诸如疾病和与之相关的基因或已显示有影响的药物的“知识图谱”。该平台的大部分数据都没有注释,所以它使用自然语言处理来识别各个元素,并理解它们与其它事物之间的联系。BenevolentBio首席执行官Jackie Hunter指出,人工智能可以把所有这些数据都整合在一起,并为药物发现科学家提供最重要的信息。

当BenevolentBio公司要求该系统寻找治疗肌萎缩侧索硬化症(amyotrophic lateral sclerosis, ALS,也被称为运动神经元病,motor neuron disease, MND)的新方法时,该AI平台指出,约100种现有化合物可能有效。随后,BenevolentBio的科学家从中选择了5种,接着从英国谢菲尔德转化神经科学研究所(Sheffield Institute of Translational Neuroscience)拿到来自患者的细胞,开展了测试实验。2017年12月,科学家在马萨诸塞州波士顿举行的ALS/MND国际研讨会(International Symposium on ALS/MND)上发布了这项研究的成果,指出这些化合物中,4种具有治疗潜力,1种可以延缓小鼠的神经症状。

 

模式识别

尽管这些应用非常有前景,但仍有许多科学家不了解人工智能的功能。加拿大多伦多一家专门为科学家寻找抗体而提供机器学习工具的初创公司BenchSci于2月发布的一项调查显示,参与调研的330名药物研发研究人员中有41%不熟悉AI机制(go.nature.com/2xarpt3)。

该领域的先锋认为,研究人员应该尽快掌握这些知识。

2015年,中国上海的药物研发公司药明康德(WuXi AppTec)收购了冰岛deCODE Genetics公司的子公司NextCODE Health,成立了Wuxi NextCODE。位于马萨诸塞州剑桥市的WuXi NextCODE的一个团队的负责人Thomas Chittenden指出,人工智能将让我们全面理解人类生物学,并为我们提供解决人类疾病的方法。他还表示,他们开发药物并在临床试验中进行评估药物的方式都属于非常复杂的模式识别。

2017年5月,包括耶鲁大学(Yale University)研究人员在内的研究小组证明了成纤维细胞生长因子(fibroblast growth factors, FGF)蛋白质家族在血管新生中的作用(P. Yu et al. Nature 545, 224–228; 2017)。血管新生对于肿瘤生长和心血管疾病都很关键。WuXi NextCODE使用AI,根据作用和其它属性对基因进行分类,从而寻找RNA序列的变异、表达水平、分子功能和基因位置之间的联系。 Chittenden的研究小组利用这种方法发现,FGF通过控制葡萄糖代谢来影响血管新生。

一些研究人员认为AI可以查明以前未知的疾病原因,这将加速个性化治疗。Hunter表示,个性化药物已经被讨论了很长时间了。AI就像一把钥匙,给我们打开了这扇门。

怀疑论者指出,这种AI热不过是20世纪80年代初开始的计算机辅助药物设计的炒作的继续。虽然这种计算机模拟技术在现代药物研发中很重要,但它们也未能阻止于20世纪90年代中期开始的制药工业研发生产力的下降趋势。

 

不断发展

行业大牛认为,无论未来会怎样,药物发现工作和所需的技能都不太可能会维持原样。有人认为需要更广泛的培训。Narain指出,博士和其他研究生课程的开展方式“需要有一个彻底的转变”,并且应该延伸到医学院校和本科教学。他补充提出,学生专注于——并且比其他人更了解——特定的基因突变的时代已经结束了。Chittenden对此表示赞同,他认为,10年之后的博士生会与现在有很大的差别。他们接受的学术课程将更广泛。下一代博士生首先需要理解人类生物学,此外还需要了解计算机科学、计算统计学和机器学习。

其他研究人员则认为,这意味着在不偏离专业核心领域的情况下,丰富基础知识。加州斯坦福大学(Stanford University)生物医学人工智能研究人员Russ Altman指出,生物学本科生需要掌握统计学和计算机方面的基本知识。博士生则需要掌握深厚的技术技能。对于博士生来说,重要的是深度了解,而非广泛涉猎。

2003年,Altman等人为希望深入研究这两个学科的学生开设了生物医学计算学士学位。他所在的生物工程学院于当年3月开学时启动了这个项目。Altman认为,斯坦福大学(University of Oxford)似乎能更早地预测到未来全球高校会发生的事情。

从10年前至今,科学家都无法就AI会如何影响药物开发达成共识。英国牛津大学(University of Oxford)的计算药物化学家Anthony Bradley表示,至少未来5到10年内,编程仍然是一种有用的技能,但他感觉再远一点,计算机可能会成为编程的主力。在实验室中,我们可能需要一支训练有素的编程专业人员,与自动化和人工智能专家合作,对现有药物的开发过程进行微调。或许10年后,生物学实验技能(展开生物或化学试验的操作技能)可能就毫无用处了。

Bradley使用牛津大学附近的Diamond Light Source同步加速器来筛选与化学分子靶点结合的小分子。哪怕两者之间的结合非常微弱,研究人员也可以通过提高其结合强度以产生新的治疗方法。Bradley所在的牛津大学蛋白信息学团队(Oxford Protein Informatics Group)正使用人工神经网络——一种模拟人类大脑处理信息算法,来开展一个基于结构设计药物的项目。该团队利用公开可用的小分子结构和化学活性数据来培训AI系统,令其识别那些可能作用于蛋白靶标的分子。

那些希望从事药物开发领域的人需要做好哪些准备来应对这些变化?行业大牛指出,加深对AI的了解,头脑灵活很重要。Bradley表示,虽然他大概知道这个领域的变化趋势,但他还是要让学生自己去了解技术趋势的发展方向。只有保持多才多艺,你才能充分利用现有工具的力量。他的建议是,要做药物研发,就要多阅读顶级杂志关于AI的最新文献和新闻,以跟踪行业动态。

Bradley指出,自我驱动的学习尤其重要,因为大学在这个过程中的作用是有限的。从根本上来讲,谁也讲不清楚到底需要掌握哪些技能,才能不被AI替代。

一些关于AI变革药物研发的言论可能只是炒作。批评者指出,都是商业利益在起作用,毕竟至今还没有AI开发的药物获得批准。认为技术将推动重大进步的Narain认为,尽管某些说法似乎太过夸张,但是很快就会见真章。他指出,炒作不会持续很长时间,因为在未来五年左右,我们就能通过数据获知真相。如果那时我们能够开发更好的药物,并且效率更高,成本更低,那么此时AI就能真正革新整个领域了。

 

 

更多阅读:机器人来了 

如果要书写人工智能的历史,那么很可能要提到2007年6月12日的一个算法。那天,一个名叫亚当(Adam)的机器人通过鉴定酵母基因的功能,宣布了人类对科学知识发现的垄断时代的终结。

通过搜索公共数据库,Adam指出了关于编码催化酿酒酵母(Saccharomyces cerevisiae)反应的关键酶的基因的假说,并且使用机器人在实验室中开展试验,验证它的假说。英国亚伯大学(Aberystwyth University)和剑桥大学(University of Cambridge)的研究人员随后独立测试了Adam的关于19种基因功能的假设,结果显示,其中9个基因是新的,并且功能假设是正确的;只有1个是错的。

剑桥大学的系统生物学家、Adam的开发成员之一Steve Oliver表示,使用人工智能的机器人科学家可以测试更多的化合物,并且可以提高准确性和重复性,并建立详细的、可查询的记录。
 
今年1月,Adam的开发团队宣布,一个比Adam更先进的机器人夏娃(Eve)发现了三氯生(triclosan,一种常见的牙膏成分)可以治疗耐药疟疾寄生虫。他们开发出一种工程化酵母菌株,其基因组中对其存活起关键作用的一个基因已被来自疟疾寄生虫或人类的基因替代,最后得到的菌株的生长严重依赖于被引入的人类或疟疾寄生虫基因。随后,Eve筛选了数千种化合物,并找到了那些可以阻断或延缓含有疟疾寄生虫基因的菌株的生长,但不影响那些含有人类基因的菌株(降低毒性风险的同时瞄准寄生虫)的化合物。然后这些化合物可以进入后续的筛选测试。

实验发现,三氯生可以通过抑制DHFR酶——DHFR酶也是抗疟药乙胺嘧啶的靶标——l来影响疟疾寄生虫的生长。但是,乙胺嘧啶的耐药性很常见。研究人员表明,即使寄生虫对乙胺嘧啶产生了抵抗,三氯生依然可能有效。

 


原文检索:
Nic Fleming. (2018) How artificial intelligence is changing drug discovery. Nature, 557: S55-S57. 
张洁/编译

新闻特写, 热点
No Responses to “人工智能助力药物开发”

Leave a Reply


four × = 28