OR 新媒|oror.vip跨平台阅读首选
2023-01-03 11:50
商业与经济

ChatGPT背后的AI技术可以如何用来研发新药?

谷歌搜索与ChatGPT背后的自然语言处理算法有望大幅缩短药物上市所需的时间。
ChatGPT背后的AI技术可以如何用来研发新药?
Karen Hao

■在寻找新型抗病药物的过程中,制药商长期以来都是通过一种费力的试错过程来确定合适的化学成分。但如果人工智能(AI)可以预测新药物的分子构成,就像谷歌(Google)能够猜出你想搜索的内容,或是电子邮件程序能够预测你的答复(例如“收到,多谢。”),事情会有什么变化?

这正是一种新型研究方式想要达到的效果,它利用一种被称为自然语言处理的AI技术来分析并合成生命以及许多药物的基石——蛋白质。最近大火的软件ChatGPT正是OpenAI公司运用这种技术让其像人类一样回答问题。这种方法利用了一点,即生物密码与搜索查询以及电子邮件文本之间有一个共同点:它们都由一系列字母来表示。

蛋白质是由几十个到数千个被称为氨基酸的化学亚基所组成,科学家会使用特殊的符号来记录这些序列。由于每个氨基酸对应字母表中的一个字母,因此蛋白质用符号表示出来就像是一串长句。

自然语言算法可以快速分析语言并预测对话中的下一步,它也可以用于这类生物数据来创建蛋白质-语言模型。这些模型会对所谓的“蛋白质语法”——也就是确定哪些氨基酸组合能产生特定疗效的法则——进行编码,进而预测有望构成新药物分子基础的字母序列。如此一来,药物研发初期所需的时间有望从数年缩短至几个月。

“大自然为我们提供了数不清的、精心设计的蛋白质范例,功能也是五花八门。”初创企业ProFluent Bio的创始人阿里·迈达尼(Ali Madani)说,“在构建模型的问题上,大自然就是我们的老师。”该公司总部位于加州伯克利,业务重点是基于语言的蛋白质设计。

目前,以蛋白质为基础的药物已被用于治疗心脏病、某些癌症以及艾滋病等疾病。过去两年间,包括默克公司(Merck & Co.)、罗氏控股(Roche Holding AG)旗下Genentech在内的企业以及许多初创企业如华深智药(Helixon Ltd.)和圆壹智慧(Ainnocence),已开始借助自然语言处理来研发新药。它们希望这种方法不仅可以提升现有药物和候选药物的有效性,还能开启一扇通往未知分子的大门,届时人们或许可以利用这些分子来治疗胰腺癌、渐冻症等目前难以找到更有效药物的疾病。

“类似这样的技术将开始解决那些曾经‘无药可医’的生物学领域。”华盛顿州温哥华的药物研发公司Absci Corp.的创始人兼首席执行官肖恩·麦克莱恩(Sean McClain)说。

据计算生物学家说,自然语言处理在药物研发领域的应用依然面临着很大阻碍。他们指出,若是对现有以蛋白质为基础的药物进行过多调整,可能会产生意想不到的副作用,此外,完全由人工合成的药物分子需要经过严格的测试,以此确保它们对于人体的安全性。

然而,如果自然语言算法能够达到使用者期望的效果,它将为AI改变药物研发这一前景注入新的力量。以往人们也曾试图利用AI,但由于技术上的局限或是缺乏数据,效果并不好。支持一方指出,考虑到自然语言处理最近取得的进展,加之蛋白质测序成本大幅下跌使得氨基酸序列数据库变得十分庞大,上述两个问题已在很大程度上得到克服。

鉴于这项技术尚处于早期阶段,企业暂时将重点放在了利用蛋白质-语言模型来增强已知分子上,例如提高候选药物的疗效。举例来说,以天然形成的单克隆抗体为起点,这些模型能够对其氨基酸序列提出调整建议,从而提升疗效。

在8月份发表于网络的一篇预印版文章中,Absci的研究人员利用这种方法来强化抗癌药物曲妥珠单抗(Trastuzumab),让这种以抗体为基础的药物能够与癌细胞表面的靶点结合得更紧密。结合度更高或许意味着患者可以使用更少的剂量,药物疗程也会缩短,同时副作用也会降低,这些都会让患者受益。

在今年3月发表于《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)的另一篇文章中,来自麻省理工学院(MIT)、清华大学以及华深智药(总部位于中国)的研究人员利用蛋白质-语言模型改造了一种新冠候选药,将一种原本仅对阿尔法、贝塔及伽马变种有效的药物变成了还能对付德尔塔毒株的“四合一”药物。

圆壹智慧是一家在中美两地开展业务的初创企业,据其创始人兼首席执行官潘麓蓉说,该公司帮助客户利用此类模型来修改动物蛋白质,例如兔子体内的抗体——这也是药物研发的常见起点——将其转变为能够与人类生理机能相容的形式。

然而眼下,制药企业已不满足于修改已知蛋白质,它们把目光投向了所谓的“从无到有”来合成分子。

Genentech表示,最近的一项实验显示,研究人员有可能设计出一种能够像帕妥珠单抗(Pertuzumab)一样与同一种细胞靶点结合、但却具有全新氨基酸序列的抗体。帕妥珠单抗是一种乳腺癌药物,Genentech以品牌名Perjeta在市面上销售该药。该公司执行董事理查德·波诺(Richard Bonneau)说,他们的科学家只给蛋白质-语言模型提供了靶点和抗体所需的三维图形——这是决定蛋白质功能的主要因素。波诺的初创企业Prescient Design去年被Genentech收购后,他便加入了后者。

Absci和华深智药也在同制药企业合作,利用“从无到有”的方法为癌症和自身免疫性疾病研制药物。据麦克莱恩说,Absci 1月份时宣布携手默克公司,共同研究三种药物靶点。一名默克公司发言人表示,默克已开展一系列合作,目的都是为了探索AI在药物研发领域的潜能。华深智药创始人兼首席执行官彭健说,该公司上月已与两家大型药企签约,将共同对付此前无药可医的疾病。

“药物研发领域的所有难题都由来已久,人们一直等着能有一波新技术将它们破解。”圆壹智慧的潘麓蓉博士说,“这确实是一套颠覆性的方法。”

许多计算生物学家预计,最终,蛋白质-语言模型的用处将不仅体现在加快药物研发上。他们谈到,同样的技术也许会用于制造更好的酶,进而应用到塑料降解、废水处理和石油泄漏清理等环保领域。

“蛋白质是生命的主力军。”ProFluent Bio的迈达尼博士说,“有了它们,我们才能呼吸,才能看见东西;有了它们,环境才得以延续;有了它们,人类才有健康与生病一说。如果我们能设计出更好的主力军,或是新的主力军,这套技术的应用范围可能真的会很广。”■


相关内容
OR
+
读者评论
MORE +

热门排行榜
OR
+
ChatGPT背后的AI技术可以如何用来研发新药?
2023-01-03 11:50
商业与经济

ChatGPT背后的AI技术可以如何用来研发新药?

谷歌搜索与ChatGPT背后的自然语言处理算法有望大幅缩短药物上市所需的时间。
Karen Hao

■在寻找新型抗病药物的过程中,制药商长期以来都是通过一种费力的试错过程来确定合适的化学成分。但如果人工智能(AI)可以预测新药物的分子构成,就像谷歌(Google)能够猜出你想搜索的内容,或是电子邮件程序能够预测你的答复(例如“收到,多谢。”),事情会有什么变化?

这正是一种新型研究方式想要达到的效果,它利用一种被称为自然语言处理的AI技术来分析并合成生命以及许多药物的基石——蛋白质。最近大火的软件ChatGPT正是OpenAI公司运用这种技术让其像人类一样回答问题。这种方法利用了一点,即生物密码与搜索查询以及电子邮件文本之间有一个共同点:它们都由一系列字母来表示。

蛋白质是由几十个到数千个被称为氨基酸的化学亚基所组成,科学家会使用特殊的符号来记录这些序列。由于每个氨基酸对应字母表中的一个字母,因此蛋白质用符号表示出来就像是一串长句。

自然语言算法可以快速分析语言并预测对话中的下一步,它也可以用于这类生物数据来创建蛋白质-语言模型。这些模型会对所谓的“蛋白质语法”——也就是确定哪些氨基酸组合能产生特定疗效的法则——进行编码,进而预测有望构成新药物分子基础的字母序列。如此一来,药物研发初期所需的时间有望从数年缩短至几个月。

“大自然为我们提供了数不清的、精心设计的蛋白质范例,功能也是五花八门。”初创企业ProFluent Bio的创始人阿里·迈达尼(Ali Madani)说,“在构建模型的问题上,大自然就是我们的老师。”该公司总部位于加州伯克利,业务重点是基于语言的蛋白质设计。

目前,以蛋白质为基础的药物已被用于治疗心脏病、某些癌症以及艾滋病等疾病。过去两年间,包括默克公司(Merck & Co.)、罗氏控股(Roche Holding AG)旗下Genentech在内的企业以及许多初创企业如华深智药(Helixon Ltd.)和圆壹智慧(Ainnocence),已开始借助自然语言处理来研发新药。它们希望这种方法不仅可以提升现有药物和候选药物的有效性,还能开启一扇通往未知分子的大门,届时人们或许可以利用这些分子来治疗胰腺癌、渐冻症等目前难以找到更有效药物的疾病。

“类似这样的技术将开始解决那些曾经‘无药可医’的生物学领域。”华盛顿州温哥华的药物研发公司Absci Corp.的创始人兼首席执行官肖恩·麦克莱恩(Sean McClain)说。

据计算生物学家说,自然语言处理在药物研发领域的应用依然面临着很大阻碍。他们指出,若是对现有以蛋白质为基础的药物进行过多调整,可能会产生意想不到的副作用,此外,完全由人工合成的药物分子需要经过严格的测试,以此确保它们对于人体的安全性。

然而,如果自然语言算法能够达到使用者期望的效果,它将为AI改变药物研发这一前景注入新的力量。以往人们也曾试图利用AI,但由于技术上的局限或是缺乏数据,效果并不好。支持一方指出,考虑到自然语言处理最近取得的进展,加之蛋白质测序成本大幅下跌使得氨基酸序列数据库变得十分庞大,上述两个问题已在很大程度上得到克服。

鉴于这项技术尚处于早期阶段,企业暂时将重点放在了利用蛋白质-语言模型来增强已知分子上,例如提高候选药物的疗效。举例来说,以天然形成的单克隆抗体为起点,这些模型能够对其氨基酸序列提出调整建议,从而提升疗效。

在8月份发表于网络的一篇预印版文章中,Absci的研究人员利用这种方法来强化抗癌药物曲妥珠单抗(Trastuzumab),让这种以抗体为基础的药物能够与癌细胞表面的靶点结合得更紧密。结合度更高或许意味着患者可以使用更少的剂量,药物疗程也会缩短,同时副作用也会降低,这些都会让患者受益。

在今年3月发表于《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)的另一篇文章中,来自麻省理工学院(MIT)、清华大学以及华深智药(总部位于中国)的研究人员利用蛋白质-语言模型改造了一种新冠候选药,将一种原本仅对阿尔法、贝塔及伽马变种有效的药物变成了还能对付德尔塔毒株的“四合一”药物。

圆壹智慧是一家在中美两地开展业务的初创企业,据其创始人兼首席执行官潘麓蓉说,该公司帮助客户利用此类模型来修改动物蛋白质,例如兔子体内的抗体——这也是药物研发的常见起点——将其转变为能够与人类生理机能相容的形式。

然而眼下,制药企业已不满足于修改已知蛋白质,它们把目光投向了所谓的“从无到有”来合成分子。

Genentech表示,最近的一项实验显示,研究人员有可能设计出一种能够像帕妥珠单抗(Pertuzumab)一样与同一种细胞靶点结合、但却具有全新氨基酸序列的抗体。帕妥珠单抗是一种乳腺癌药物,Genentech以品牌名Perjeta在市面上销售该药。该公司执行董事理查德·波诺(Richard Bonneau)说,他们的科学家只给蛋白质-语言模型提供了靶点和抗体所需的三维图形——这是决定蛋白质功能的主要因素。波诺的初创企业Prescient Design去年被Genentech收购后,他便加入了后者。

Absci和华深智药也在同制药企业合作,利用“从无到有”的方法为癌症和自身免疫性疾病研制药物。据麦克莱恩说,Absci 1月份时宣布携手默克公司,共同研究三种药物靶点。一名默克公司发言人表示,默克已开展一系列合作,目的都是为了探索AI在药物研发领域的潜能。华深智药创始人兼首席执行官彭健说,该公司上月已与两家大型药企签约,将共同对付此前无药可医的疾病。

“药物研发领域的所有难题都由来已久,人们一直等着能有一波新技术将它们破解。”圆壹智慧的潘麓蓉博士说,“这确实是一套颠覆性的方法。”

许多计算生物学家预计,最终,蛋白质-语言模型的用处将不仅体现在加快药物研发上。他们谈到,同样的技术也许会用于制造更好的酶,进而应用到塑料降解、废水处理和石油泄漏清理等环保领域。

“蛋白质是生命的主力军。”ProFluent Bio的迈达尼博士说,“有了它们,我们才能呼吸,才能看见东西;有了它们,环境才得以延续;有了它们,人类才有健康与生病一说。如果我们能设计出更好的主力军,或是新的主力军,这套技术的应用范围可能真的会很广。”■


相关内容
OR
+
 

读者评论
OR

 

分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+

■ 或者,  留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。

■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......