首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >药物开发中的人工智能和多组学数据

药物开发中的人工智能和多组学数据

作者头像
DrugOne
发布2023-09-19 14:41:24
发布2023-09-19 14:41:24
1K0
举报
文章被收录于专栏:DrugOneDrugOne

今天为大家介绍的是来自Pace Ventures的一篇讨论AI和多组学数据在药物开发中的应用和发展的报道。AI与多组学数据的结合应用为风投投资提供了激动人心的机遇。通过利用AI和多组学数据,我们可以加速新药和治疗方法的研发。这些新工具正在改变药物发现和开发的方式,实现高效的生物标志物识别、药物靶标发现和成本效益的垂直整合。然而,在该领域,初创公司需要应对数据管理、监管挑战,并满足制药公司对想法验证的高标准。在面对这些严峻的挑战时,有两种类型的公司脱颖而出:一类是专注于AI工具的提供商,他们为药物发现创建系统;另一类是专注于AI的生物制药公司,他们利用这些系统来发现新药物。其中,动态数据库和深入的行业知识是这些初创公司成功的驱动因素。在使用AI和基因组学进行药物发现时,大型数据库和在实验室中测试想法的能力对于成功至关重要。

目前,我们正处于治疗和药物开发行业转型的关键时期。两个关键因素相互融合,形成了一种强大的共生关系:人体功能相关数据的指数级增长,以及由于人工智能(AI)的进步而能够从这一复杂数据流中提取有价值洞见的能力。

多组学数据在我们理解与各种健康条件相关的复杂分子复杂性和变异性方面是一个革命性的转变。它为我们提供了关于各种生物分子之间复杂相互作用及其在人体内的功能的宝贵洞见。以同卵双生子为例,虽然他们拥有相同的基因组,更有可能共享健康条件,但他们并不总是表现出相同的疾病,特别是复杂疾病,如精神分裂症。这一事实凸显了人体健康和疾病的多方面特性。因此,我们不能仅通过遗传学来研究疾病,而是要考虑多个因素 - 包括我们的基因组、表观遗传学(不涉及DNA序列修改的稳定基因表达的变化)、代谢组学和微生物组等。这就是多组学数据所包含的内容。

然而,值得注意的是,仅靠多组学数据无法提供必要的可行洞见。这就是人工智能(AI)发挥关键作用的地方。AI将帮助我们辨识复杂数据中的相关模式,将这种复杂性转化为更易处理的形式,最终揭示可以指导理解和行动的模式。AI与多组学数据的这种强大融合正引领我们走向精准医学,大大丰富了我们对疾病过程的理解,并加速了创新治疗方案的发现和开发。

深入探讨:什么是多组学数据,为什么它至关重要?

将我们的身体比喻为一个繁忙的城市,每个细胞都是一个独特的建筑物,承载着各种活动。每个“建筑”或细胞都有许多部门,如设计部门(我们的基因)、制造部门(蛋白质)、通信部门(RNA)等。在生物学术语中,这些部门被称为不同的“组学” :基因组学、蛋白质组学、转录组学等等。要理解这座城市的运作,即它如何对变化作出反应、生长,甚至崩溃(例如在疾病中),单独查看一个部门是不够的。全面了解需要洞察这些部门是如何相互作用和相互影响的。这种全面的洞察就是多组学的本质。

多组学提供了一个综合的概述,类似于城市规划师考虑所有建筑物中的所有部门。利用多组学的科学家可以深入了解我们身体在健康和疾病中的功能。他们可以揭示精确的疾病细节,指导为个体设计更具体的治疗方法,即就像量身定做一套完美合身的西装一样。这就是精准医学的概念:在合适的时间向合适的人提供正确的治疗。然而,多组学就像城市规划一样是一个复杂的领域。它涉及大量信息,需要专门的工具和技术进行有效处理。

在分析丰富数据方面,人工智能发挥着至关重要的作用。首先,AI能够整合不同类型的多组学数据,如基因组、蛋白质组和代谢组等。这种整合提供了对患者生理状态更全面的了解,有助于准确诊断和预测疾病,并实现精确个性化的治疗策略。此外,AI算法可以大幅减少多组学数据的维度,帮助研究人员从复杂的生物过程中提取有价值的洞见。这些洞见有助于更好地理解疾病过程,确定潜在的治疗靶点,并制定个性化的治疗方案。AI还可以将其他类型的数据整合到多组学分析中,例如影像数据、临床数据、环境数据和社会决定因素数据。这样可以更全面地了解患者的健康状况,促进更好的治疗决策,并提高患者的治疗效果。

使用AI和多组学数据的重要性已经显而易见。例如,Rady儿童基因医学研究所使用AI将新生儿罕见遗传性疾病的诊断时间缩短至19.5小时。这项技术快速分析了多组学数据并确定了遗传变异。它使得一名仅8天大的罕见疾病患儿能够迅速被诊断并治疗,展示了AI在基因医学中的变革潜力,特别是在儿科罕见疾病中。

AI和多组学数据的结合已经在医疗保健领域引起了革命性的变化,加速了走向个性化医学的道路,并从根本上改变了药物开发行业。

市场趋势

数据创新飞跃与制药领域研发效率不高的矛盾

近年来,突破性创新彻底改变了科学研究,将多组学数据和人工智能领域融合在一起。随着基因测序成本的骤降和GPU计算性能的迅猛提升,前所未有的数据收集和快速数据处理时代的大门已经敞开(见图1和图2)。得益于这些关键发展,我们现在面对着大量信息。以每个基因组含有约30亿个核苷酸对为例,大约有3000万个人的基因组被测序。

图 1:基因组测序的成本

图 2:GPU 每秒操作数性能

尽管取得了显著进展并生成了大量数据,但制药和基因组学领域的研发效率出现了意想不到的停滞。药物发现的成本和开发所需时间反而增加了。这一现象最早在1980年代被首次提出,并在2012年杰克·斯坎奈尔在《自然》杂志上将其称为“Eroome's Law”(Moore's Law的倒写)。在2001年至2020年期间,研发成本年均增长13.7%,而批准的药物数量在同一期间年均增长仅为7.2%。据估计,开发一种新药需要约10年时间,成本超过20亿美元。鉴于这些挑战,制药领域迫切需要创新。一个有希望的解决方案可能在于利用人工智能和多组学的变革性力量,可能开启治疗发现和开发的效率和生产力新时代。

市场动态:大型制药公司与人工智能公司的合作推动药物开发的强劲增长

在过去两年中,大型制药公司与以人工智能为重点的公司之间的战略合作已创造了令人震惊的320亿美元的交易价值。例如,在2022年1月,一家名为Exscientia的AI驱动的药物发现公司与Sanofi达成了价值52亿美元的巨额交易,成为有史以来最大的人工智能交易。如图3,过去四年内注入AI驱动的药物发现公司的资金增长了三倍。仅在2022年,投资额就达到了246亿美元。

图3:药物开发公司对人工智能的累计资本投资

展望未来,将人工智能纳入药物发现中的潜在收入似乎是无限的。这个市场被估计为大型制药公司带来了500亿美元的机会。在早期药物开发中使用人工智能可以产生50种新型疗法,带来超过500亿美元的销售额。鉴于这种巨大的增长潜力,AI驱动的药物发现的未来前景是光明的。

发展机会

生物标志物发现

生物标志物是关键的生物分子,可以揭示疾病的存在、进展或严重程度。它们还可以作为治疗效果的衡量标准。传统上,研究人员很难为疾病找到新的生物标志物,因为解释庞大的数据量是不可能的,而且筛选“噪音”以获取宝贵的洞察力非常具有挑战性。

AI技术在分析和提取整合数据中的生物标志物方面非常宝贵。当结合不同的组学层次时,研究人员可以使用生物标志物来更细致地了解疾病,摆脱二元结果。这有助于将疾病分类为亚型,为诊断和治疗反应构建预测模型,并确定与疾病相关的途径。

药物靶点发现

药物靶点通常是蛋白质或基因,是体内与药物相互作用的特定分子。这些相互作用可以修改靶点的行为,产生治疗效果。药物靶点通常是构成导致疾病表型的更大相互作用网络(或通路)的一部分,这使得药物靶点与疾病症状的相互作用变得复杂。药物靶点通常是通过深入的生物学和遗传研究来发现和验证的。

通过网络分析或基于图的机器学习等技术,可以将复杂的分子反应表示为网络。分析这些分子相互作用网络使我们能够识别在疾病通路中至关重要的关键节点或蛋白质。通过将多组学数据与已有的分子相互作用知识整合,AI可以识别潜在的药物靶点,这些靶点对于疾病的进展至关重要,并且有可能被治疗干预所调节。

药物开发的垂直整合

垂直整合在药物开发价值链中为公司提供了最大化利润的重要机会。如图4,药物开发相关的大部分成本发生在临床阶段,这是进行广泛药物测试的阶段。药物的质量保证成为该过程的主要瓶颈。通过提高药物的效率,公司可以实现大幅度的成本降低。

图4:药物发现和开发阶段

AI和组学数据正在改变我们发现药物的方式。它们帮助我们创建预测模型,了解药物在分子水平上的作用,从而实现更有针对性的治疗。AI还可以搜索大型数据库,寻找潜在的新药。这个过程称为虚拟筛选,使用分子对接和机器学习等方法。这在将现有药物用于新用途方面特别有用。使用AI和组学数据不仅可以提高他们生产的药物的质量,还能带来巨大的好处。它可以帮助降低成本,创造更多价值,并为重要的合作机会敞开大门。这对于大公司和新进入者都是很好的。

全程AI驱动的药物发现公司Insilico Medicine宣布开始进行临床试验,用于治疗特发性肺纤维化,这是一种慢性肺部疾病。他们通过完全由人工智能构思的药物,首次在药物开发过程中达到这一先进阶段,为制药行业开创了先河。同时,他们专有的全程平台也与药物的开发阶段同步进行,并不断完善。到2022年6月,他们的估值达到了90亿美元,并于2023年6月提交了IPO。

挑战

数据相关挑战

虽然AI工具在处理和解释大规模数据集方面表现出色,但其输出结果只能与数据输入的准确性相一致,即“垃圾进,垃圾出”的原则。这意味着数据的错误解释或滥用可能导致错误的结果,特别是在药物发现领域。

首先,数据生成是至关重要的,它涉及创建和追踪数据到其来源的过程,需要行业特定的专业知识和对数据生成过程的全面了解。接下来是数据聚合,这涉及整理和归一化数据以构建全面的多组学数据库。然而,访问基因组数据是昂贵的,并涉及法规复杂性,通常需要一个专门的商业或销售团队来访问和整合这些数据集到一个给定的数据库中。另外,数据的情境化也带来了进一步的复杂性,包括整合其他数据来源,如电子健康记录(EHR)。然而,EHR数据通常复杂混乱,缺乏标准化,这影响了在不同人群和系统中进行系统化使用。

最后,AI和多组学公司必须应对严格的监管审查,特别是在访问欧盟和美国等国家之间的医疗数据时。这些限制限制了公司的数据存储能力,并影响了他们选择服务器托管公司的选择,这可能成为公司发展的限制因素。

相关性并不等于因果关系

计算机模拟研究的结果往往依赖于回顾性分析,即分析过去的数据,与前瞻性研究(体内实验)相比,这可能无意中引入偏差。未来的研究会基于预先定义的参数分析新数据,从而降低偏差的风险。

然而,如果跨多个独立数据集进行交叉验证或以迭代或补充方式由有用数据支持,其可靠性可能会显著增强。实质上,如果模拟结果可以通过不同的数据集重复或验证,或者通过实验数据进行补充,其可靠性可能会增加。

药物发现领域中有趣的方法和公司

方法和公司

在药物发现的AI和基因组学领域,创业公司主要采用两种明显的方法:AI专注的工具提供商和AI专注的生物制药公司。然而,这两种公司方法在成功方面有共同的驱动因素,因为它们都需要深厚的专业知识以及丰富而动态的数据库。

AI专注的工具提供商拥有广泛的多组学数据库,并经常与其他数据源相结合。它们以高水平的计算机科学专业知识为特征,专注于开发适用于各种生物制药产品的创新AI平台。这些工具提供商非常重视合作和改进,不断改进他们的服务,基于他们与合作伙伴取得的成果。同时,这些提供商也致力于在不同的治疗领域扩展其业务,拓宽他们在应用于不同疾病和药物开发阶段的AI能力。

相比之下,AI专注的生物制药公司自建资源,如超级计算能力和算法。他们依靠通过与医院和其他第三方的独家合作伙伴关系内部开发的多组学数据库。他们的目标是利用自有的AI工具在其专注的治疗领域内发现候选药物。AI专注的生物制药公司旨在为临床测试和最终市场发布识别独特的、有差异化的候选药物。

然而,这些AI专注的生物制药公司在其核心领域之外的AI工具或应用方面往往依赖于外部合作伙伴。他们寻求外部专业知识,用于药物发现之外的领域,如临床试验设计、生物标志物选择和其他临床前或临床应用。

总之,AI和基因组学在药物发现领域的格局丰富、多样,充满潜力。AI专注的工具提供商和AI专注的生物制药公司之间的动态相互作用催生了突破,增强了我们对复杂疾病的理解,并为更有效、个性化的治疗铺平了道路。

公司成功的驱动因素:深厚的行业专业知识和丰富的数据库

在AI驱动的算法中,庞大且动态的多组学数据库构成了高效药物发现的基础。AI工具在识别独特药物靶点方面的能力和准确性与这些数据库的大小和多样性相关。另一方面,湿实验室能力代表了在实验室中进行的具体的生化和生物学实验。尽管AI工具旨在缩小药物研发中传统的发现和临床前工作,但将实验室实验与测试潜在药物候选物结合起来,可以增强结果的精确性和准确性。这个过程使得“设计-构建-测试-学习”循环更加有效。将成功和失败的实验结果结合在一起的算法可以识别出成功的候选物和容易失败的特性。相反,仅依靠已发布的数据或过去成功的候选物进行训练的算法可能由于缺乏更广泛的背景而具有固有的偏见。

结论

我们正在进入一个令人激动的药物发现时代,其动力来自AI和多组学数据的结合。AI专注的工具提供商和AI专注的生物制药公司正在引领这一努力,利用其独特的优势推动个性化医学的发展。成功的路径建立在两个主要要素上:拥有AI可以学习的大型基因组数据库和利用合作伙伴关系进行现实世界实验室实验。这两个要素可以帮助我们理解复杂的数据并开发新的治疗方法。当然,仍然存在一些挑战,但机遇是巨大的。随着我们在这条道路上不断前进,我们期待看到在AI、基因组学和药物发现交汇处将会有哪些新的发现。

参考资料

https://medium.com/@pace-ventures/ai-multi-omics-data-in-drug-development-d8ab8510e7a9

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-07-26 00:01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档