研究人员测试了生成式AI是否能像人类专家一样处理复杂的医疗数据集。在某些情况下,AI的表现与耗时数月构建预测模型的团队相当,甚至更优。通过根据精确的提示词生成可用的分析代码,这些系统显著缩短了处理健康数据所需的时间。
为了直接比较性能,研究人员将相同的任务分配给不同的组别。一些团队完全依赖人类专业知识,而另一些团队则使用科学家配合AI工具。挑战是利用来自1000多名孕妇的数据预测早产。
即使在AI的支持下,由一名硕士生和一名高中生组成的初级研究小组也成功开发出了预测模型。该系统在几分钟内就生成了可运行的计算机代码——这通常需要经验丰富的程序员花费数小时甚至数天。
这种优势源于AI能够基于简短但高度具体的提示编写分析代码。并非所有系统都表现良好。在8个AI聊天机器人中,只有4个生成了可用的代码。尽管如此,那些成功的系统不需要大型专家团队来指导。
由于这种速度,初级研究人员能够在几个月内完成实验、验证发现并将结果提交给期刊。
“这些AI工具可以缓解数据科学中最大的瓶颈之一:构建我们的分析流程,”某机构的儿科教授、某计算健康科学研究所临时主任兼某机构早产研究中心的首席研究员Marina Sirota博士表示,“对于现在就需要帮助的患者来说,这种加速来得再快也不为过。”
Sirota是这项发表在《Cell Reports Medicine》上的研究的共同资深作者。
为何早产研究很重要
加速数据分析可以改进早产的诊断工具——早产是新生儿死亡的主要原因,也是导致儿童长期运动和认知障碍的主要因素。在某国,每天大约有1000名婴儿早产。
研究人员仍未完全了解早产的原因。为了调查可能的危险因素,Sirota的团队汇编了来自约1200名孕妇的微生物组数据,这些孕妇的结局在九项独立研究中被追踪。
“这类工作只有通过开放数据共享、汇集众多女性的经验和众多研究人员的专业知识才能实现,”该论文的共同作者、某机构早产数据存储库联合主任、某机构副教授Tomiko T. Oskotsky医学博士说。
然而,分析如此庞大而复杂的数据集被证明具有挑战性。为了解决这个问题,研究人员求助于一个名为DREAM的全球众包竞赛。
Sirota共同领导了三个DREAM妊娠挑战中的一个,重点关注阴道微生物组数据。全球有100多个团队参与,开发了旨在检测与早产相关模式的机器学习模型。大多数团队在三个月的竞赛窗口内完成了工作。然而,整合研究结果并发表花了近两年时间。
在妊娠和微生物组数据上测试AI
为了了解生成式AI能否缩短这一时间线,Sirota的团队与某机构的Adi L. Tarca博士领导的研究人员合作。Tarca领导了另外两个DREAM挑战,这两个挑战侧重于改进估算孕周的方法。
研究人员共同指示八个AI系统使用来自三个DREAM挑战的相同数据集独立生成算法,无需人工直接编码。
AI聊天机器人收到了精心编写的自然语言指令。与ChatGPT非常相似,这些系统通过详细的提示进行引导,旨在引导它们以与原始DREAM参与者类似的方式分析健康数据。
它们的目标与之前的挑战相呼应。AI系统分析了阴道微生物组数据以识别早产迹象,并检查了血液或胎盘样本以估算孕龄。妊娠 dating 几乎总是一个估计值,但它决定了女性在妊娠过程中接受的护理类型。当估计值不准确时,为分娩做准备就变得更加困难。
然后,研究人员使用DREAM数据集运行了AI生成的代码。在8个工具中,只有4个生成了与人类团队性能相匹配的模型,尽管在某些情况下AI模型表现更好。整个生成式AI的工作——从启动到提交论文——只用了六个月。
科学家强调,AI仍然需要仔细监督。这些系统可能产生误导性结果,人类专业知识仍然必不可少。然而,通过快速筛选海量健康数据集,生成式AI可以让研究人员减少调试代码的时间,而将更多时间用于解释结果和提出有意义的科学问题。
“多亏了生成式AI,数据科学背景有限的研究人员并不总是需要组建广泛的合作团队或花费数小时调试代码,”Tarca说,“他们可以专注于回答正确的生物医学问题。”FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。