谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

993次阅读
没有评论

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

CEO皮猜亲自站台

CEO皮猜亲自站台,谷歌的最新研究狠狠火了——

为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体AI系统。

划重点,该系统将与OpenAI o1/DeepSeek-R1相似的测试时间计算用来加速科学发现。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领域取得了初步成果。

而且趁热打铁,谷歌这次还面向全球科学家推出了一个“可信测试计划”,大家现在都可以申请。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

另外,从致谢名单可以看到,这项研究集齐了谷歌内部豪华阵容,包括Google Research、Deepmind以及Cloud AI teams,还有顶尖高校科学家参与测试……

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

正如网友所言,说不定AI智能体未来某天就获得诺贝尔奖了。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

文献综述/提出假设/报告一条龙搞定

直接来看AI co-scientist的运作过程

其目标非常清晰,当科学家文字给出研究主题后,它会借助多个AI智能体帮助生成新的研究假设、详细的研究概述和实验方案。

参与其中的智能体包括但不限于:

  • 生成(Generation):提出新的假设或想法
  • 反思(Reflection):评估和分析生成的假设
  • 排名(Ranking):对假设进行优先级排序
  • 进化(Evolution):通过迭代改进假设
  • 邻近性(Proximity):探索与现有知识相近或相关的领域
  • 元审查(Meta-review):对整个过程进行监督和优化

这些智能体通过自动化反馈不断迭代,生成、评估和改进假设,从而形成自我优化循环,最终输出高质量研究方案。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

而作为科学家,具体可以通过以下几种方式参与协作。

比如最开始给系统提供粗略的想法或一些研究主题or方向,让它帮你进一步细化;或者对AI的输出提供自然语言反馈,让它进一步调整。

此外,科学家还能使用其他工具,如网络搜索或一些专业领域的AI模型,来进一步提高研究质量。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

深挖二者具体协作过程,还能看到当科学家提出研究目标后,有一个监督智能体(Supervisor Agent)来负责工作分配。

  • 专业智能体(红色框,具有独特的角色和逻辑);
  • 科学家的输入和反馈(蓝色框);
  • 系统信息流(深灰色箭头);
  • 智能体间的反馈(智能体内部的红色箭头)。
谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

从上面可以看出,整个AI co-scientist系统的运作较为简单。

测试时间计算用于科学发现

当然,这项研究的主要亮点是:

扩展测试时间计算(test-time)来大大增强其推理能力,包括上面提到的自我对弈、假设排名和进化过程等关键推理步骤。

在研究中,AI co-scientist利用Elo评级系统来衡量和提升其在解决科学问题方面的能力。

具体而言,Elo评级是一个动态的评估指标,通常用于衡量比赛者的相对技能水平。研究人员对比了AI co-scientist(蓝色线)和Gemini 2.0(红色线)在GPQA(General Problem-solving Question Answering)基准测试上的平均准确率。

结果发现,高Elo评级的系统在解决挑战性问题时,能够提供更准确答案。(正相关)

这表明了,Elo评级可以作为一个有效的指标,用来预测和提升AI co-scientist在科学问题解决方面的性能。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

接下来,七位领域专家精选了15个开放的研究目标,并提出了相应的最佳解决方案。

目标是,利用自动化的Elo评估指标,来对比AI co-scientist和其他最先进智能体和推理模型(Gemini 2.0 Pro版本和推理版本,以及人类专家)在解决这些复杂问题上的表现

结果显示,AI co-scientist明显表现最佳。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

此外,随着AI系统投入更多时间进行推理和改进,其自我评估的质量得到了显著提升,甚至超出了传统模型以及在某些情况下无法解决问题的人类专家的水平。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

更关键的,基于对11个研究目标子集的分析,专家评估认为AI co-scientist在新颖性影响力方面的表现优于其他基线模型。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

为了进一步评估AI co-scientist用于科学发现的实际潜力,研究团队进行了一系列端到端的实验室实验。

这些实验专注于三个关键的生物医学领域:药物再利用、新治疗靶点的提出以及抗菌耐药性的背后机制

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

实验中,AI co-scientist不仅受到了专家的指导和反馈,而且涵盖了从简单到复杂的多种研究场景。

话不多说,我们具体来看其取得的初步成果。

首先,药物再利用是一种将已经批准用于其他疾病的药物用于治疗新疾病的策略。这种方法能够缩短药物开发的时间和成本,并且可以快速地将有效的治疗方案带给患者。

这一次,研究人员将目光瞄准了急性髓系白血病(AML),AI co-scientist通过分析大量的生物医学数据,包括药物的化学结构、药效学和遗传信息,来预测哪些现有药物可能对AML有效。

最终,AI co-scientist提出了3种可能药物。而且在进一步验证中,它所建议的药物在多个AML细胞系中,以临床相关的浓度抑制了肿瘤的活力,证明了其有效性。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

而比药物再利用更复杂的识别新型治疗靶点中,研究人员聚焦于肝纤维化这种疾病。

肝纤维化的治疗是当前肝病研究的重点,而寻找有效的治疗靶点是关键。

过程中,AI co-scientist通过对大量生物医学数据的分析,包括基因表达谱、蛋白质互作网络和已知药物数据库,来识别与肝纤维化相关的关键分子和生物学路径。

对比它所提出的一系列潜在治疗方案,和传统的纤维化诱导剂(作为阴性对照)以及抑制剂(作为阳性对照)来看,所有由AI co-scientist建议的药物都显示出有希望的活性(p值小于0.01)。

这意味着这些药物在治疗肝纤维化方面具有很高的可能性。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

最后,在第三次实验中,通过分析大量的遗传学、蛋白质结构和药物活性数据,AI co-scientist也被发现能够识别和预测细菌耐药的潜在机制。

具体而言,在囊膜形成噬菌体诱导的染色体岛(cf-PICIs)中,研究人员利用AI co-scientist的能力来探索cf-PICIs在多种细菌物种中的存在和功能机制。

AI co-scientist通过分析和整合大量的生物学文献和数据,独立提出了一个新的假设:

cf-PICIs可能通过与多种噬菌体尾部相互作用来扩大其宿主范围。

而这一假设得到了实验室实验的验证。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

不过需要提醒,尽管AI co-scientist已经在科学发现上取得一系列初步成果,但谷歌也点出了其局限性:

文献综述能力、事实核查、与外部工具的交叉检查、自动评估技术以及更大规模的评估等,均需要进一步完善。

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

现在,感兴趣的研究人员or团队可以申请一波了~

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 2 月
 12
3456789
10111213141516
17181920212223
2425262728  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

Failed to fetch content Read More 
LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了 一水 2025-12-21 19:13:08 来源:量子位 “LLM到不了AGI...
自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026 一水 2025-12-21 19:11:12 ...