今天为大家介绍的是来自DAVID BAKER 和GEORGE CHURCH团队的一篇论文。
计算机蛋白质设计的能力和精确度随着人工智能(AI)方法的整合迅速提高。这将转变生物技术领域,使其在可持续性和医学方面取得进展。DNA合成在实现设计蛋白质方面发挥着关键作用。然而,与所有重大革命性变革一样,这项技术容易被误用,生产出危险的生物制剂。为了在减轻可能出现的风险的同时充分发挥这一革命的好处,所有合成的基因序列和合成数据都应该收集并存储在仅在紧急情况下查询的存储库中,以确保蛋白质设计以安全、可靠和值得信赖的方式进行。
大自然的蛋白质在漫长的进化过程中巧妙地应对了各种挑战,但今天的问题,如全球性病原体、神经退行性疾病和生态系统退化,需要新的解决方案。AI加速的蛋白质设计可以帮助解决许多这些问题。基于机器学习的方法能够快速创建具有多样结构和功能的生物分子,这些分子通常与任何已知蛋白质没有可检测的序列同源性。与此同时,DNA合成成本、质量和速度的指数级改进简化了将这些蛋白质编码成合成基因的过程。去年,通过计算蛋白质设计开发的第一种药物——COVID-19疫苗SKYCovione获得了国际批准。通过这种方法,可以在短时间内实现更多此类创新。但正如去年在英国举行的全球AI安全峰会所反映的那样,规范AI的道路可能会漫长且复杂。过于严格的AI法规可能会阻碍计算蛋白质设计的进展。好消息是,用于蛋白质设计的AI工具高度专业化,因此风险缓解手段应该相对直截了当。
在2023年AI安全峰会之前,华盛顿西雅图的一次会议召集了来自学术界、工业界、慈善界和政府机构的国际代表,讨论AI支持的蛋白质设计,特别是在大流行准备和药物开发方面。合成DNA的制造被认为是一个关键的生物安全控制点。会议中提出的建议之一是筛选和记录所有合成的遗传序列。这将为制造有害生物分子(无论是意外还是故意的)设置一个实际的障碍。
自2004年以来,由国际基因合成联盟(IGSC)成员提出并自愿采纳的DNA合成监管已在学术界、生物技术和制药行业中广泛实践。目前,向学术、私营和政府机构请求DNA序列时,IGSC会根据共识列表筛选与病原体成分的同源性。展望未来,这些检查可以与合成本身(无论是化学还是酶)相关联,以便每台合成机都需要对每个新的遗传序列进行加密的精确匹配搜索。仅筛选序列可能不够,因为通过从头设计生成的蛋白质可能与任何自然蛋白质几乎没有序列相似性,这使得同源性检测复杂化。因此,需要记录合成的序列,必要时使用加密技术来保护商业秘密。如果世界上任何地方出现新的生物威胁,相关的DNA序列可以追溯到其来源。”选择性揭示”政策可以确保此类查询仅在特殊情况下并根据预先设定的标准进行。由于生物复杂性使得一次尝试就创造出危险因子极不可能,因此这种追踪新兴威胁到其起源的能力应该是有效的。除了提供审计轨迹外,意识到所有合成序列都被记录可能会威慑不法行为者。筛选和记录实践应该被标准化,国际实践,并扩展到实验室核酸合成器。
这种蛋白质设计安全策略取决于所有相关社区的输入,以支持所需的基础设施并定义人类、机构和治理要求。理想情况下,像IGSC这样的国际组织应该领导但与政府和非政府组织合作。加强安全不应威胁信息共享或透明沟通,这是现代科学的标志;科学资助者、出版商和决策者应该阻止以生物安全为借口不分享新方法和进展。相反,这一快速发展领域的安全应该被框定在最大化解决迫切的社会关切的范围内。
编译 | 曾全晨
审稿 | 王建民
结论
Baker, D., & Church, G. (2024). Protein design meets biosecurity. Science, 383(6681), 349-349.