得分率超74.6%,京东云JoyCode-Agent位居SWE-Bench全球榜单Top3

12次阅读
没有评论

得分率超74.6%,京东云JoyCode-Agent位居SWE-Bench全球榜单Top3

京东云JoyCode-Agent位居智能编码榜单全球Top3

近日,在权威SWE-Bench Verified基准测试中,京东云JoyCode-Agent凭借74.6%的高通过率位居SWE-Bench榜单全球Top3,展现出卓越的复杂编程问题解决能力,并正式在GitHub上开源。作为面向严肃开发场景的企业级编码产品,JoyCode通过规约编程端到端智能体团队与CSR上下文引擎,高效破解大型复杂代码库的维护难题。

得分率超74.6%,京东云JoyCode-Agent位居SWE-Bench全球榜单Top3

得分率超74.6%,JoyCode-Agent位居全球Top3

SWE-Bench Verified通过使用真实世界开源项目中的Bug报告和Issue来测试Agent从理解问题到自主生成、集成和验证修复代码的完整端到端能力,是AI Coding 技术走向和产品落地的行业风向标之一。

基于领先的技术创新和工程优化,京东云JoyCode-Agent在SWE-Bench Verified 基准测试,凭借74.6%的高通过率位居榜单全球Top3。值得一提的是,这一成绩在显著降低 30%-50% 计算成本的前提下达成的,不仅证明了 JoyCode-Agent 在复杂编程任务中的高效解决能力,更彰显了其在实际应用场景中的高性价比和商业价值。

首先,端到端自动修复闭环。JoyCode-Agent采用多智能体协作的设计思路,围绕真实软件仓库问题,构建出“测试生成—补丁生成—验证—经验迁移—智能决策”五大环节闭环。系统不仅能自动理解问题描述,精准生成针对性的补丁,还能同步生成多维度单元测试,全方位验证修复效果,确保补丁既能解决核心问题,又兼顾代码质量与回归安全。

其次,多智能体协作与经验复用。系统设置了Testing Agent、Patch Agent、CSR Agent、Decision Agent四大核心智能体。各Agent分工协作,通过自动测试约束、代码理解与修改、失败归因、经验检索与投票仲裁,形成高效的自适应迭代机制。

第三,精细化失败归因与资源优化。JoyCode-Agent创新性地引入失败归因机制,精准区分补丁逻辑缺陷、测试用例问题与环境错误等异常情况,针对不同类型自动选择最优重试路径。相较于业内普遍的“海量采样+投票”粗放式策略,JoyCode-Agent通过有针对性的闭环迭代与经验迁移,显著降低计算资源消耗。

JoyCode 2.0全面升级,聚焦企业级严肃开发场景

智能编码平台JoyCode,是京东云专为应对企业级复杂任务而设计的智能编码工具,可提供代码预测续写、注释生成代码、智能代码评审、批量生成单元测试等能力,实现0手写代码的全自动化编程。此次全新升级的2.0版本,具备四大核心特性,为开发者提供更优秀的编程体验。

得分率超74.6%,京东云JoyCode-Agent位居SWE-Bench全球榜单Top3

在智能体团队协同方面,JoyCode 2.0采用多智能体架构,内置可持续学习的智能体生态系统,支持用户根据不同业务场景创建定制化智能体,通过”先规划、后执行”的策略,以团队协作方式智能拆解复杂任务。

在规约编程方面,JoyCode 2.0通过规约编程机制,基于需求、设计、实施的三阶段工作流程,实现了从需求到交付的端到端覆盖,确保业务意图精准落地为高质量代码,显著降低开发过程中的信息偏差。

在CSR上下文引擎方面,通过对代码仓库的深度解析,全面理解代码仓库上下文等集成开发环境信息,JoyCode 2.0可根据用户意图智能路由检索策略,灵活使用各种规模的代码仓库采取不同的策略组合。

在一键云端部署方面,JoyCode 2.0支持快速远程项目创建与自动化环境配置,将开发环境与云部署无缝集成,为开发者提供从编码到应用发布的一站式解决方案,极大提升项目交付速度与敏捷性。

当前,JoyCode已服务京东上万名研发人员,支撑数亿级用户产品研发,生成代码采纳率超50%,开发周期缩短40%。

点击链接了解JoyCode-Agent开源项目:

https://github.com/jd-opensource/joycode-agent

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy