梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
以产品见长的腾讯,终于推出C端AI助手App:腾讯元宝。
与之前测试的混元助手相比,元宝在AI搜索、AI总结、AI写作等核心能力上都有升级,大模型效果提升50%。
功能听起来好像和同类AI助手也差不多?But,一试才发现——
能精准搜到微信公众号生态优质内容的(比如量子位本位~),也就腾讯自己能搞了。
这里的参考来源④,正是我们发布的Hinton揭秘Ilya成长历程:Scaling Law是他学生时代就有的直觉。
另外可以看到,提问不用特别完整,只需随口一问,元宝就能推测出你的意图,比如补全人名后再精确命中相关资料。
再来看长文本总结能力,腾讯混元大模型支持256k长文本,实际到元宝APP中表现如何呢?
比如上传一本大家喜闻乐见的《马斯克传》,界面标出了共有22.5万字,还贴心地自动填写了默认提示词。
总结效果也很完整,但是不是偷懒仅仅阅读了前言和目录呢?
选择全书中间靠后一点的一个细节提问,这是大模型“大海捞针”测试中最容易出错的地方了。
对比微信阅读上的原文,掌声可以响起来了。
在发布会现场,腾讯云副总裁、腾讯混元大模型负责人刘煜宏透露,结合微信公众号还只是第一步,未来将继续链接、整合腾讯更多生态。
除此之外,在我们短暂的试用过程中,还有更多细节值得分享。
模型能力到位,玩法多样
腾讯元宝APP背后是腾讯混元大模型,也自然继承了混元大模型的很多特色。
比如给它一个简单的数学计算任务,就可以发现AI在分析思路时非常流畅,但最后给出结果前却稍有停顿。
这并不符合大模型预测下一个token的运作原理,反倒像是真的在计算。
背后其实是AI先写了一段代码,在后端执行再返回结果。
不得不说,这是一种解决大模型计算不准确问题的巧妙思路。
又比如指令跟随能力,提出各种各样复杂的结构化长指令,元宝都能按要求执行。
24点游戏对于大模型来说并不简单,需要编写复杂的思考框架提示词来指引。
但AI助手如果不能准确跟随指令,那提示词写的再完善也没用。
(为了方便展示长内容,我们切换到网页版来操作,聊天记录和APP是互通的。)
元宝在做计划这块,思考的确实很周到全面了。
执行计划时虽然绕了点弯路,但最终还是确保得到了正确答案。
除了语言模型之外,多模态识图能力也是到位了。
混元大模型基础能力够强,元宝上更多丰富的玩法才能更实用。
除了工作场景最核心的AI搜索、AI总结、AI写作三大能力之外,元宝还针对生活娱乐场景提供了多个特色AI应用,并新增了创建个人智能体等玩法。
智能体可以是让AI扮演特定角色陪你聊天,也可以是擅长完成特定任务的专家。
更方便的是,智能体在手机端就可以轻松创建。
但其实腾讯在智能体上还有更大的布局:一站式智能体创作与分发平台腾讯元器。
打开元器平台,我们刚刚在元宝上用手机创建的智能体,已经同步了过来。
在这里就可以给智能体添加插件、知识库、工作流等更多模块,完成更复杂的任务。
元器平台现在也走出内测正式全量开放,更多智能体创新玩法大家挖掘了。
最后,元宝已在App、小程序和网页端上线,App可以在各大应用商店下载。
腾讯元宝网页版:
https://yuanbao.tencent.com