8月17日,字节跳动宣布开始对外测试AI对话产品“豆包”,进入官网(https://www.doubao.com/ )直接注册使用或通过官网提供的二维码下载App即可使用。在“豆包”发布前,字节最新的AI进展,是6月被曝光的内部AI项目“Grace”。这款产品表现怎么样?我们来看看
自从ChatGPT出来后,这一整段时间里,科技领域都被大模型,搞得沸沸扬扬的。
在中国,百度和阿里是最早两家出大模型对话的平台,名字叫“文心一言”和“通义千问”。腾讯和京东也没闲着,在大模型这块也投入了,华为也试试水。
除了他们,还有很多小公司也都加入了这个竞赛,你是不是跟我一样,也想知道字节跳动大模型在哪里?昨天,它们终于推出了自己的大模型产品,名叫「豆包」,公测网址:doubao.com
01
我比较对新生事物好奇,于是体验了一下,以后也多给大家评测、推荐一些好玩的产品。
你也可以在APP商城下载,名字一样,也叫“豆包”,不用邀请码,你可以选择手机号、抖音或者Apple ID来注册。
一打开APP,就能看到有各种有趣的聊天机器人,比如英语老师、写作助手,还有个特别健谈的叫小宁,它们不只能发文字,还可以跟你语音聊天。你还可以自己创建一个机器人,给它起个名,然后像聊天的那种AI朋友一样跟它聊。
另外,我有点好奇,就查了下这个doubao.com的背景,你猜怎么着,这个域名2006年就注册了。
我在想,字节跳动是不是早就有这个想法了,或者可能他们是后来买的这个域名;不过,这个“豆包”名字真的很有感觉,很接地气。
接着,我分别测试了一下「豆包」四个方面的能力:
1)普通问答
首先,我就随便问了它几个问题,想让它介绍介绍自己。从它的回答看,这个「豆包」主要是擅长跟人聊天、回答问题、翻译、概括文章和分析情感这些事。
接着,我又问一些实际问题,像是「能不能帮我写一个小红书的热门广告词」。结果「豆包」给的答案挺好的,但是,你能看出来属于生成的,至于发到小红书上,有没有人看,那就另当别论了。
2)解释常识
我试着问它:“你知道‘王智远’是谁吗?”结果它的回答有点让我不知如何评价。先是说不知道,接着又让我提供更多信息,再然后又提到他是画家或者自媒体人。
感觉它好像是在网上爬虫的内容,但当我问它关于一些大媒体的事,它倒是能答出个大概,虽然也不算特别准确。
3)数学计算
大家都知道,数学题对大模型来说挺难,因为数学需要很强的逻辑。但我用那个老掉牙的“鸡和兔子在一个笼子里”题目来考考它,它用最常见的数学方法给我算出了答案。
我又问了一些关于计算机能力和分数简化能力的问题,给的还算精准。
我问它你会写代码么?它告诉我可以 C 语言或 Python 代码都没问题,然后当我说,你能不能直接帮我写一个小游戏时,它就无法完整提供。
也就是说,基础技能上还算OK,在复杂任务上还欠缺。
4)写文章
我想测试下「豆包」写东西水平,就给了它一个“未来AI”的主题,想让它写个科幻故事或小说。结果它写得还不错,文章结构挺好,就是内容稍微有点大而化之,没啥深度。
后来,我又想知道它有啥建议提高英语写作。它就给了我一堆建议,从基本读写,到语法学习,再到怎么写得更好,还怎么找人帮忙修改。听起来还挺实用的。
但我又试着让它帮我总结一篇4000字的文章,这下它就有点吃力了。可奇怪的是,我问它一次能处理多少字,它居然说可以处理上百万字。这有点说不通。
值得一提的是,至于文生图功能,目前暂不具备。
02
针对大型语言模型(LLM),训练数据最后更新时间至关重要,因为,直接决定模型输出内容的时效性和质量。
「豆包」告诉我, 它最后一次训练数据是到2023年4月12日为止。 为了查一查「豆包」的知识更新有多及时,我特地问了它一些最新的事,
比如:
2023年3月OpenAI发布的Chat GPT-4。 结果它答对了。 但等我再追问它,有没有听说过GPT 5时,它的答案,让我有点怀疑是不是在胡编乱造。
感觉有点像之前的GPT3,答案可能不那么靠谱。不过,我再问了问十四大会议是哪天召开的,这回它答得蛮准的。
其实,字节发力大模型有迹可循。
ChatGPT很火那段时间,也就是今年二三月,有消息说字节跳动正在组建一个做大模型的团队。
根据36kr的消息,字节主要在研究跟语言和图像有关的大模型,他们还希望把这些大模型用在自家的搜索和广告业务上。
但那时候,字节跳动相关技术领导说,他们在这方面还只是开始探索,技术还很初级;后来虽然很多公司都开始“打大模型战争”,但字节跳动似乎没想要直接参与,他们更像是在为大模型提供技术支持。
今年6月份时,有消息说字节跳动在内部测试一个叫“Grace”的AI产品,现在这个“Grace”的网站直接跳转到了“豆包”的官网。
虽然“豆包”没说它就是“Grace”,但很可能“豆包”就是“Grace”的一个公开测试版,你一搜就能查得到。
最后,还有个新模型叫BuboGPT在huggingface上推出了试用版,这个模型也是字节跳动参与开发的。根据论文,这个模型可以同时处理文本、图像和音频,也很厉害。
03
就我看来,字节跳动推出独立的“豆包”APP,而不是直接放在抖音里,可能有两方面思考。
其一,字节可能想搞个炒鸡火的新APP出来试试。
这也不排除他们是想先让大家玩玩,看看反应怎么样,再决定是不是把它塞到抖音里。
我个人觉得AI和短视频简直是绝配;抖音推荐那些好看的视频不都是靠AI吗?现在很多短视频里的内容,像那些文案啊、背景音乐啊,都是AI出的主意。
字节这么一弄,抖音里的那些创作者们一定会跃跃欲试,看看能不能用上这技术。
其二,字节可能想用AI把它的所有APP都串在一起。
再看看快手,它和抖音玩的花样就不大一样。快手的AI,更像是给用户当个高级搜索狗,帮他们找好内容。
虽然快手也搞了点AI问答的东西,但和“豆包”比起来,差不多是一个味儿。
其实,不管是字节跳动还是快手,他们底下用的AI技术差不多,主要就是看谁有的数据多,算法调得好。
字节跳动可能想用AI搞大事情,串联所有的产品,快手可能就想把自己的APP做得更爽,用户用得更舒服。
显然,虽然字节跳动和快手在AI这块儿有很多相似,但他们玩的花样、看的远景都不太一样。他们两的AI功能,也真的展现了怎么看待技术和用户需求,有自己的小智慧在里面。
总的来说:
这个产品还处于早期开发验证阶段,跟其他产品完全没有可比性,拿来处理处理基础工作任务,还算可以。