吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

628次阅读
没有评论

吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

 ▾   栏目简介 

 

如果说之前推出的【论文速读】是领读严谨的大模型实证研究论文,那么【好文译递】则想传递 观点性、发散性的议论文章,只是静静地完整呈现译文,任您自由地品读和思考。

 

吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

 ✍🏻 编者按 

 

2023年4月19日,人工智能机器学习权威学者 吴恩达(Andrew Ng)在 DeepLearning.AI 发表了名为《Opportunities and Pitfalls for Large Language Models》的一封信。吴恩达在信中恳切地分享了对大模型C端聊天接口和应用层的观察结果,他的观点对于大模型产品如何在同质化竞争中脱颖而出具有启发,值得我们学习和思考。

 

    吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

 📖 原文中译 

大模型的机遇与陷阱

 

 

吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

 

大模型业务领域充斥着 API,缺少价值更高、开发难度更大的应用程序。

亲爱的朋友们,

大语言模型(LLMs)的竞争格局正在迅速打开。最终的胜者尚未确定,但当前的形势已经令人兴奋。让我分享一些观察结果,重点关注直接面向消费者的聊天接口以及大模基础设施和应用层。

首先,ChatGPT 是一个新产品类别。它不仅仅是一个更好的搜索引擎、自动补全器或者其他我们已经知道的东西。虽然它与其他产品类别有所重叠,但人们也将其用于完全不同的目的,比如写作和头脑风暴。像谷歌和微软这样将大模型集成到现有产品中的公司可能会发现,转变不仅涉及技术,而且涉及产品类别,这就带来了独特的挑战。

OpenAI 显然在提供这个新产品类别方面处于领先地位,ChatGPT 是一个极具吸引力的直接面向消费者的产品。虽然竞争对手正在不断涌现,但最近 ChatGPT 开始支持第三方插件,一旦广泛采用,那么 OpenAI 的业务可能会变得更具防御性——就像 iOS 和 Android 的应用商店帮助这些平台更具防御性一样。

其次,大模型的基础设施层使开发人员能够通过 API 与大模型交互,这看起来很有竞争力。OpenAI/微软在这个领域领先,谷歌和亚马逊也宣布推出了自己的产品,而 Hugging Face、Meta、Stability AI 等公司和许多学术机构也正在忙于训练和发布开源模型。有多少应用程序需要用到像 GPT-4 这样的最大模型,而不是云提供商提供的更小(更便宜)的模型,甚至是在本地托管的模型(如gpt4all)——这还有待观察。

最后是大模型应用层。开发团队是在大模型基础上构建的,这个领域看起来竞争不那么激烈,且充满创造力。虽然许多团队正在挤入“显而易见”的想法 ——比如在在线内容基础上构建问答机器人或摘要生成器 。但 大模型驱动应用程序的潜在多样性还未被充分探索,包括专业指导(specialized coaching)和机器人过程自动化(robotic process automation)等垂直领域。我所领导的风投公司 AI Fund 正在与企业家合作开发构建这样的应用程序。当你能够识别确定出一个有意义的用例并深入解决它时,竞争的感觉就会减弱。

大模型是一种通用技术,它使许多新应用成为可能。从早期技术时代汲取教训,在 iPhone 推出后我花了 1.99美元购买了一个能把我的手机变成手电筒的应用程序。这是一个好主意,但这个业务并没有持续下去:其他人很容易复制并以更低的价格销售这个应用程序,最终苹果将手电筒整合到了 iOS 系统中。相比之下,其他企业家则构建了价值更高和开发难度更大的应用,例如 AirBnB、Snapchat、Tinder 和 Uber,这些应用程序至今仍然与我们在一起。我们可能已经在生成式AI中看到了这种现象:Lensa 在去年 12月使用量迅速增长,但其营收似乎已经崩溃。

今天,在一个周末的黑客马拉松中,您就可以通过利用厉害的 API 构建一个浅层的应用程序,来实现惊人的结果。但从长远来看,让我兴奋的是 大模型能为解决难题提供有价值的解决方案。谁将打造生成式 AI 的持久成功?也许就是你!

一个挑战是,构建大模型产品的专业技术仍在不断发展。虽然学术研究很重要,但当前研究对如何使用大模型只提供了有限的视野。正如 InstructGPT 论文所说,“公共 NLP 数据集不反映我们如何使用语言模型……它们旨在捕捉使用自动指标进行评估的任务。” 

鉴于此,社区的作用比以往任何时候都更加重要。与从事大模型产品开发工作的朋友交谈,经常教会我一些直觉以外的技巧来改进我对这些产品的使用。我将继续尽我所能去帮助别人。

请不断学习吧!

吴恩达

 

原文🔗:https://www.deeplearning.ai/the-batch/opportunities-and-pitfalls-for-large-language-models/

*声明:原文来自 DeepLearning.AI 官网,如有侵权,可提议撤稿

 ▾   好文征集 

欢迎大家添加 【OpenBMB】 微信号,即可进入大模型社群交流文章,也可分享推荐更多AI领域的好文!文章时效不限,既可以是讨论密集的的热点时文,也可以是历久弥香的经典前文~

吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

长期开放招聘|含实习

算法岗  |  开发岗  |  产品岗

 

吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

官方网站
https://www.openbmb.org
 
GitHub
https://github.com/OpenBMB
https://github.com/thunlp

技术文章
Delta Tuning 登陆 Nature子刊 大模型工具学习引擎 BMTools
CPM-Ant 训练完成 BMInf 适配GLM-130B
高效训练工具 BMTrain BMTrain 技术原理
CPM-Live 邀请函 CPM-Live 训练启动
OpenBMB 社区介绍 | 大模型课程
大模型榜单 BMList

长期开放招聘含实习
开发岗  |  研发岗  |  运营

交流QQ群
735930538

欢迎转载
商务合作请联系
openbmb@gmail.com

👏期待您的关注与加入👏
吴恩达:大模型的机遇与陷阱【好文译递】第 7 期吴恩达:大模型的机遇与陷阱【好文译递】第 7 期

 

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy