编者按:随着人工智能(AI)技术的快速发展,社会对生成式人工智能潜在影响的关注与日俱增。一方面,人们担忧这项技术可能取代人类工作,导致大规模去技能化和广泛失业。另一方面,人们寄希望于生成式人工智能能够提升人类的能力,带来前所未有的创新和生产力提升。在这一背景下,微软研究院开展了有关如何将人工智能与人类认知和决策相结合的研究。其三位研究员 Hofman、Goldstein、和Rothschild 前不久在 Harvard Business Review(《哈佛商业评论》)上发表了《A Sports Analogy for Understanding Different Ways to Use AI》“用体育的比拟来理解使用人工智能的不同方式”文中通过对激素、运动鞋和教练的解释,清晰地传达了使用AI的三种不同模式,从而引导读者更深入地思考人工智能在社会中的角色。同时,文中强调了设计选择、对AI应用的规范化、以及优先级的演变对人工智能工具可能产生的长期效果的重要性;人工智能工具可以成为有益的合作伙伴,而不是简单的替代品。总体而言,这篇文章不仅提供了对生成式人工智能不同应用方式的深入思考,而且通过体育类比、实际案例和设计理念,为读者提供了一种理解和评估AI技术的框架。如需转载,请联系我们(ID:15937102830)。
就像许多新技术一样,生成式人工智能对社会的潜在影响存在两极分化的观点。有一种担忧,认为这项技术将取代人类工作者,导致大规模的去技能化和广泛的失业。同时,也有一种希望,即生成式人工智能将增强人类能力,实现个体和集体创新与生产力前所未有的提升。在微软研究院关于用人工智能增强人类认知和决策的工作中,我们把这些情景看作是一个范围内的点,并创造了一个体育类比来帮助理解:人工智能工具可以从激素、运动鞋到教练,每一种都代表着人类用户与技术之间不同的关系。
让我们从激素这个范围中最不理想的点开始。激素可以提升短期表现,但在长期内可能导致更差的结果。例如,想象一个学生被布置作业,来阅读和评论一段文字。学生可以使用大型语言模型(LLM)作为激素,只需将段落文本放入 ChatGPT 或任何类似工具中,提示它产生这样的批评,并将输出传递回老师。虽然这使学生能够立即完成作业,但从长远来看,它违背了练习的目的。学生不仅可能无法从作业中学到东西,而且可能永远不会获得(或缓慢失去)评论一篇文章并清晰表达思想的能力。就像在体育中,为了实现短期目标而采取捷径,可能对长期内的其他目标产生负面影响。
在这个范围的中间,人工智能驱动的工具可以用来增强人们的技能并提高他们的生产力。这就是我们认为类似于良好跑鞋的情况。就像耐克的碳底鞋让跑步者平均快4-5%,一些人工智能工具可以在瞬间提升性能,而不会像去技能化工人那样在长期内产生负面影响。例如,LLMs特别适用于翻译、重新格式化和注释非结构化文本,可以为知识工作者节省大量时间和精力。想象一下,一位分析师正在进行一项国际调查,并以 20 种不同语言提供自由格式的文本回复。LLM可以大大减少将这些回答翻译成一种共同语言、为其评分积极或消极情感以及提取关键主题所需的时间。与增强性能的运动鞋类似,在这种情况下,人工智能可以提高分析师当前的能力,同时仍然允许应用他们的人类判断力、好奇心和创造力。
在最理想的一端,人工智能驱动的工具可以像教练一样使用,提高人们自身的能力。假设一位 IT 专业人员正在学习通过一个新的复杂系统的认证测试。经过系统文档培训的LLM可以在专业人士获得能力时交互式地生成练习问题,并在教授高级概念时提供个性化反馈。最终,这将帮助专业人士扩展对主题的理解,并开发新技能,这些技能的持续时间超出了使用人工智能导师所花费的时间。
我们自己的研究显示,在学习新数学概念方面也有类似的好处。在我们进行的一项在线随机实验中,我们发现让人们在练习标准化测试问题时访问基于LLM的解释,可以显著提高他们以后独立解决类似测试问题的能力。就像体育教练一样,人工智能教学工具有可能在短期和长期内都提供好处。
虽然我们认为在运动能力和认知能力之间的这些类比是合适的,但两者之间存在重要的差异。在体育中,激素、运动鞋和教练的三种关系都是相当明确的,但在涉及许多小幅变化的AI驱动工具时,情况就不那么明显了。因此,我们在设计和使用这些工具方面所做的选择可以将它们从范围的一端转移到另一端。同样,我们制定的规范以及随着时间的推移我们的重点如何演变将在确定我们何时、如何以及为何使用AI驱动的工具方面发挥关键作用。
设计选择至关重要
首先,从设计的角度来看,我们对如何构建AI驱动工具的看似无害的选择可能对它们的影响产生重大影响。以拼写检查为例,这是一个相对平凡的例子。大多数拼写检查器在您输入时不会自动修复单词而没有反馈。相反,它们提供提示,指示可能的拼写错误,并提供机会不仅纠正书写错误,而且可视化正确的拼写。这个小小的选择将拼写检查从一种激素变成了更像是教练的工具。它不仅提高了最终产品的质量,还帮助您从错误(或打字错误)中学到东西。
通过有意识地思考我们如何设计AI工具,我们可以最小化或避免有害的长期效果。例如,我们最近的实验表明,类似于拼写和语法检查中所做的简单的基于信心的高亮显示,可以帮助人们发现并纠正LLM搜索工具产生的虚构或“幻觉”。这个想法是,如果我们能够向人们展示LLM生成的响应中哪些信息可能不太可靠,我们就可以帮助他们发现和修复潜在的错误。这仍然提供了提高生产力的机会,同时保持了对LLM生成的响应可能出错的认知警示。通过精心设计,我们可以开发有益的副驾驶,这些副驾驶能够增强人们的工作能力,而不是取代他们。
规范将会出现
其次,我们需要制定一些思考何时以及如何使用AI工具的准则。计算器是另一个历史类比。虽然我们很难反对银行家使用计算器计算复利,但同样难以主张给正在学习基础加法的小学生一个计算器。就像我们已经制定了如何以及何时使用过去的技术创新的规范一样,我们想象同样的规范将会在AI工具方面出现:同一工具在某些环境中可能被认为是有益的,而在其他环境中可能是有害的。我们还预计这些规范会随着时间的推移而发生变化。
例如,过去图书馆是查找信息和引用的黄金标准,但随着搜索引擎质量和覆盖范围的提高以及我们能够提出有效的查询并找到正确的结果,互联网已经变得越来越可靠和被接受的信息来源。我们相信类似的转变将会在AI工具方面发生,因为基础技术和我们使用它的能力共同演进。与此同时,企业需要考虑让工人过分依赖最新工具的后果:只有一种方法解决问题是一个脆弱点。在工作场所,制定规范和期望AI工具何时(和何时不)适用,以及确保它们得到负责任和道德使用,将落在业务领导者的责任范围内。
优先级将变化
这些分类都不是简单的,可能会在人与人之间、行业与行业之间有微妙的差异。考虑一下随时间推移对拼写和算术价值的变化。如上所述,过去能够进行长除法或拼写生僻单词而不依赖辅助工具曾经是备受推崇和尊敬的才能,但现在它们在很大程度上被视为过时和深奥的技能。据推测,这是因为大多数人在需要时都可以使用可靠的计算器或拼写检查工具,从而使曾经被害怕为激素的东西变得不再成为问题。因此,这释放出时间让人们投资于发展其他技能。简而言之,我们决定让一些技能萎缩,以便我们可以专注于发展其他技能。
随着AI工具的发展,我们预计会看到社会上对哪些技能有价值和优先考虑的转变。人们将以不同的方式利用他们的时间,并将学习投资于新的领域。例如,对特定编程语言的详细语法知识可能会因为生成式AI工具能够以越来越高的准确性自动生成代码而变得不那么重要,这将使工程师能够专注于更高级别的系统设计和架构。随着某些技能变得不那么突出,新技能作为重点出现,公司应该主动提供培训,以确保员工保持具有最相关和有价值的技能。
我们希望我们在这里提供的激素、运动鞋、教练的框架能够帮助思考这些问题,并对嵌入到工作和生活中的AI工具提出关键问题。随着我们整合AI,我们的挑战是打造增强而不是削弱人类能力的工具。通过谨慎的设计和深思熟虑地考虑这些工具何时以及如何应用,以及允许这些重点随着我们共同演进而发生变化,我们有机会塑造一个未来,其中AI增强了我们的人类能力。
想要了解更多,欢迎入群交流!
权益福利:
1、AI 行业、生态和政策等前沿资讯解析;
2、最新 AI 技术包括大模型的技术前沿、工程实践和应用落地交流(社群邀请人数已达上限,可先加小编微信:15937102830)
关于MoPaaS魔泊云
源于硅谷、扎根中国,上海殷泊信息科技有限公司 (MoPaaS) 是中国领先的人工智能(AI)平台和服务提供商,为用户的数字转型、智能升级和融合创新直接赋能。针对中国AI应用和工程市场的需求,基于自主的智能云平台专利技术,MoPaaS 在业界率先推出新一代开放的AI平台为加速客户AI技术创新和应用落地提供高效的算力优化和规模化AI模型开发、部署和运维 (ModelOps) 能力和服务;特别是针对企业应用场景,提供包括大模型迁移适配、提示工程以及部署推理的端到端 LLMOps方案。MoPaaS AI平台已经服务在工业制造、能源交通、互联网、医疗卫生、金融技术、教学科研、政府等行业超过300家国内外满意的客户的AI技术研发、人才培养和应用落地工程需求。MoPaaS致力打造全方位开放的AI技术和应用生态。MoPaaS 被Forrester评为中国企业级云平台市场的卓越表现者 (Strong Performer)。
END
▼ 往期精选 ▼