我们让ChatGPT总结了微软154页GPT-4研报,抽象思考能力优于数学运算|钛媒体焦点

1,430次阅读
没有评论

我们让ChatGPT总结了微软154页GPT-4研报,抽象思考能力优于数学运算|钛媒体焦点

(图片来源@视觉中国)

随着美国OpenAI公司推出的人工智能(AI)对话模型ChatGPT风靡全球,该公司背后核心投资方微软开始评估GPT-4对未来人类的影响。

我们让ChatGPT总结了微软154页GPT-4研报,抽象思考能力优于数学运算|钛媒体焦点

钛媒体App 3月29日消息,微软雷蒙德研究院机器学习理论组负责人Sebastien Bubeck以及2023斯隆研究奖得主李远志等人组成的科研团队,近日在预印版平台arxiv上发布长达154页的论文《通用人工智能的火花:GPT-4早期实验》。

鉴于最近ChatGPT的爆火,钛媒体App利用ChatGPT API的相关翻译开发平台,将微软这篇GPT-4研究报告用ChatGPT进行翻译、梳理和理解,并且通过多次Prompt提示词、对话方式,试着让ChatGPT介绍和评价微软这篇长达154页、关于GPT-4的论文。

我们让ChatGPT总结了微软154页GPT-4研报,抽象思考能力优于数学运算|钛媒体焦点

据悉,微软是离ChatGPT和其母公司OpenAI最近的科技巨头之一。

今年1月24日,即ChatGPT发布第二个月,微软宣布数十亿美元投资 OpenAI,并且计划在算力、商业化以及 AI 技术方面进行长期合作。据报道,本轮融资后OpenAI公司估值高达290亿美元,接近2000亿元人民币。随后2月7日,微软推出ChatGPT版Bing(必应)搜索引擎和Edge浏览器,并在3月更新GPT-4后同时升级,引发全球广泛关注。

如今新的 AI 浪潮下,微软开始希望全面评估GPT大模型对于人类、整个 AI 技术行业发展的影响。

具体来说,本论文核心主题是关于GPT-4的人工智能系统,它展示了人工智能的一种形式,即人工通用智能(AGI)。论文通过实验研究与讨论GPT-4在推理、创造力、演绎等核心思维能力方面的表现,以及它在文学、医学和编码等领域获得专业知识的范围,和它所能执行的各种任务。此外,该文件还探讨了如何定义AGI本身,构建缺失组件以实现AGI,并更好地理解最近LLMs所展示的智能起源。

论文指出,微软团队测试了语言理解方面的反馈。最终,GPT-4很好地完成了多个任务并超过ChatGPT水平。另外,微软团队还利用1994年国际共识智力定义执行多个实验测试,以观察GPT-4在推理、解决问题、抽象思考、理解和快速学习等方面能力,最终现实,GPT-4拥有对世界的常识并在这基础上做出推理的能力,甚至可以用ABC记谱法创作音乐,并按人类要求修改。

我们让ChatGPT总结了微软154页GPT-4研报,抽象思考能力优于数学运算|钛媒体焦点

 左侧是GPT-4扮演老师给两个作业打分,右侧是用GPT-4创作音乐(来源:论文)

不过在另一个实验中,简单数学运算问题方面,GPT-4却表现缺乏工作记忆和数学的能力。当数字在0-9之间均匀选取时,GPT-4准确率只有58%;范围在10-19、20-39时,GPT-4准确率下降到16%和12%;范围在99-199时准确率下降到0。

所以结果表明,微软认为,GPT-4是一种非常强大的人工智能系统,它在许多任务和领域中表现出了惊人的能力,并且在某些方面甚至可以与人类相媲美。然而,GPT-4仍然存在一些局限性和挑战,需要进一步研究和发展才能实现更深入、更全面的AGI系统。此外,该论文还探讨了GPT-4对社会的影响以及未来研究方向。

“GPT-4可被视作 AGI 的早期版本。”微软研究团队表示,GPT-4代表了迈向AGI的进展,但并不意味着它是完美的。“我们相信,GPT-4 AI 标志着计算机科学领域及其他领域真正的范式转变。”

事实上,不止是微软,OpenAI此前发布的一份官方研究估算,对于美国19%的岗位,至少50%的工作内容会被影响;对于80%的岗位,也至少有10%的工作内容被或多或少地波及;数学家、会计师和审计师、新闻分析师、法律秘书和行政助理、报税员等职业最容易受到GPT的影响。苏黎世大学的研究则认为,ChatGPT在文本标注任务中的表现超过亚马逊的众包工人,甚至ChatGPT标注成本每条不到0.003美元,是众包工人薪资的二十分之一。

高盛3月27日发布报告指出,全球预计将有3亿个工作岗位最终被 AI 取代。假设生成式 AI 实现了各企业承诺的能力,劳动力市场将面临挑战,AI 可以接手美国和欧洲高达四分之一的工作。报告预计,随着劳动生产力提高,AI 应用有望使全球在下一个10年内,推动全球GDP(国内生产总值)年复合增长率将达到7%。

“最近出现的生成式 AI 将降低劳动力成本和提高生产率。尽管 AI 的潜力存在很大的不确定性,但它可以生成与人类创造成果无法区分的内容,并能打破人机沟通障碍,反映出具有潜在巨大宏观经济影响的重大进步。AI 不仅节省劳动力成本,还能创造新的就业机会以及提高在岗工人的生产率。AI 的革命性就像早期通用技术(如发电机和个人计算机)一样能为社会带来繁荣。”高盛研报称,美国六成 AI 从业者中7%的工作,有一半以上的流程可以由 AI 自动化完成,或将给经济和人才发展带来重要影响。

3月27日公布的麻省理工学院研究科学家Lex Fridman节目中,OpenAI公司CEO奥特曼(Sam Altman)提到,强大的 AI 杀死人类有一定可能性。很多关于 AI 安全和挑战的预测被证明是错误的,我们必须正视这一点,并尽早尝试找到解决问题的方法。”

百度创始人、CEO李彦宏预测,十年以后,全世界有50%工作会是提示词工程岗位,不会写提示词(prompt)的人会被淘汰。

但是,ChatGPT引发的风险挑战不可忽视。早在3月20日,有海外用户发现ChatGPT聊天历史栏出现了不是自己的聊天记录标题,OpenAI方面证实了这一消息。而且,ChatGPT 在隐私安全、知识版权方面存在多个漏洞问题。

奥特曼在推特上致歉:“由于开源库中的错误,我们在ChatGPT中遇到了一个重大问题,现在已经发布了修复程序,我们刚刚完成验证。一小部分用户能够看到其他用户对话历史的标题。我们对此感到很抱歉。”

我们让ChatGPT总结了微软154页GPT-4研报,抽象思考能力优于数学运算|钛媒体焦点

最近的一份报告中,数据安全服务Cyberhaven检测到并阻止了其客户公司160万名员工中4.2%的人将数据输入 ChatGPT 的请求,因为存在泄露机密信息、客户数据、源代码或监管信息的风险。目前,摩根大通已经限制员工使用 ChatGPT,亚马逊、微软和沃尔玛也已向员工发出警告,要求员工谨慎使用生成式 AI 服务。(本文首发钛媒体App,作者|林志佳)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 3 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...