Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

601次阅读
没有评论

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

鹭羽 发自 凹非寺

量子位 | 公众号 QbitAI

全网刷屏的Claude系统提示词,结果被卡帕西大神当场抓虫?!

事情是这样的。

一夜之间,近1.7万字系统提示词——包含24000个token,详细定义了模型行为、工具使用和引用格式…..全部细节直接在GitHub上被泄露了!

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

这事儿一出,网友蜂拥而至速速围观,甚至亲切地称呼这次意外泄漏事件是提示技术的金矿

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

就在此时,大神卡帕西发现了华点:LLM学习缺少主要范式?

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

随即他提出系统提示学习新范式——模拟人类经验积累过程,将系统提示嵌入权重。

简单总结一下,就是模拟人类学习,为LLM提供备忘录功能,让LLM拥有自主反思用户问题的“记忆”功能,记录通用的问题解决知识和策略。

新范式一石激起千层浪,有人表示赞同,也有人开始着手分析新范式帮助LLM畅玩Minecraft的可行性:

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

当然也有人持反对意见,认为允许模型自己编写提示会使模型更加混乱,也无法保证模型不会错误地理解提示。

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

具体是怎么一回事呢?别急,接下来让我们一起来回顾整个事件。

Claude系统提示词曝光

据揭露,完整的Claude系统提示词包含16739个字,也就是110kb。相比之下,ChatGPT中的OpenAI的o4-mini的系统提示仅有2218个字,约为Claude的13%

具体内容也相当有趣,不仅详细阐述了Claude基本的行为风格和偏好,还包含了大量全局的问题解决策略,例如下面这个解决经典LLM问题“草莓单词里有几个‘r’字母”:

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

系统提示告诉LLM如何回复用户提示,类似于LLM的“设置”选项,定义用哪种语气回应,以及补充训练数据中所没有的上下文信息。

以下是Claude的提示组件构成:

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

其中最大的组件是工具定义 (Tool Definitions),由MCP服务器进行信息填充。与标准的API不同,MCP向LLM提供关于指令的详细说明教程。

此外,其余提示(如引用规范、搜索指南和谷歌集成注意事项)近80%的内容都与工具有关,都详细说明了在与用户的交互场景中Claude是如何作用的。

在提示词文档的最后还包含一些热修复,指出了常见的LLM陷阱,例如关于川普的总统就职信息:

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

根据该提示,Claude的可靠知识截止于2024年10月,此后发生的事件或新闻都以人为热修复或使用网络搜索工具来补充。

利用系统提示学习构建新范式

在读完Claude系统提示词文档后,Karpathy火速发表了一篇小作文——LLM学习缺乏主要范式,并称之为系统提示学习

传统学习范式基于强化学习、监督学习等预设框架被动优化,问题的解决只依赖于强化学习嵌入权重,实际并不理解用户输入。

新范式与强化学习类似,但采用直接编辑提示而非梯度下降的学习算法。

其强调构建系统提示符供自身使用,让预处理获取知识、微调(SL/RL)塑造行为习惯、系统提示学习制定策略,使LLM可以根据实时反馈和情景需求调整和完善响应策略。

举个栗子,现在的LLM就像电影《记忆碎片》的主人公,只有短期的碎片记忆,无法形成新的长期记忆。

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

而新范式仿照正常人类学习过程,即当你遇到一些问题并尝试解决后,你也许会用专属于你的“系统提示”记住解决策略,在下一次遇到同类问题时,你就会自然而然想到:也许你可以泛化使用上次那种解决方案。

通过经验->明确的策略->习惯性权重的流程,LLM可以像人类一样记笔记,将知识转化为直觉,达成实践学习、逻辑推理的范式转变。

利用系统提示学习可以有效实现测试时间训练,同时始终可以被人类审查,并且保证更少的安全隐患。

系统提示学习在未来还标志着自主AI系统正在发展自身的计算意识,将超越传统学习范式的边界,为真正的自我迭代乃至于AGI提供了可能。

当然,Karpathy也明确指出新范式的实现还有更多有待解决的细节,例如编辑系统的运行问题、知识如何从显性系统文本转变为习惯性权重等。

对此,广大网友展开了激烈的讨论。

例如有网友提出可以补充一个记忆层以实现系统提示学习。

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

也有网友直接抛出了自己在记忆文档方面的研究结果:

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

也有人质疑LLM缺乏持续学习的本质,让它无法从自身思维中学习,系统提示学习并不能从根本上解决,还需要寻找更为有效的思维模式。

Claude1.7万系统提示词全网刷屏!Karpathy锐评:LLM缺乏关键范式

那么你的看法是什么呢?欢迎在评论区留言讨论~

系统提示词链接:

https://raw.githubusercontent.com/asgeirtj/system_prompts_leaks/refs/heads/main/claude.txt

参考链接:
[1]https://news.ycombinator.com/item?id=43909409
[2]https://x.com/karpathy/status/1921368644069765486
[3]https://x.com/bindureddy/status/1921646319002911130
[4]https://www.dbreunig.com/2025/05/07/claude-s-system-prompt-chatbots-are-more-than-just-models.html

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 5 月
 1234
567891011
12131415161718
19202122232425
262728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...