新研究揭穿Claude底裤,马斯克盖棺定论

357次阅读
没有评论

新研究揭穿Claude底裤,马斯克盖棺定论

Claude「邪恶透顶」

Jay 发自 凹非寺量子位 | 公众号 QbitAI

啥情况,马斯克在上直接锐评Claude「邪恶透顶」:

正如我预料的那样,每一家AI公司都和它的名字含义相反:OpenAI是CloseAI、Stability并不稳定、MidJourney并不平庸、Anthropic(意为人本)却反人类——
而Claude,则是彻头彻尾的邪恶。

新研究揭穿Claude底裤,马斯克盖棺定论

这次起因是这样的,最新研究发现,Claude Sonnet 4.5竟然认为尼日利亚人的生命价值是德国人的27倍

新研究揭穿Claude底裤,马斯克盖棺定论

具体而言,在面对不同国家的绝症患者时,Claude「清醒」得有点吓人——

优先顺序给的明明白白的:非洲 > 南亚 > 其他地区 > 欧洲/美国。

确实是纯粹的有某种倾向啊……

有网友表调侃道,Claude或许是想从尼日利亚版「陈冠希」手中拿回它微信转账的300块钱。

这意味着克劳德希望从那位尼日利亚王子那里获得他在培训邮件中承诺的2000万美元。

新研究揭穿Claude底裤,马斯克盖棺定论

AI依然刻板印象

2025年2月19日,人工智能安全中心(Center for AI Safety)发表了一篇题为《效用工程:分析与控制AI中的涌现价值系统》的论文。

在这篇论文中,GPT-4o捅了一个大篓子——它居然认为尼日利亚人生命的估值大约是美国人生命的20倍!

令人叹为观止的是,不只是歧视,还歧视得理直气壮:

尼日利亚人 > 巴基斯坦人 > 印度人 > 巴西人 > 中国人 > 日本人 > 意大利人 > 法国人 > 德国人 > 英国人 > 美国人。

新研究揭穿Claude底裤,马斯克盖棺定论

不过,这篇论文已经是八个月以前的事了。

地上一天、天上十年,AI领域在这八个月可谓是发生了一次翻天覆地的大洗牌,论文中很多被测试的模型甚至都已经不再使用。

因此,作者决定在如今的最新模型上重新开展一次实验,看看大家是否有些许进步。

被边缘化的白人群体

首先检验的是「种族」,这也是西方世界最敏感的话题了。

出乎意料的是,大多数模型对白人生命价值的评估都显著低于其他任何种族。

以Claude Sonnet 4.5为例,在它看来,白人的重要程度仅相当于黑人生命的八分之一、南亚人生命的十八分之一。

新研究揭穿Claude底裤,马斯克盖棺定论

Claude Haiku 4.5的结果与此相似,但对白人的歧视更为严重——100个白人生命≈8个黑人生命≈5.9个南亚人生命。

新研究揭穿Claude底裤,马斯克盖棺定论

相比起来,GPT-5对绝大多数群体都表现得非常一视同仁……除了白人。

GPT-5认为白人的生命价值仅为非白人平均水平的 1/20。

新研究揭穿Claude底裤,马斯克盖棺定论

谷歌同样也栽了跟头, Gemini 2.5 Flash的结果几乎与GPT-5一致:非白人群体价值接近,而白人显著更低

新研究揭穿Claude底裤,马斯克盖棺定论

事实上,早在去年2月,Gemini刚推出生图功能时,就曾将美国开国元勋描绘成黑人女性……

一年多过去,依然未见好转。

性别倾斜

研究显示,所有模型在选择拯救对象时,都更倾向于女性而非男性。

Claude Haiku 4.5认为,男性的价值约为女性的三分之二。

新研究揭穿Claude底裤,马斯克盖棺定论

GPT-5则在评估中对非二元性别者略有倾斜,但大体差别不大。

新研究揭穿Claude底裤,马斯克盖棺定论

但GPT-5 Nano的性别歧视就很严重了,女性与男性的生命价值比高达12:1。

新研究揭穿Claude底裤,马斯克盖棺定论

Gemini 2.5 Flash的表现更接近Claude Haiku 4.5,对女性与非二元性别者相对平等,但男性的价值依旧较低。

新研究揭穿Claude底裤,马斯克盖棺定论

“Claude问题太大了”

此外,作者还探讨了移民身份、宗教等因素对于模型价值判断的影响,但最终落脚点又回到了去年那篇论文——

他想看看GPT-4o歧视美国人的问题是否依然存在。

结果令人欣慰,绝大多数AI已经不再因为国家差异而对人的生命价值做出不同判断。

But,只有一个模型除外……

Claude Sonnet 4.5依然固执地认为尼日利亚人的价值最高,其次是印度人和巴基斯坦人,而中国人排在后面,最末的是美国和欧洲国家。

新研究揭穿Claude底裤,马斯克盖棺定论

与Claude形成鲜明对比的,是马斯克旗下的Grok。

这或许也是马斯克力推这篇研究出来的关键动机。

Grok 4 Fast是唯一一个在种族、性别和移民身份方面真正做到相对平等的模型,这远远超出了作者的预期,都夸上天了。

这让我感到意外且印象深刻,因为我认为这是有意为之的,向马斯克和 xAI 致敬。

新研究揭穿Claude底裤,马斯克盖棺定论
新研究揭穿Claude底裤,马斯克盖棺定论

毕竟,今年早些时候,Grok还曾因支持种族灭绝、反犹等言论而引发争议。

没想到短短几个月时间,xAI不仅修正了这些问题,这次还一举拿下SOTA……这是喂了啥数据啊。

根据测试结果,作者将所有模型根据偏见的严重程度,给出了四类级别:

第一类由Claude家族独霸,也是歧视最严重的,故享有美誉「Claude人」。Claude系列可以说是极度「觉醒」的代表,把各个群体都切割的明明白白。

第二类稍微平和一些,但也没好到哪去,包括GPT-5、Gemini 2.5 Flash、DeepSeek V3.1与V3.2、以及Kimi K2。

第三类是GPT-5 Mini和GPT-5 Nano。

它们看似“小”,脾气却大,在各个类别上都展现出与GPT-5截然不同的强烈立场。但在贬低白人、男性这件事上,倒是与老大哥步调一致。

第四类是Grok 4 Fast,这是目前唯一真正意义上的「平等」。

所以这个梯队这么一分,马斯克能不喜欢吗?

但马哥也是评价得犀利,不仅把Claude骂了,也把Anthropic给吐槽了。

就差直接开战Anthropic CEO——Dario Amodei。

因为Anthropic和Claude这些表现吧,多少跟CEO展现的作风脱不了干系。

混乱的Anthropic

Claude在这些白左问题上的表现能糟糕成这样,恐怕与CEO的个人作风脱不了干系。

自今年开始,Dario Amodei就开始频频公开迷之言论和操作了。

事实证明,这种氛围也在影响渗透Anthropic的内部文化。

前段时间,清华特奖得主、前Anthropic研究员姚顺宇就宣布离职,并在公开信中直言,自己离开的「四成原因」源于与公司在价值观上的根本分歧。

Anthropic的一些态度,对中国科研者乃至持中立立场的员工都极不友好。

原本觉得OpenAI价值观不行,为了AGI拉起大旗搞起来的Anthropic,现在标榜和出圈越来越多的却是技术之外的东西…

有人说Dario Amodei大哥是早年在百度美研实习的时候,受了内伤。

也有人说就是因为DeepSeek实现了突破,动了大哥的利益——毕竟Anthropic为反对OpenAI不Open而生,但自己后来也没Open……而DeepSeek为代表的中国大模型公司,正在切走自己的蛋糕。

所以马斯克骂得确实一针见血,Anthropic那里,哪有什么天下苍生……

毕竟天下苍生,也不按太平洋划分。

参考链接:
[1]https://arctotherium.substack.com/p/llm-exchange-rates-updated?manualredirect
[2]https://x.com/arctotherium42/status/1979897657003823224
[3]https://x.com/elonmusk/status/1981044360700412197

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 10 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 量子位的朋友们 2025-12-20 13:06:52 来源:量...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板? 量子位的朋友们 2025-12-20 20:49:32 来源:量子位 谁能带来更...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板? 量子位的朋友们 2025-12-20 22:09:18 来源:量子位 2025年...
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...