ChatGPT文风,原产地肯尼亚

184次阅读
没有评论

ChatGPT文风,原产地肯尼亚

因非洲人做RLHF,ChatGPT还爱用“delve”一词

ChatGPT文风奇怪的原因(俗称AI味儿很浓)找到了!

肯尼亚作家:都是跟我们学的。

ChatGPT文风,原产地肯尼亚

就在最近,一位肯尼亚作家的“控诉贴”登上Hacker News热榜——

我是肯尼亚人。不是我的写作风格和ChatGPT一样,而是ChatGPT写作风格和我一样。

ChatGPT文风,原产地肯尼亚

一点进去才知道,原来这位朋友连续精心撰写的好几篇文章都被退稿了,而且理由还都是“太像ChatGPT”。

ChatGPT文风,原产地肯尼亚

emmm……一想到自己从小接受的教育都是“文章必须像一座完美的大厦”、“你必须展现丰富的词汇量”,而现在却被误认为出自AI,这位朋友实在忍不住发出怒吼:

对于那些热衷于侦查数字虚假性的侦探们,我想说:朋友,欢迎来到肯尼亚教室、会议室或公司内部Teams聊天室里一个典型的星期二。你们所认为的机器指纹,实际上却是我们教育的化石记录

ChatGPT文风,原产地肯尼亚

而且很早就有消息指出,为了节省人力成本,很多AI模型厂商会把RLHF这类工作交给非洲人,所以模型的很多用语习惯也会偏向非洲那边。

所以我们有理由怀疑,难道ChatGPT真是从肯尼亚“偷师”写作技巧的?

咱这就火速围观一下——

“ChatGPT无意中在模仿我们”

事情是这样的。

来自肯尼亚的Marcus Olang’(以下简称小马)最近发文控诉,从年初收到第一条回复开始,他就陷入了需要“自证不是AI”的困境中。当时甲方给的回复是:

你写的挺好,逻辑也扎实,就是……能不能用更“像人”的方式重写一下?现在这个感觉,有点太像ChatGPT写的了。

而且不止是他,他身边的很多作家朋友也都收到了类似反馈。

而在仔细对比了自己和ChatGPT所写内容之后,小马最终无奈发现——别说,你还真别说,咱们的文风确实很像ChatGPT

从某种意义上说,指控者并非完全错误。我的写作风格确实与大语言模型的输出结果有几分相似。

我们都倾向于使用结构严谨、平衡的句子。我们都喜欢使用过渡词,以确保逻辑流畅。我们都会偶尔使用(如今看来似乎成了罪证)连字符、分号或破折号来连接相关的想法,使其比简单的句号更显优雅。

ChatGPT文风,原产地肯尼亚

不过在小马看来:

讽刺之处在于,这种讽刺或许会让我们的祖先会心一笑。

他表示,不是自己写得像ChatGPT,而是ChatGPT无意中在模仿他们——模仿他们这一代,以及过去几代在全球南方,尤其是在像肯尼亚这样的地方,经过严苛教育体系“锻造”出来的人。

从小到大,小马接受的写作指导都是讲求规范、讲求精心遣词造句(是谁DNA又动了?)。

我们从小被教导,文章必须像一座完美的大厦。引言是地基,主体是承重墙,结论是封顶,必须坚固、对称、无懈可击。我们要用“首先、其次、最后”来构建逻辑,要用“此外、然而、因此”来精确转折,要用“光辉灿烂”、“精疲力竭”这样的“好词”来展现词汇量。

这种写作,是我们的敲门砖,是我们在KCPE(小学毕业考试)决定命运的四十分钟里必须掌握的生存技能,是我们向上攀爬的阶梯。它严谨、清晰、富有说服力,但也因此,在今天某些人的耳朵里,它听起来“缺乏人性的温度”。

而这一套恰巧也被AI学去了。

讽刺来了,AI大模型(比如ChatGPT)正是从海量的书籍、论文、报告中学习写作的。而这些文本库中,充满了历史沉淀下来的、经典的、正式的书面语——也就是我们被训练去模仿的那种文体。所以,当AI为了显得“权威”和“可信”而输出时,它的文风自然就与我所受的教育产生了诡异的“孪生”效应。

所以,如今面对“文风像AI”的指责,小马愤而吐槽:

这台机器为了显得权威,最终听起来却像个英语作文得了“A”的肯尼亚小学毕业考试(KCPE)毕业生。它无意中复制了大英帝国的语言幽灵。

而且他还提到,现存的一些AI检测器往往更倾向于将流畅、逻辑严密、句式规整的文本标记为AI生成,而这恰恰是许多非英语母语者(尤其接受过严格正式写作训练的人)的写作特点,所以他们也更容易被误判。

总之,小马用自己的亲身经历告诉大家——

由于历史原因,一些非英语母语者的写作,本就是现有AI模型的“教材”,而现在他们却成了AI普及后的“受害者”

这一说法也纷纷获得了网友们的认同:

ChatGPT文风,原产地肯尼亚

不过,令人啼笑皆非的是,小马的这篇感情饱满、“活人感”很强的文章,竟然还是被Pangram网站判定为100%由AI生成。

ChatGPT文风,原产地肯尼亚

啊这……小马不语,小马只是一味生气吐血(doge)。

因非洲人做RLHF,ChatGPT还爱用“delve”一词

而基于类似理由,人们还发现,ChatGPT似乎对“delve”(挖掘、深入研究)这个词情有独钟。

《卫报》曾有一篇文章指出,Jeremy Nguyen这位来自墨尔本斯威本科技大学的AI专家发现——

在PubMed这类专业学术网站上,“delve”的出现频率在近几年激增了10到100倍

(PubMed主要收录了80余国5200+生物医学期刊,总量超3900万条文献。)

ChatGPT文风,原产地肯尼亚

这暗示了,有大量研究人员可能在用ChatGPT辅助写作,并将其偏好的词汇带入了正式学术文本。

这一现象还引来马斯克和YC联合创始人保罗·格雷厄姆的关注,后者发帖表示:

有人给我发了一封带“delve”一词的邮件,而这个词表明文本大概率是AI生成的(暗示对方用AI写项目书,还要找他投资hhh)。

ChatGPT文风,原产地肯尼亚

并且就在格雷厄姆发帖之后,ChatGPT官号还用这个词公开整活,继而引来无数网友跟风。

ChatGPT文风,原产地肯尼亚
ChatGPT文风,原产地肯尼亚
ChatGPT文风,原产地肯尼亚

不过,进一步的数据分析显示,“delve”远非孤例——

像“explore”、“tapestry”、“testament”和“leverage”等词汇,在ChatGPT生成的文本中出现频率也异常地高。

《卫报》在文章中详细揭开了这背后的谜底——

为了将大语言模型“驯化”成安全、有用、可控的聊天机器人,企业一般会雇佣大量人类测试员,让他们与模型互动并提供反馈(如点赞/点踩,或撰写理想的回复)。

模型从这些海量的人类偏好数据中学习,从而调整自己的行为,也即所谓的RLHF(基于人类反馈的强化学习)。

而出于人力成本考量,RLHF这项劳动密集型工作被大量外包给了肯尼亚、尼日利亚等英语区的非洲国家。

对这些国家来说,“delve”这样的词正是他们日常生活中自然、规范的商务或学术英语,因此被高频使用。

所以这些词也就自然在ChatGPT中高频出现了。

BTW,你还有哪些小技巧来鉴别某项内容是出自AI之手吗?

有网友先给大家打个样了:

ChatGPT文风,原产地肯尼亚

“幼兽般的呜咽”、“瞳孔缩成针尖”……嗯,一般人属实想不到了(doge)。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 12 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二! 西风 2026-01-08 19:02:20 来源:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书

首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书

首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书 Jay 2026-01-07 15:24:04...
悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少 闻乐 2026-01-05 19:...
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛 闻乐 2026-01-06 09:09:0...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...