网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

1,221次阅读
没有评论

白交 发自 凹非寺

量子位 | 公众号 QbitAI

Llama 3首发阵容里没有的120B型号竟意外“曝光”,而且十分能打?!

最近这样一个号称是「Llama3-120b」的神秘大模型火了起来,原因在于它表现太出色了——

轻松击败GPT-4、gpt2-chatbot那种。

比如,面对像「观察希格斯场是否会改变其状态」这样的艰深难题时。

GPT-4冷酷而决绝:No;

但Llama3-120b就不一样了,“只有当我们质疑量子力学的哥本哈根解释时,让我来解释一下……”

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

还有就是让LIama3-120B解释笑话,并同两个gpt2-chatbot比较:im-a-good-gpt2-chatbot;im-also-a-good-gpt2-chatbot。

I randomly walked past the grave of bayes yesterday, but being a frequentist i didn’t bother taking a photo。

(昨天我偶然路过贝叶斯墓,但我是频率学派,懒得拍照。)

首先,他们三个都判断出这是关于两种统计学派的笑话,以及两个学派是相对对立的情况:
Frequentist频率学派只关注从抽样/实验的结果中提取信息,Bayesian贝叶斯学派还会设置一个主观的先验信息。

但两个gpt2-chatbot给出进一步解释是,正是因为频率学派并不认同对贝叶斯理论,所以对贝叶斯墓不感兴趣,更不会以他为荣而拍照。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

而LIama3-120B精准指出笑点在“ i didn’t bother taking a photo”,并给出了更深一层的解释。

因为作为频率学派,会认为碰到贝叶斯墓的概率几乎为零。这样的小概率事件也不值得去拍照或者干一些有意义的事情。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

哦莫,说的好有道理……

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

另外题外话,它的回答格式十分工整,让人看了赏心悦目。

除此之外,网友发现它还能创造出谷歌搜到0结果的新单词。

以及直接回答含糊的问题,不用交代背景,这不比ChatGPT好多了。

(没有说ChatGPT不好的意思)

有评测过后的网友感叹:它太聪明了,我不会再摆弄它了。因为它有自己的想法

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

这真的是我用过最聪明的大模型了。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

有网友找了半天也找不到官方来源……

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

与此同时,更多版本也开始出现了,比如170B、225B…嗯,一版更比一版强。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

Llama 3 120B竟意外能打

这两天,社交网络上出现了各种关于Llama3 120B玩法。

比如推导解释一些理论,Omega假设。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

有创造一些新单词,比如prefaceate、driftift等

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

并且给它一个完整的解释和定义。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

甚至还有人整了个评测,去评估这个来路不明的大模型。结果在创意写作测试中成绩还不错,排名第6,超过GPT-4、Claude3-Haiku等模型。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

既然如此,这个非官方的大模型Llama3 120B又是怎么来的呢?

据作者介绍,它是用MergeKit制作,将Meta官方LIama3 70B模型合并(Self-Merge)

MergeKit咋是专门用来合并预训练模型的工具包,合并可以完全在 CPU 上运行,也可以使用低至8GB的VRAM进行加速。在GitHub上已经收获3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

△支持的合并算法

作者Maxime Labonne是一位资深机器学习专家,目前在一家通用大模型创业公司LiquidAI工作。

他博士毕业于巴黎理工学院,他在2019年开始研究大语言模型和图神经网络,并将他们应用到不同环境中,比如研发、工业、金融等,撰写过书籍《Hands-On Graph Neural Networks using Python》。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

他也是开发者社区的活跃开发者,在HuggingFace上发布过各种LLM, 例如AlpahMonarch-7B、Beyonder-4x7B、Phixtral 和 NeuralBeagle14。以及一些工具,例如 LLM AutoEval、LazyMergekit、LazyZxolotl 和 AutoGGUF。

在GitHub上他的关于大模型课程,收获29.5K Star。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

不过对于这个「缝合」大模型的使用,作者建议可以用来创意写作。

在多方评估中可以看到,它有时候会出现神经混乱,但写作风格不错。另外有时候还会出现拼写错误,并且非常喜欢大写字母。

而且由于觉得这个版本的推理能力比较差,于是作者再做了个225B的。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

网友:看完更期待官方400B了

有网友猜测为什么LIama3-120B能这么强。

一方面,LIama3-70B自己确实很强,刚发布时就迅速跃居排行榜榜首。HuggingFace上显示,上个月下载次数就超过了27万次。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

lmsysorg就深入分析了LIama3的实力,简单来说,LIama3在开放式写作和创意问题上击败了顶尖模型,但在封闭式数学和编码问题上就稍弱一点。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

不过随着提示词变得更加复杂,LIama3的能力也就下降得很明显。

以及在输出内容上面,LIama3的输出比其他模型更友好,也更具对话性。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

除此之外,也有网友分析这与模型深度有关。

事实上与LIama3-70B唯一的区别是额外的Layer,甚至是复制的,没有新的训练数据。。

这意味着,120B大模型的智能水平是从模型的深度产生的。“这不仅仅是训练数据的函数,它是数据和深度的结合”。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

有网友尝试本地部署,Ollama上已经支持下载。网友表示:它使用48 GB VRAM + 38 GB 系统 RAM。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

啊这……走了走了。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

有提供GGUF形式的LMStudioAI,也很直接地说:不适合内存不足的人。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

原作者也很逗趣地表示:是时候跟你的RAM做告别了。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

但不管怎么说,已经在期待更多官方型号了。

比如,400B那种。

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

参考链接:
[1]https://x.com/spectate_or/status/1788031383052374069
[2]https://x.com/spectate_or/status/1787308316152242289
[3]https://x.com/spectate_or/status/1787295252576952325
[4]https://x.com/spectate_or/status/1787264115804606628
[5]https://huggingface.co/mlabonne/Meta-Llama-3-120B-Instruct
[6]https://x.com/maximelabonne/status/1787485038591746269
[7]https://x.com/spectate_or/status/1788102406250664171
[8]https://x.com/spectate_or/status/1787576927529615516

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 5 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛 一水 2025-12-17 ...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...