Meta联手微软挑战大模型格局,最新Llama 2免费开源,可直接商用|钛媒体焦点

1,240次阅读
没有评论

Meta联手微软挑战大模型格局,最新Llama 2免费开源,可直接商用|钛媒体焦点

(图片来源:Meta官网)

一夜之间,人工智能AI)大模型格局再次发生巨变。

钛媒体App获悉,北京时间7月19日凌晨,市值近8000亿美元的科技巨头Meta(原Facebook,NASDAQ: META)发布最新AI 大语言模型Llama 2系列,包含70亿、130亿和700亿三种参数版本,模型信息和起始代码全部开源,并支持免费可商用,还包含针对会话聊天场景微调的Llama 2-CHAT模型版本。

相较于今年2月发布的Llama 1,最新Llama 2训练所用的token翻了一倍至2万亿。Meta表示,在包括推理、编码、精通性和知识测试等多个外部基准评分测评中,Llama 2表现优于所有开源的Chat模型。

同时,Meta今晨还宣布与微软、高通公司展开合作,Llama 2将部署在微软云服务Azure上,同时Llama 2将能在高通芯片上运行,打破市场上英伟达、AMD处理器对 AI 算力市场的垄断。

“微软是我们Llama 2的首选合作伙伴,并扩大我们在生成式人工智能(AIGC)方面的努力。”Meta认为,开放的方法对于当今 AI 模型开发是正确的,特别是那些在技术快速发展的大模型。公司还在论文中称,根据Meta对有用性和安全性的人工评估,Llama 2可能是封闭模型的合适替代产品
Meta联手微软挑战大模型格局,最新Llama 2免费开源,可直接商用|钛媒体焦点

微软CEO纳德拉(Satya Nadella)和Meta CEO扎克伯格(来源:扎克伯格ins)

2018年图灵奖得主、Meta首席 AI 科学家杨立昆(Yann LeCun)则发布推文直言,“这将会改变大型语言模型(LLM)市场的格局。”

Meta挑战OpenAI:Chat性能更强、更安全,整体接近GPT-3.5

十多年来,Meta不仅玩“元宇宙”,而且一直有一个 AI 技术研究的布局,尤其它的instagram、Facebook等社交产品急需算法带来广告支持。

今年2月,Meta发布了AI大模型Llama 1。公司称,研究人员对Llama 1的巨大需求震惊了,有超过10万条访问请求,而且更多开发者通过在Llama上面构建模型应用,并取得的惊人成就。不过,Llama因为开源协议问题,一直不可免费商用。

时隔五个月后,当地时间7月18日,Meta发布开源大模型Llama 2,不仅可免费商用,而且公布了一份论文式技术报告,全面展示了Llama 2的技术能力和评测信息。

(注:论文地址:https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/ ;项目地址:https://github.com/facebookresearch/llama)

据悉,Llama 2是Llama 1的更新版本。相比于Llama 1,Llama 2 的预训练模型是在2万亿token(文本数据单位)上训练的,比Llama 1数据大小多了40%(增加1.4倍),上下文长度也翻倍,并采用了分组查询注意力(GQA)机制,而精调Chat模型是在 100 万人类标记数据上训练的。

在技术上,新的Llama 2使用了优化的自回归Transformer框架,当然也支持PyTorch,执行了更稳健的数据清理,更新了混合数据。

目前,Llama 2的系列模型有 7B、13B 和 70B 三种。而且Meta AI表示他们还在训练34B的版本,但暂时不会对外发布。而Meta的精调版大模型LLAMA 2-chat,是基于LLAMA 2针对对话场景微调的版本,同样支持7B、13B 和70B参数三个版本,使用RLHF、监督微调 (SFT)等技术对模型进行迭代优化。

Meta联手微软挑战大模型格局,最新Llama 2免费开源,可直接商用|钛媒体焦点

根据Meta展示的多个评测信息,截至目前,Llama 2 70B的性能表现更加接近 GPT-3.5,与谷歌 PaLM (540B) 持平或表现更好,但Meta也承认Llama 2距离 GPT-4 和谷歌PaLM-2-L等领先非开源模型的性能仍存在较大差距。

Meta联手微软挑战大模型格局,最新Llama 2免费开源,可直接商用|钛媒体焦点

Alpaca 研究团队的斯坦福基础模型研究中心主任 Percy Liang表示,“但对于很多场景,你并不需要GPT-4。”

此外,论文还提及了Llama 2在安全性上的努力。其中Meta 在安全微调中使用了监督安全微调、安全RLHF、安全上下文蒸馏等技术,而且使用三个常用基准评估了Llama 2的安全性,整体良好,比其他大型语言模型更加稳定、更佳安全。

微软“脚踩两只船”:不仅联姻Meta,而且对GPT版office涨价

引领这一轮AI浪潮的微软,在今天全球合作伙伴大会(Inspire 2023)上终于亮出新战略。

当地时间7月18日,Meta和微软联合宣布,自今天开始,Meta公司的Llama 2将在微软的Azure和Windows平台上线。

微软CEO纳德拉表示,Llama 2可以让Microsoft Azure的开发人员能够使用它进行构建,并利用他们的云原生工具进行内容过滤和安全功能。它还经过优化,可以在Windows上本地运行,为开发人员提供无缝的工作流程。

Meta公司表示,Llama 2将在微软的Azure云上线,后续将在亚马逊AWS和Hugging Face等其他平台上分发,向全球开发者首发基于Llama 2模型的云服务。
Meta联手微软挑战大模型格局,最新Llama 2免费开源,可直接商用|钛媒体焦点

微软CEO纳德拉(Satya Nadella)

所以,目前在微软的开发平台上拥有两个大模型选项:不仅拥有OpenAI的GPT系列大模型,而且还有Meta的Llama 2大模型。

同时,微软周二还宣布,面向Office 365 E3、E5、商业标准版和商业进阶版的订阅商户,微软Microsoft 365 Copilot将统一定价为每个用户每月30美元。根据官网定价,这些面向企业用户的订阅服务,收费标准从每个用户12.5美元至38美元/月不等,这意味着微软把商业用户Office服务的定价提升了1-3倍。

微软企业副总裁兼消费领域首席营销官Yusuf Mehdi表示,在过去几个月里,全球已经有600家公司已经参与了该产品的抢先体验计划,其中就有毕马威、阿联酋国家发展银行等知名机构。他强调,使用Copilot的客户越多,他们对Copilot的热情就越高。很快,没人会愿意在没有它的情况下工作了。

这足以显现微软与OpenAI实现Office AI产品,对于市场的定价权和吸引力。

微软曾透露,截至2023年第一季度,全球总共有3.82亿人正在使用商业版本的Microsoft(Office)365软件

不过,微软今天并没有公布该产品正式上线的日期。除微软,谷歌也曾在今年早些时候宣布将把AI功能集成到云办公套件Google Workspace里。包括Zoom等细分行业的互联网软件服务商也在抓紧上架AI功能。

值得注意的是,芯片巨头高通今晨联合宣布,计划从2024年起,在旗舰智能手机和PC上支持基于Meta Llama 2的AI部署,赋能开发者使用骁龙平台的AI能力,推出全新生成式AI应用。
Meta联手微软挑战大模型格局,最新Llama 2免费开源,可直接商用|钛媒体焦点

微软股价日线图(来源:TradingView)

受新消息影响,截至美股周二,微软股价收涨3.98%,创出历史新高。2023年至今,微软累计涨幅达50.05%。

(本文首发钛媒体App,作者|林志佳)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 7 月
 12
3456789
10111213141516
17181920212223
24252627282930
31  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...