Databricks 开源 LLM,训练只需三个小时、30 美元

953次阅读
没有评论

大数据分析公司 Databricks Inc 近日也加入了生成式 AI 领域的竞争之中,发布了一个名为 Dolly开源大型语言模型,将模型命名为 Dolly 是为了向第一只克隆羊多莉致敬。

Databricks 开源 LLM,训练只需三个小时、30 美元

ChatGPT 和 Bard 这样的生成式 AI,它们使用的数据通常来自于在成千上万不同网站,使用的数据量十分惊人,而且想要使用这些数据训练 AI 还需要数以千计的强大 GPU 在背后提供支持。

Databricks 希望通过开源 Dolly 及其训练数据,让任何人都能开发出一个真正像人类的 AI,而无需投资数百万美元,也让这类 AI 不再是只有大型科技公司才能负担得起的东西,数以百万计的小公司也将能够从中受益。

除此之外,让各个小公司构建自己的模型,而不将数据通过 API 发送给专有模型背后的服务提供商,也可以保护小公司的敏感数据和专有的知识产权。此外,一些公司可能在模型质量、成本和期望行为方面有不同的权衡,这些公司也可以根据需求调整模型。

Databricks 首席执行官 Ali Ghodsi 表示,Dolly 只需要非常少的数据和非常短的时间就能完成训练。

只需 30 美元、一台服务器和三个小时,我们就能教 Dolly 开始进行人类级别的交互。

Databricks 没有从头开始创建自己的模型,而是基于 EleutherAI 在 2021 年开源的自然语言处理模型 —— GPT-J。GPT-J 是一个基于 GPT-3,由 60 亿个参数组成的自然语言处理 AI 模型。该模型在一个 800GB 的开源文本数据集上进行训练,并且能够与类似规模的 GPT-3 模型相媲美。

Databricks 说,尽管模型小得多,只有 60 亿个参数,以及较小的数据集和训练时间(ChatGPT 的参数是 1750 亿个),但 Dolly 仍然表现出了 ChatGPT 所展示的同样的 “神奇的人类互动能力”。

Databricks 目前已经在 GitHub 上开源了一个简单的 Databricks notebook,开发者可以使用它在 Databricks 上自己构建 Dolly。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy