Stanford Alpaca —— 指令调优的 LLaMA 模型

778次阅读
没有评论

Stanford Alpaca(斯坦福 Alpaca)是一个指令调优的 LLaMA 模型,从 Meta 的大语言模型 LLaMA 7B 微调而来。

Stanford Alpaca 让 OpenAI 的 text-davinci-003 模型以 self-instruct 方式生成 52K 指令遵循(instruction-following)样本,以此作为 Alpaca 的训练数据。研究团队已将训练数据、生成训练数据的代码和超参数开源,后续还将发布模型权重和训练代码。

Stanford Alpaca —— 指令调优的 LLaMA 模型

GitHub 的仓库包含:

官方示例

Stanford Alpaca —— 指令调优的 LLaMA 模型

Stanford Alpaca —— 指令调优的 LLaMA 模型

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy