面向大型语言模型的提升提示集成

690次阅读
没有评论

Boosted Prompt Ensembles for Large Language Models

Silviu Pitis, Michael R. Zhang, Andrew Wang, Jimmy Ba
[University of Toronto]

面向大型语言模型的提升提示集成

提出一种用于大型语言模型的提升提示集成方法,通过少样本构建一组提升提示集合,以进一步提高性能。

要点:

  • 动机:之前的一些技术已经在推动语言模型推理性能的发展,但是研究者们仍然需要进一步提高模型性能。因此,本文提出了一种新的算法来提高大型语言模型的性能。
  • 方法:提出一种”提升提示集成”方法来提高大型语言模型的性能。该算法使用一个小数据集构建一个少样本提示集合,然后通过分步选择“困难样本”的方式来增强这个集合,形成一个”提升提示集成”。
  • 优势:所提出的方法在AQuA、GSM8k等数据集上展现了优越的性能,胜过了其他的集成算法,如单个提示的输出空间集成和提示袋空间集成。而且,本文提供了不同标注设置和设计选择的详细实证研究。
  • 结论:所提出的少样本提升提示集成,可有效提高大型语言模型的性能。本文的方法在 AQuA、GSM8k 等数据集上优于其他的集成算法,同时提供了详细的实证研究结果。

https://arxiv.org/abs/2304.05970 

面向大型语言模型的提升提示集成
面向大型语言模型的提升提示集成

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy