用对比解码改善大语言模型推理

1,447次阅读
没有评论

Contrastive Decoding Improves Reasoning in Large Language Models

S O’Brien, M Lewis
[Meta AI & University of California, San Diego]

用对比解码改善大语言模型推理

要点:

  • 对比解码(CD)是一个简单、计算量小、无需训练的文本生成方法,通过最大化强大的”专家”模型和弱小的”业余”模型的可能性差异来搜索字符串。
  • 展示了CD大大提高了大规模语言模型在数学文字题和常识推理等任务上的推理能力,超过了贪心解码和nucleus sampling。
  • 在GSM8K数学推理基准测试上,CD提高了LLaMA模型的准确率高达8个百分点,超过了更昂贵的自洽技术
  • 在HellaSwag常识推理基准测试上,CD帮助LLaMA-65B超过了GPT-3.5和PaLM-2等最先进的模型。
  • 分析表明CD通过避免短小、通用的响应以及过多地从提示中复制内容来预防一些推理错误,更多地改善了逻辑推理而不是基础算术技能。
  • CD提供了一种统一的方法来提高长文本和推理任务上的生成质量,尽管仍需进一步调整以达到最佳性能。
  • 与其他方法相比,CD增加的计算量很小,因此效率高且可扩展。

动机:探索使用对比解码方法来提高大型语言模型在推理任务中的性能。 方法:使用对比解码方法来生成文本,通过最大化强模型和弱模型之间的似然差异来寻找最佳字符串。该方法避免了模型分布中不理想的模式,如短字符串和通用字符串。 优势:对比解码在各种推理任务上相对贪婪解码取得了显著的改进效果,包括在常识推理基准测试和数学推理基准测试上超过了其他模型。该方法还能减少抽象推理错误和输入中的复制操作,提高了文本生成的准确性和推理任务的性能。

一句话总结:
展示了通过对比解码方法在推理任务中相对于贪婪解码取得显著改进的效果,减少了抽象推理错误和复制操作,为生成文本和推理任务提供了一种强大的通用方法。

https://arxiv.org/abs/2309.09117 

用对比解码改善大语言模型推理
用对比解码改善大语言模型推理
用对比解码改善大语言模型推理

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 9 月
 123
45678910
11121314151617
18192021222324
252627282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...