From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting
G Adams, A Fabbri, F Ladhak, E Lehman, N Elhadad
[Columbia University & Salesforce AI & MIT]
从稀疏到稠密:基于链式增密提示的GPT-4摘要
https://arxiv.org/abs/2309.04269
-
提出链式增密(CoD)提示的方法,在控制长度的前提下生成 increasingly dense 的GPT-4摘要。
-
CoD首先生成一个关注1-3个实体的初始稀疏摘要,然后逐步添加1-3个缺失的文章关键实体而不增加长度。
-
这迫使模型通过抽象、压缩和融合来使摘要更加密集以容纳新的实体。
-
在CNN/Dailymail文章上的人工评估发现,第2或第3步CoD生成的摘要效果最好,密度适中且连贯性好。
-
与普通GPT-4摘要相比,CoD摘要表现出更强的抽象性、融合性和较少的前导偏差。
-
使用GPT-4进行的自动评估与人工判断一致,在第4步达到信息量峰值后开始下降。
-
密集性为了提高信息量与连贯性/可读性之间存在tradeoff,需要达到平衡。
动机:自动摘要是一个困难的任务,需要在详细和以实体为中心的摘要之间取得平衡。本文旨在通过链式增密提示(CoD)方法生成越来越稠密的GPT-4摘要,以更好地理解这种权衡。
方法:使用GPT-4生成初始的稀疏摘要,然后通过迭代地加入缺失的重要实体,而不增加长度来生成越来越稠密的摘要。通过人工偏好研究和定性分析,证明CoD生成的摘要比使用普通提示的GPT-4摘要更抽象、融合性更强,并且没有太强的引导偏差。
优势:CoD摘要比使用普通提示的GPT-4摘要更具信息量,接近人工撰写的摘要。CoD方法可以在实时应用中实现更高的信息密度。
通过链式增密提示(CoD)方法生成越来越密集的GPT-4摘要,揭示了信息量和可读性之间的权衡。