HeySQuAD:一份口语问答数据集

810次阅读
没有评论

HeySQuAD: A Spoken Question Answering Dataset

解决问题:该论文旨在解决口语问答系统中的一个关键问题,即如何让机器理解人类发出的口语问题并准确回答。作者通过提出一个新的大规模社区共享的数据集HeySQuAD,旨在衡量机器理解嘈杂的口语问题和准确回答问题的能力。

关键思路:该论文的关键思路是使用HeySQuAD数据集来量化人类口语和机器生成的问题的噪声差异,并研究其对模型和回答准确性的影响。此外,作者还发现,使用转录的人类口语和原始SQuAD问题的训练可以显著提高模型的性能。

其他亮点:该论文提出的HeySQuAD数据集是一个值得关注的亮点,该数据集包含76k个人类口语问题和97k个机器生成的问题及其对应的文本答案。实验结果表明,使用HeySQuAD数据集进行训练可以显著提高口语问答系统的性能。该论文的代码和数据集也已经开源,为后续的相关研究提供了便利。

关于作者:本文的主要作者来自印度和美国的多个机构,他们在机器学习和自然语言处理领域都有着丰富的研究经验。其中,Yijing Wu曾参与了“基于序列到序列的语音识别”的研究,SaiKrishna Rallabandi曾参与了“基于深度学习的语音情感识别”的研究,Parag Pravin Dakle曾参与了“基于深度学习的机器翻译”的研究,Alolika Gon曾参与了“基于深度学习的问答系统”的研究。

相关研究:近期其他相关的研究包括:“Spoken SQuAD: A Study of Mitigating the Impact of Speech Recognition Errors on Listening Comprehension”,作者为Yuanhang Zheng等人,机构为加州大学伯克利分校;“Spoken Question Answering by Generating Multiple Sequences”,作者为Shun-Po Chuang等人,机构为台湾国立交通大学。

论文摘要:本文介绍了一种新的大规模社区共享的口语问答数据集HeySQuAD,其中包含76k个人类口语问题和97k个机器生成问题,以及对应的文本答案,这些问题和答案来自于SQuAD QA数据集。HeySQuAD的目标是衡量机器理解嘈杂的口语问题并准确回答这些问题的能力。为了达到这个目的,作者对人类口语问题和机器生成问题进行了广泛的基准测试,以量化两种来源的噪声差异及其对模型和回答准确性的影响。值得注意的是,在SQA任务中,我们希望回答人类口语问题,我们观察到使用转录的人类口语和原始SQuAD问题进行训练可以显著提高(12.51%)模型性能。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy