从文字到音乐:符号音乐生成中子词标记化技术的研究

1,247次阅读
没有评论

From Words to Music: A Study of Subword Tokenization Techniques in
Symbolic Music Generation

解决问题:本论文旨在研究在基于Transformer模型的符号音乐生成中,采用子单词分词技术(如BPE)的有效性,以及其对生成音乐整体结构的影响。这是一个相对新的问题,因为在符号音乐生成领域,子单词分词技术的应用还未被广泛研究。

关键思路:本论文的关键思路是探索在符号音乐生成中采用子单词分词技术的有效性,并比较BPE和Unigram两种子单词分词方法。相比当前领域的研究状况,本论文的思路是新颖的,因为它将自然语言处理领域的成功经验引入到符号音乐生成领域。

其他亮点:本论文使用了三种类型的MIDI数据集进行实验,分别是单轨旋律、单乐器多轨和多乐器多轨。实验结果表明,采用子单词分词技术可以在相同的时间内生成更长的音乐,并且可以提高生成音乐的整体结构。本论文的实验设计合理,数据集来源清晰,但未提及是否有开源代码。本论文的研究值得进一步深入,特别是在涉及多轨音乐等复杂数据的情况下。

关于作者:本论文的主要作者是Adarsh Kumar和Pedro Sarmento。Adarsh Kumar是印度理工学院(IIT)的博士生,Pedro Sarmento是葡萄牙大学的博士后研究员。他们的代表作尚未在我的数据库中找到。

相关研究:近期其他相关的研究包括:

  • “Music Transformer: Generating Music with Long-Term Structure”,由Hang Chu等人于2019年发表在Google Research机构。
  • “MIDI-VAE: Modeling Dynamics, Instruments, and Tempo with Hierarchical Variational Autoencoders”,由Yiyang Yang等人于2021年发表在香港科技大学。
  • “A Survey of Deep Learning Techniques for Music Generation”,由Eduardo Fonseca等人于2021年发表在西班牙巴塞罗那大学。

论文摘要:本文介绍了子词分词在基于Transformer模型的自然语言处理(NLP)任务中的广泛应用。由于Transformer模型在符号音乐相关研究中越来越受欢迎,因此有必要探究子词分词在符号音乐领域的有效性。本文探讨了字节对编码(BPE)等子词分词技术在符号音乐生成中的应用及其对生成歌曲整体结构的影响。实验基于三种类型的MIDI数据集:仅包含单个音轨旋律、带有单个乐器的多轨和多乐器的多轨。研究人员在音乐后处理的基础上应用子词分词,并发现它可以在相同时间内生成更长的歌曲,并改善生成音乐的整体结构,如结构指标(SI)、音高类熵等客观指标。研究人员还比较了两种子词分词方法,BPE和Unigram,并观察到两种方法都可以带来一致的改进。该研究表明,子词分词是符号音乐生成的一种有前途的技术,对音乐创作可能具有更广泛的影响,特别是在涉及多轨歌曲等复杂数据的情况下。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛 一水 2025-12-17 ...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...