矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

585次阅读
没有评论

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

金磊 发自 凹非寺量子位 | 公众号 QbitAI

天下苦大模型矩阵乘法久矣。

毕竟不论是训练还是推理过程,矩阵乘法作为最主要的计算操作之一,往往都需要消耗大量的算力。

那么就没有一种更“快、好、省”的方法来搞这事儿吗?

有的,香港中文大学最新一篇仅10页的论文,便提出了一种新算法:

  • 能源可节省:5%-10%
  • 时间可节省:5%
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

论文作者之一的Dmitry Rybin表示:

这项研究对数据分析、芯片设计、无线通信和LLM训练都有着深远的影响!

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

这么算矩阵乘法,更快!

矩阵乘法是计算机科学和数值线性代数中的核心问题之一。

自从Strassen和Winograd的开创性工作以来,研究者们一直在探索如何减少矩阵乘法所需的计算量。

尽管这类运算在统计、数据分析、深度学习和无线通信等领域有着广泛应用,例如协方差矩阵的计算和线性回归中的关键步骤,但对于具有特殊结构的矩阵乘法(如计算矩阵与其转置的乘积XXt)的研究相对较少。

从理论角度看,计算XXt与一般矩阵乘法具有相同的渐近复杂度,因此只能通过常数因子优化来提升速度。

因此,这篇论文《XXt Can Be Faster》提出了一种名为RXTX的新算法,通过结合机器学习搜索方法和组合优化技术,显著提升了XXt的计算效率。

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

我们先来了解一下RXTX。

整体来看,这个基于4×4分块矩阵的递归乘法,通过机器学习搜索与组合优化相结合的方法发现。

算法主要包含以下关键步骤:

  1. 分块与递归调用
  2. :将矩阵X划分为16个4×4子块,通过8次递归调用处理子问题,并计算26个一般矩阵乘积m1至m26。
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
  1. 对称乘积计算
  2. :直接计算8个子块的对称乘积s1至m8。
  3. 结果组合
  4. :通过线性组合上述乘积结果,得到最终的XXt矩阵各分块元素C11至C44。
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

与此前最先进的算法(基 Strassen的递归分治)相比,RXTX的递归关系式为 R(n)=8R(n/4) + 26M(n/4),而原算法为 S(n) = 4S(n/2) + 2M(n/2)。

这一设计使得RXTX的渐近乘法常数为 26/41≈0.6341,比原算法的2/3≈0.6667降低了约5%。

接下来,我们来看下乘法次数与运算总量分析。

通过论文中的定理1的推导,RXTX的乘法次数表达式为:

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

实验数据表明,当n为4的幂次时,RXTX的乘法次数比原算法低5%,且随着n增大,这一优势持续保持:

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

通过优化加法步骤(利用公共子表达式减少加法次数),RXTX的总运算量表达式为:

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

而原算法的总运算量包含对数项,导致其增长更快。

实验显示,当n≥256时,RXTX的总运算量优于原算法;当n≥1024时,显著优于朴素算法:

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

在6144×6144矩阵的测试中,RXTX的平均运行时间为2.524秒,比BLAS的默认实现快9%,且在99%的测试中表现更优:

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

尽管运行时间受硬件和内存管理影响,但理论分析表明,当n≥256时,RXTX即可展现速度优势。

值得一提的是,RXTX的发现得益于机器学习与组合优化的结合,具体流程如下:

  • RL代理生成候选乘积:通过强化学习策略生成大量可能的秩-1双线性乘积。
  • MILP枚举与筛选:
    • MILP-A:枚举候选乘积与目标表达式(XXt的各分块)之间的线性关系。
    • MILP-B:选择最小的乘积子集,确保所有目标表达式可通过线性组合表示。
  • 大邻域搜索迭代:通过迭代优化,逐步减少冗余乘积,提升算法效率。

这一方法借鉴了AlphaTensor的思路,但通过限制候选空间为二维张量,显著降低了计算复杂度,使得MILP求解器(如 Gurobi)能够高效处理。

论文地址:
https://arxiv.org/abs/2505.09814

参考链接:
[1]https://x.com/DmitryRybin1/status/1923349883945181392
[2]https://x.com/vikhyatk/status/1923541713618129273

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 5 月
 1234
567891011
12131415161718
19202122232425
262728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...