基于角度的动态学习率梯度下降算法

1,410次阅读
没有评论

Angle based dynamic learning rate for gradient descent

解决问题:本篇论文旨在解决分类任务中梯度下降方法中自适应学习率的问题,提出了一种新的自适应学习率的计算方法。相比之前的方法,本文提出的方法在角度历史方面更好地确定了更好的自适应学习率,从而在许多基准数据集上实现了更高的准确性。

关键思路:本文的关键思路是通过计算当前梯度和新梯度之间的角度来确定自适应学习率。与传统方法不同,本文的方法通过计算垂直于当前梯度方向的新梯度来确定角度,并在角度历史方面确定更好的自适应学习率。相较于现有的优化器,本文的方法在许多基准数据集上实现了更高的准确性。

其他亮点:本文在多个基准数据集上进行了实验,并证明了该方法的收敛性。作者还提供了开源代码,可以进一步研究该方法的实现和效果。本文的方法值得进一步研究和应用。

关于作者:本文的主要作者是Neel Mishra和Pawan Kumar。他们都来自印度的印度理工学院。在之前的研究中,Neel Mishra曾经参与开发了一种基于深度学习的自动文本摘要方法,Pawan Kumar则曾经参与研究了一种基于图像分割的深度学习方法。

相关研究:近期的相关研究包括:《A Survey on Optimization Methods for Deep Learning》(作者:Ioannis Panageas,机构:University of Edinburgh)、《AdaBelief Optimizer: Adapting Stepsizes by the Belief in Observed Gradients》(作者:Juntang Zhuang,机构:The Chinese University of Hong Kong)、《A Simple Framework for Contrastive Learning of Visual Representations》(作者:Ting Chen,机构:Google Research)。

论文摘要:在我们的研究中,我们提出了一种新颖而简单的方法,用于在分类任务的梯度下降方法中获得自适应学习率。我们不使用传统方法通过梯度项的衰减期望来选择自适应学习率,而是使用当前梯度和新梯度之间的夹角:这个新梯度是从当前梯度正交方向计算出来的,这进一步帮助我们根据角度历史确定更好的自适应学习率,从而相对于现有的最先进的优化器,导致了更好的准确性。在许多基准数据集上进行测试,其中包括ResNet、DenseNet、EfficientNet和VGG等著名的图像分类架构,我们发现我们的方法在大多数数据集中都能实现最高的准确性。此外,我们证明了我们的方法是收敛的。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔

2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔

2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔 鹭羽 2025-12-24 09:1...
AI Coding新王登场!MiniMax M2.1拿下多语言编程SOTA

AI Coding新王登场!MiniMax M2.1拿下多语言编程SOTA

AI C++oding新王登场!MiniMax M2.1拿下多语言编程SOTA 克雷西 2025-12-24 ...
智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify

智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify

智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify 鹭羽 2025-12-23 1...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
易烊千玺的华为绿手机,真的AI了

易烊千玺的华为绿手机,真的AI了

Failed to fetch content Read More 
AI狼人杀大决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背

AI狼人杀大决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背

AI狼人杀大决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背 鹭羽 2025-12-23 14...
长城首个VLA车型发布,魏建军回应「赌上姓氏造车」

长城首个VLA车型发布,魏建军回应「赌上姓氏造车」

长城首个VLA车型发布,魏建军回应「赌上姓氏造车」 贾浩楠 2025-12-23 13:57:25 来源:量子...