Datawhale学习
联合主办:MARS社区、人邮异步社区
本期学习包含学习伙伴、算法学习和动手实践三大专区,共8个学习内容,详情如下:
目 录
1. 报名方式
2. 组队学习模式
3. 学习内容详情
4. 自学教程汇总
1. 报名方式
▶ 报名时间:本周六(1月13日)中午11:30-19:30
📢特别提醒:数据赛事学习在推文中直接报名,详见3.学习内容详情。
▶ 报名方式:本周六负责人会在 Datawhale高校群/在职群 发布报名码,扫码报名后学习。▶ 学习时间:1月13日-1月30日,各学习时间重叠,建议每期只报1门。▶ 进群方式:关注公众号,后台回复关键词“在校”或“在职”进学习群(已在高校或在职群无需重复加入)。
2. Datawhale组队学习模式
Datawhale 是一个专注于数据科学与 AI 领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。
Datawhale 以「for the learner,和学习者一起成长」为使命,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。
同时 Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人、人与知识、人与企业和人与未来的联结。
开源地址
https://github.com/datawhalechina
什么是组队学习?
顾名思义,就是一群志同道合的小伙伴,一起学习讨论,一起克服拖延症,一起组队打boss。没有老师,没有教学,有的是一群热爱学习和渴望改变的人,交流学习,互促共进。《Datawhale学习的常见问题解答!》
3. 学习内容详情
联合举办专区
1 /盐城数据赛事学习
开源贡献:牧小熊、谢文睿、Amy、水琼、佳福、白雪城、杨晨旭、曾心怡、张锦辉
学习伙伴:MARS社区
内容说明:本学习来源于《盐城市数据应用开发创新大赛》,基于盐城市政府开放的海量数据,一起探索数据价值、挖掘应用创新,解锁数据的花样玩法。
学习周期:12天
学习名额:共400人
定位人群:可以投入一定时间,希望探索数据价值,有创新想法的小伙伴
扫描下方二维码报名(仅可选一个方向)
报名方式:
- 选择赛道,扫码对应二维码添加小助手,按照提示操作即可。
- 每赛道200人,每人限选一个赛道,若已经加好友,回复:参与+具体赛道
数据产品方向报名
(聚焦于易落地产品场景案例的打造)
数据应用方向报名
(聚焦于数据价值的挖掘,创意解决方案)
2 /共读《人工智能(第3版)》
开源贡献:司玉鑫、杜政泉、骆秀韬、李柯辰、何瑞杰、王泽宇
学习伙伴:人民邮电出版社异步社区
内容说明:2023年重磅升级的“人工智能的百科全书”《人工智能(第3版)》,以人为本,与时俱进,本次共读前3章,了解人工智能的基本知识、问题领域与发展历史,以及多种搜索算法的理论与实现。
学习周期:21天
学习名额:400人
定位人群:适合对人工智能感兴趣的学习者,高校相关专业的学生。
学习安排如下:
算法专题
3 /Leetcode:面试篇(上)
开源贡献:杨世超、魏庆伟、周景林、张银晗
内容说明:超详细的「算法与数据结构」基础讲解教程,「LeetCode」经典题目的详细解析。本期课程内容精心挑选了 100 道互联网大厂面试的高频算法真题其中的前 50 题,从而帮助面试者更有针对性的准备面试。学习周期:16天学习名额:180人定位人群:有 Python 语言编程基础,想要学习算法、数据结构基础知识,想在 LeetCode 刷算法题的同学。
学习安排如下:
4 /深度强化学习基础与实践(二)
开源贡献:王琦,杨毅远,江季、刘志文、马琦钧、邓恺俊、王子丞内容说明:本内容是深度强化学习的基础内容,主要目标是学习强化学习基础知识,并使用JoyRL框架实践基础的深度强化学习算法。学习周期:18天学习名额:180人定位人群:有一些机器学习的基础,难度系数中。
学习安排如下:
5 /吃瓜教程
开源贡献:谢文睿、罗依婧、刘旭、彭琛
内容说明:周志华老师的“西瓜书”是机器学习经典入门教材,值得反复阅读,配合“南瓜书”从本科数学基础的视角进行讲解,一起打好基础!详细介绍点这里学习周期:17天学习名额:180人定位人群:有高数、线代、概率论与数理统计基础的同学。
学习安排如下:
6 /大模型理论基础(So-Large-LLM)
开源贡献:陈安东、张帆、王茂霖、付广楷、余洋、姚行志内容说明:本项目旨在作为一个大规模预训练语言模型的教程,从数据准备、模型构建、训练策略到模型评估与改进,以及模型在安全、隐私、环境和法律道德方面的方面来提供开源知识。
学习周期:14天
学习名额:180人
定位人群:
-
具有自然语言处理或者深度学习基础;
-
有深度学习工作或者学校项目经验;
-
想要参与大语言模型开源项目的小伙伴;
-
其他大语言模型相关行业人员。
学习安排如下:
实践专题
7 /faster-git
开源贡献:牛志康、朱松青、徐祥军、李碧涵、宋泽山、王晓亮、张翔宇、沈豪、夏峻、陈嘉诺
内容说明:本内容是 Git 入门课程,主要介绍 Git 版本控制系统的基本概念和使用方法。学员将学会如何使用 Git 管理项目的版本,协作开发,并了解基本的分支管理和冲突解决技巧。学习周期:13天学习名额:180人定位人群:对Git、Github感兴趣的同学,无需任何基础
学习安排如下:
8 / AI+量化:whale-quant
开源贡献:崔腾松、王健林、陈玉立、管柯琴内容说明:本项目为量化开源课程,可以帮助人们快速掌握量化金融知识以及使用Python进行量化开发的能力。更进一步地让人们更好地学习和研究量化交易策略。学习周期:21天学习名额:180人定位人群:对AI+量化感兴趣或有学习需求的小伙伴。
学习安排如下:
4. 自学教程汇总
1、盐城数据赛事学习
详细教程及学习者后续放出,欢迎进群学习
2、共读《人工智能(第3版)》
开源内容:https://github.com/siyuxin/AI-3rd-edition-notes
3、Leetcode:面试篇(上)
开源内容:https://github.com/datawhalechina/leetcode-notes/blob/main/docs/ch04/index.md
电子网站:https://datawhalechina.github.io/leetcode-notes/#/ch04/index.md
4、深度强化学习基础
开源内容:
-
https://github.com/datawhalechina/joyrl-book
-
https://github.com/datawhalechina/joyrl/tree/offline
-
https://datawhalechina.github.io/easy-rl/
5、吃瓜教程——西瓜书+南瓜书
开源内容:https://linklearner.com/learn/detail/10
B 站视频教程:https://www.bilibili.com/video/BV1Mh411e7VU
6、大模型理论基础(So-Large-LLM)
开源内容:https://github.com/datawhalechina/so-large-lm/tree/main
7、faster-Git:Git入门教程
开源内容:https://github.com/datawhalechina/faster-git
8、AI+量化:whale-quant
开源内容:https://github.com/datawhalechina/whale-quant
一起“点赞”三连↓