📢📢 好消息!好消息!📺「超神经电视台」在 bilibili 上线啦~
「超神经电视台」会「7×24h」不间断直播 AI 领域的实用课程与行业大会等,每周我们会在文章结尾发布下周的节目预告哦!
点开看看:http://live.bilibili.com/26483094
悄悄说,前段时间从 OpenAI 离职的技术大神 Karpathy 发布的 AI 大课——「让我们构建 GPT Tokenizer(分词器)」将会在下周五(3 月 15 日)晚上 8 点在直播间播放。为了让大家更方便地体验该项目,项目相关资源 minbpe 也已上线至 hyper.ai 官网,快来观看学习吧~
此外,本周 hyper.ai 官网还上线了多个文本类情感分析数据集供大家下载使用哦!
3 月 4 日-3 月 8 日,hyper.ai 官网更新速览:
* 优质公共数据集:10 个
* 社区文章精选:4 篇
* 热门百科词条:10 条
访问官网:hyper.ai
公开数据集精选
1. minbpe 存储库
该存储库为 Karpathy 的 minbpe 项目存储库,包含了基于类的 Tokenizer 实现,如 BaseTokenizer 和 BasicTokenizer 等。这些类的设计旨在提供训练、编码和解码的基本功能,以及保存和加载等实用功能。
直接使用:
https://reurl.cc/97A8QY
2. D4 面向抑郁症诊断聊天的中文对话数据集
D4 是一个抑郁症诊断聊天中文对话数据集。它是一种被称为任务型聊天的全新对话类型。该数据集由 1,339 个多轮对话组成,包含对话摘要和诊断结果。
直接使用:
https://reurl.cc/krbAk3
3. dmsc_v2 电影评论数据集
该数据集包含超 70 万用户对 28 部电影的超 200 万条评分或评论数据。适用于推荐系统、情感/观点/评论等倾向性分析的任务。
直接使用:
https://reurl.cc/prbEOl
4. Amazon 亚马逊用户评价数据集
该数据集包含 142 万用户对亚马逊上 1,100 多个类目 52 万件商品的 720 万条评论或评分数据,可用于推荐系统、情感/观点/评论倾向性分析等任务。
直接使用:
https://reurl.cc/97A8AV
5. Dianping 大众点评数据集
该数据集包含 54 万用户对 24 万家餐馆的 440 万条评论或评分数据。可用于推荐系统、情感/观点/评论倾向性分析等任务。
直接使用:
https://reurl.cc/eLbYrR
6. Weibo_senti_100k 新浪情感类微博数据集
该数据集包含 10 万多条带情感标注的新浪微博,其中正负向评论各约 5 万条。
直接使用:
https://reurl.cc/N487a6
7. Online_shopping_10_cats 10 个种类的线上购物评论数据集
该数据集包含 10 个类别(书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店)的线上购物评论,共 6 万多条的评论数据,正、负向评论各约 3 万条。可用于情感/观点/评论等倾向性分析任务。
直接使用:
https://reurl.cc/qrbl8g
8. ChnSentiCorp 携程酒店评价数据集
该数据集包含来自携程网的 7,000 多条酒店评论数据,5,000 多条正向评论和 2,000 多条负向评论。
直接使用:
https://reurl.cc/QelvjM
9. Waimai_10k 外卖平台用户评价数据集
该数据集来自某外卖平台收集的用户评价,包含正向评价约 4,000 条,负向评价约 8,000 条。可用于情感/观点/评论的倾向性分析。
直接使用:
https://reurl.cc/K4zaQq
10. Four-shapes 四种形状数据集
该数据集包含 16,000 张 4 种形状的图像:正方形、星形、圆形和三角形。每个图像为 200×200 像素。数据是使用 Garmin Virb 1080p 运动相机收集的。
直接使用:
https://reurl.cc/E4N9Zm
更多本周更新数据集,请访问:
https://hyper.ai/datasets
社区文章精选
1. 准确率达 91.74%!东南大学提出光伏电池缺陷检测模型,首次引入神经结构搜索
为了同时满足工业领域对缺陷检测的精度和速度要求,来自东南大学自动化学院的张金霞教授团队,基于神经结构搜索和知识蒸馏,提出了一种光伏电池电致发光图像缺陷自动检测模型,准确率达 91.74%。目前,该研究成果已发布在 arXiv 上。
查看完整报道:
https://reurl.cc/97AK7x
2. 内含教程丨音色克隆模型 GPT-SoVITS,5 秒语音就能克隆出相似度 95% 的声音
RVC (Retrieval based Voice Conversion) 创始人(GitHub 账号:RVC-Boss)开源了一款音色克隆项目 GPT-SoVITS,上线后便获得极高热度。仅需提供 5 秒语音样本,便可收获相似度达到 80%~95% 的克隆语音。目前,该模型部署教程已上线 HyperAI超神经官网。
点击开始克隆:
https://reurl.cc/97AKj8
3. 两会进行时丨科技大佬点名 AI4S/人才培养/算力/大模型/行业通用数据集……
又是一年「两会」时!政府工作报告中明确提出要开展「人工智能+」行动,来自社会各界的人大代表与政协委员也纷纷围绕 AI 建言献策。本文梳理了部分科技圈大佬的提案建议。
查看完整报道:
https://reurl.cc/lgbxGE
4. HyperAI 超神经 x DT 新材料丨 AI 技术在化学与材料科学科研中应用研讨会开启报名
「AI 技术在化学与材料科学科研中应用研讨会」将于 4 月 23 日—25 日在河南郑州开幕,多位行业专家将围绕 AI 应用于材料化学领域的挑战、前景与机遇等方面带来深度分享。
感兴趣的开发者们可以点击下方链接报名。
报名链接:
https://reurl.cc/QelMdb
热门百科词条精选
1. 拉普拉斯算子 Laplacian
2. 世界模型 World Modeling
3. 每秒帧数 Frames Per Second (FPS)
4. 扩散模型 Diffusion Model
5. 人机回圈 Human-in-the-loop (HITL)
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
https://hyper.ai/wiki
超神经 B 站直播预告
日期
时间
内容
3 月 11 日
星期一
10:00
英伟达历年发布会
3 月 12 日
星期二
10:00
18:00
机器学习编译课程
特斯拉 AI 日
3 月 13 日
星期三
10:00
谷歌历年 I-O 发布会
3 月 14 日
星期四
10:00
斯坦福HAI 研讨会
3 月 15 日
星期五
10:00
20:00
MIT 深度学习课程
Let‘s build GPT Tokenizer
3 月 16 日
星期六
10:00
哈佛 CS50 课程
(2023)
3 月 17 日
星期日
10:00
哈佛 CS50 课程
(2022)
超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:
http://live.bilibili.com/26483094
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
下周再见!
关于 HyperAI超神经 (hyper.ai)
HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
* 为 1200+ 公开数据集提供国内加速下载节点
* 收录 300+ 经典及流行在线教程
* 解读 100+ AI4Science 论文案例
* 支持 500+ 相关词条查询
* 托管国内首个完整的 Apache TVM 中文文档
访问官网开启学习之旅:
https://hyper.ai/