全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代

668次阅读
没有评论

全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代

  新智元报道  

编辑:好困 桃子

【新智元导读】大模型如火如荼发展的一年,也为教育科技带来很大的想象空间。1月5日,国内首个教育智适应多模态大模型发布。大模型革新教育,同样能够做到千人千面,为学生提供个性化的学习服务。

过去的一年,大模型一跃成为时代的新宠,强大的泛化和通用能力,为AI应用打开全新的想象空间。我们见证了,大模型在材料加速发现,数学定理证明等方面有着巨大的潜力。而教育也是大模型一直备受关注的落地场景之一。那么,我们如何利用大模型来创造更好的教育体验?1月5日,在AIAED智适应教育大模型学术研讨会上,国内科技创新型独角兽企业「松鼠Ai」,正式发布全球第一个智适应教育大模型,并在会上首次公开分享了应用落地大模型技术的思考与实践。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代据介绍,松鼠Ai智适应教育大模型,是全球范围内首次将智适应技术与多模态大模型结合的探索,在个性化学习服务方面,实现了突破式迭代。这也意味着,松鼠Ai对大模型的探索已率先从技术研发阶段进阶至应用及行业布局阶段。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代除此之外,会议还正式宣布——组建IEEE人工智能教育大模型标准工作组(P3428)。其中,松鼠Ai创始人栗浩洋任该工作组主席,第一批专家作组包括北京师范大学黄荣怀教授、清华大学许斌教授、华东师范大学顾小清教授。后续还将邀请全球的科学家、高校学者、人工智能及教育行业专家、科技教育企业代表等诸多专业人士共同参与,旨在进一步推动人工智能、大模型技术在教育领域的落地和创新,助推教育行业升级与创新发展。

全球首个「智适应大模型」来袭

过去一年,大模型技术快速迭代,AI应用的可能性也在不断拓宽,全球各大科技巨擘竞相围绕其展开布局。席卷全球的「百模大战」之中,教育企业的身影并不少见。例如「可汗学院」推出了人工智能助教Khanmigo,另一方面,Duolingo推出了使用GPT-4技术的 Duolingo Max。作为创新学习工具,这两款产品增加了如语音识别、实时反馈的功能。国内企业也纷纷开启了利用人工智能技术提升教育质量的尝试。在此次会议上,松鼠Ai也带来了自己的最新的技术成果——全球第一个全学科智适应教育大模型,这也是国内首个将智适应教育技术与多模态大模型结合,运用于教育的垂直领域大模型。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代作为国内第一家将人工智能自适应学习技术应用在教育领域的科技创新型独角兽企业,松鼠Ai是国内较早布局人工智能的先行者。回溯其在人工智能领域的投入,已经超过9年。自成立以来,不仅与斯坦福研究中心进行联合技术开发,还曾与卡耐基梅隆大学成立联合实验室,开发人工智能、机器学习、认知科学和人机界面技术的新方法。如今,松鼠Ai在技术实力、数据积累、应用场景研究等多个维度均已做到了国内顶级、全球领先。据介绍,松鼠Ai智适应大模型主要实现了三个突破:一是产品性能实现突破式迭代,在个性化教育服务方面,多项能力实现超越。松鼠Ai创始人、董事长栗浩洋表示,松鼠Ai通过将智适应技术和大模型结合,已顺利完成产品性能的全面升级,让技术赋能效果,实现了质的飞跃。基于松鼠Ai独有的、过去所积累的2400万学生的100亿学习行为全流程数据「喂养」大模型,在超大规模数据量训练后,松鼠Ai推荐算法、深度知识追踪等AI技术都已实现突破式迭代。AI大模型是「大数据+大算力+强算法」结合的产物,因此训练数据的质量与数量至关重要。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代相较其他行业大模型,及缺乏个人学习数据的ChatGPT,「松鼠Ai智适应大模型」拥有松鼠Ai多年积累的场景、数据、算法等方面的技术与行业经验优势,在充足的教育训练数据下能够保障模型的生成能力及精度。目前,松鼠Ai智适应大模型,能够更好地捕获数据中的复杂关系和模式,能够更快速发现知识点和知识点之间,知识点和题目之间,题目和孩子能力之间的关系,能够更高效地绘制学生的学习画像,为学生提供针对性的个性化服务,从而进一步提高学生学习效率。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代二是推动五育并举、关注学生情感需求,在大模型落地应用实现领先性尝试。相较公有数据的大模型的通用底座,松鼠Ai的不同之处在于,基于独有的知识图谱和MCM(学习的思想、能力、方法)图谱,松鼠Ai能够真正提高教学效率,并且把每个孩子的个性、特长、潜在优势充分发挥出来,真正做到以AI赋能教育生产力高效释放,深度赋能因材施教和五育并举。通过多种AI技术在产品中的应用落地,松鼠Ai在给学生提供辅导时,能够覆盖预习、复习、备考、作业辅导等多场景,在社会情感及人际互动方面给予学生更多准确的回应与激励。例如,松鼠Ai可以根据孩子在学习过程中反应,给予其正面的反馈与激励改善学生的情绪,帮助解决孩子的一些心理问题,有效解决孩子学业提升慢、提升难,良好学习习惯养成等问题,帮助每个孩子成为最好的自己,把每个人的个性、特长、潜在优势充分发挥出来。

全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代

L3:战略锁定隔离池,知识点重新排序三是加快商业化进程,实现大模型技术在教育领域落地应用、发展及推广。当技术与教育的结合越来越紧密之时,教育行业也有望成为大模型技术的最佳落地场景。目前,松鼠Ai持续探索大模型技术应用,希望进一步赋能教育生产力高效释放。据栗浩洋介绍,松鼠Ai 2023年已经完成2000家线下智能学习机门店业务布局,是全国零售店规模最大的AI学习机品牌,整体业务增长率达300%。同时,松鼠Ai还计划在今年年底推出全新的国际版本产品,面向全球学生提供产品与服务,更好地服务全球用户,提升中国教育科技品牌的国际影响力。不仅如此,目前松鼠Ai已经开始尝试将大模型技术应用于打造虚拟老师。通过生成更多视频讲解,助力社会需求的创新人才培养。可以预见,此举将拓展大模型在教育领域的商业模式宽度,也将为大模型在更多行业的落地提供借鉴和参考。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代

松鼠Ai牵头成立人工智能教育大模型标准工作组

作为聚焦新技术、新产品、新平台与新见解的行业盛会,AIAED智适应教育大模型学术研讨会邀请了来自政府、高校、企业等各方代表齐聚一堂,就AI大模型的热点技术和垂直教育行业的创新应用展开深入分享与交流。出席活动并作学术交流和报告分享的有:

– 加拿大工程院及加拿大皇家学院院士、国际人工智能联合会IJCAI理事会前主席、微众银行首席人工智能官香港科技大学杨强教授;

– 中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任、前中国科学院自动化研究所副所长、IEEE Fellow王飞跃教授;

– 北京师范大学「长江学者」特聘教授、北京师范大学智慧学习研究院院长黄荣怀教授;

– 教育部教育信息化专家组成员、华东师范大学教育学部教授、教育技术学系系主任顾小清教授;

– 清华大学计算机系教授、中国计算机学会计算机应用专委会主任许斌教授;

– 松鼠Ai董事长、首席教育技术科学家栗浩洋。

此外,大会还进行了IEEE人工智能教育大模型标准工作组(P3428)的成立仪式。松鼠Ai董事长栗浩洋作为该工作组主席,与北师大黄荣怀教授、华东师大顾小清教授、清华大学许斌教授共同启动该工作组,各位嘉宾并对全球人工智能教育大模型标准的建立展开讨论与分享。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代近年来,人工智能发展受到各级政府的高度重视和国家产业政策的重点支持,国家陆续出台了多项政策,鼓励人公共职能行业发展与创新。今年7月,国家网信办、国家发展和改革委员会、教育部、科学技术部、工业和信息化部、公安部、国家广播电视总局等7部委就联合公布了《生成式人工智能服务管理暂行办法》,对大模型技术在教育行业的发展给予了大力支持。而人工智能教育大模型标准工作组的成立,正是极为关键的一步——一方面是响应相关政策,在政策和市场之间建立互联通道,推进相关政策的贯彻实施,给予相关部门反馈一些来自市场一线的信息和建议;另一方面,工作组将进一步团结业界,通过资源整合、战略研究和交流平台搭建的形式,进一步推动 AI大模型技术在教育领域的支撑和应用,提高企业的竞争力和可持续发展能力。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代作为人工智能教育领域的佼佼者,松鼠Ai在技术上坚持创新驱动,在标准上进行顶层设计和超前布局,从而源源不断地把技术创新成果转化为行业标准。此次牵头成立工作组,这不仅能够有效地促进了教育大模型技术的健康有序发展,同时也能不断培育和发掘前瞻性的技术标准,从而持续帮助行业在国际标准上实现超越,对于提升中国教育的全球竞争力和影响力、推进人工智能产业发展尤为重要。此外,松鼠Ai还在发布会上宣布一项普惠计划:松鼠Ai计划永远面向全球20%的最低收入家庭的孩子,免费提供松鼠Ai系统,推动优质教育资源的规模化、公平化、个性化。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代松鼠Ai董事长栗浩洋谈到,在全球人工智能浪潮下,教育领域呈现出强劲的发展势头。作为中国人工智能教育领域的创新企业代表,松鼠Ai切盼望关注教育智适应大模型发展的企业、专家、学者能够加强对话与合作,共同推动产业链的协同发展,让因材施教的个性化教育早日惠及更多孩子。据其介绍,未来工作组将吸纳更多专家成员、企业家,充分发挥各领域专业人士的优势,为中国教育大模型技术发展及行业落地应用提供专业的指导和建议。未来,松鼠Ai也将基于在教育智适应大模型领域的技术创新成果和经验积累,充分发挥落地应用的先发实践优势,聚力行业合作伙伴,为中国人工智能教育领域的标准化体系建设、全球教育行业智能化升级注入源源不断的动力。

创始人专访

提问:松鼠Ai智适应大模型可以加速发现知识点和题目,以及与学生之间的关系,这个是咱们之前模型拥有的能力,还是全新的迭代?栗浩洋:我们以前的模型在知识图谱和系统的基础上,能够给孩子提供个性化的实时的反馈,而在「暗逻辑」上发现的效果不够好。松鼠Ai在2年前开始研究大模型,1年前开始运用在智适应中。这时我们发现,大模型够找到各种各样的「暗逻辑」。比如学什么东西学的快或慢,简单或容易等等,这体现的就是每个学生独特的大脑认知和学习方式。具体来说,我们首先利用大模型生成给学生的学习推荐、反馈等输出。在这之中,大约80-90%是正确的,10%可能有明显错误。然后,用人工针对错误的输出进行标注归类。基于人工标注后的结果会用作奖励模型进行强化学习,对具体的错误类别进行性能优化,这样通过「人工标注+强化学习」的方式来不断改进输出,处理那些大模型直接生成的可能有错误的输出。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代提问:松鼠Ai大模型在进行数学推理时,是否也会面临LLM在数学推理能力上本身的局限和不足?栗浩洋:目前大模型在推理和理解能力上还是有限,它们主要是在概率上进行字和像素(比如Midjourney)的排序,距离真正的理解还很远。但大模型在处理复杂情景以及「暗逻辑」上是非常有潜力的,因此它们在智能教育系统中策略有很好的应用价值。在我们系统中,松鼠Ai大模型更多是用于制定学习效率的策略——「理解」题目及其解析并进行知识点标注,而不是直接进行数学推理。而在学生的学习路径中,松鼠Ai大模型还会根据不同的错误类型和水平进行个性化引导。在这一场景下,同样也不是简单地对题目进行分步解析。提问:学生给出解题步骤后,如何利用松鼠Ai智适应大模型(LAM)对错误点进行分析?栗浩洋:在分析学生的解题步骤时,先利用松鼠Ai大模型进行问题定位,找到学生的错误点。然后利用松鼠Ai大模型系统结合学生的整体水平、不同类别的学生做出综合的判断,进而提供个性化学习路径。松鼠Ai智适应大模型(LAM)分三步运作,首先通过各种学生数据训练得到一个通用模型,然后根据不同学科、不同板块、不同场景再去微调模型,最后结合具体的学生数据再进行诊断和路径规划。松鼠Ai的LAM系统最新的进展便是,自主发现学生在哪些情况下可以学会,哪些情况下学不会,从而进行更智能的路径规划。全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代
全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代
全球首个全学科智适应教育大模型诞生!百亿学习数据训练,9年研发算法突破式迭代

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy