本期热点讨论
💙 AGI在安全伦理方面面临哪些主要风险?💙 通用大模型可能面临哪些攻击模式?💙 如何评估通用大模型在实际应用中的安全性和伦理性?
本周三(1月10日)19:00,《追AI的人》系列直播第34期邀请了复旦大学计算机科学与技术学院张谧教授分享。
01
直播详情
直播主题:《当“巨兽”成为“宠物”:复旦白泽带你领略大模型安全伦理风险与治理》
直播时间:2024年1月10日(周三)19:00直播地点:微信搜索“阿里巴巴AI治理中心”视频号,B站搜“AAIG课代表”。
02议题简介
以ChatGPT为代表的生成式AI已成为人工智能和相关垂直领域的重大变革力量。本报告以近期OpenAI内部风波和作为舆论焦点的Q*模型为切入点,介绍通用人工智能(AGI)面临的安全伦理风险。作为当前AGI技术发展的基石,以ChatGPT为代表的通用大模型生成内容安全至关重要。
本报告第二部分将剖析通用大模型面临的多种攻击模式。最后,在生成式AI安全风险全球治理的政策背景下,梳理大模型安全治理技术发展脉络,分享复旦白泽大模型靶向式安全评测平台JADE对大模型健康发展的助力作用。
💛【课程大纲】:1、通用人工智能安全前沿2、通用大模型安全风险3、通用大模型安全治理4、总结与展望
03
讲师简介
张 谧
复旦大学计算机科学与技术学院教授、博导,系统软件与安全实验室-白泽智能负责人。研究领域为AI安全,包括模型安全、数据安全、生成式AI安全等,成果发表于网络安全与AI领域顶会顶刊,包括S&P、USENIX Security、CCS、TDSC和TPAMI、ICML、NeurIPS、ICDE、KDD、SIGIR、AAAI等,曾获网安顶会ACM CCS最佳论文提名奖。
担任领域顶会Organization Commitee成员以及顶会顶刊程序委员。主持科技部重点研发计划课题等多项国家级和省部级课题,并与阿里、华为、百度等建立企业项目合作,形成成果落地,获CCF科学技术奖自然科学二等奖、华为优秀技术成果奖、CNVD国家最具价值漏洞等荣誉。深度参与信安标委《生成式人工智能服务安全基本要求》、《人工智能安全标准化白皮书》等多项国家/行业标准编制/建议工作。
04
追AI的人是什么?
《追AI的人》系列直播是一档由阿里巴巴人工智能治理与可持续发展研究中心(AAIG)联合高校和产业界发起的AI治理交互栏目。重点关注并分享人工智能新技术、AI治理新观点、可持续发展新风向。目前联合高校、律所等多家单位举办了33期直播,吸引全国超100万人次实时观看。
直播好礼来咯!💗天猫精灵💗限量版《生成式人工智能治理与实践白皮书》
周三晚19:00!《追AI的人》第34期直播不见不散!
📌往期推荐
生成式人工智能的发展以及担忧|生成式人工智能的治理愿景和框架...👉点击查收全文链接
🌟2022人工智能治理系列丛书 精华大图集锦版 | 如何维护电商平台信息真实和竞争公平…👉点击查收白皮书全书连载
🔥《追AI的人》系列直播教你掌握互联网的“流量密码” | 如何避免ChatGPT被滥用…👉点击查收过往33期直播的全部文字回放
🎈《算法治理制度》系列丛书内容和电商领域推荐算法的应用与治理差异|“大数据杀熟” 的背后…👉点击阅读更多算法治理干货
📺 AI治理科普短视频流量为王的时代,教你如何“破圈”创作 | 3分钟Get多模态是什么|为什么生成式AI更容易取代白领员工,对体力工作者的影响却微乎其微…👉点击观看往期23期精彩视频
👇AAIG课代表,获取最新动态就找她
关注公众号发现更多干货❤️