斯坦福以人为本人工智能研究所 (HAI) 发布了最新一期的 2023 AI 指数 (2023 AI Index) 报告,其中探讨了过去一年机器学习的发展。斯坦福 HAI 于 2019 年初成立,致力于研究新的 AI 方法,并研究该技术对社会的影响。其每年发布一份 AI 指数报告,通过跟踪和评估 AI 进展,着眼于研发、技术性能、伦理、经济、政策、舆论和教育方面的趋势。
今年的报告包括对基础模型的新分析,包括地缘政治和培训成本、人工智能系统的环境影响、K-12 人工智能教育以及人工智能的舆论趋势。“该报告有助于在数据中建立人工智能对话的基础,使决策者能够采取有意义的行动以负责任和合乎道德的方式推进人工智能。”
报告的一些亮点内容包括:
- 工业界领先于学术界。2014 年及之前,大多数重要的机器学习模型都是由学术界发布的;但在之后,这个角色开始由工业界接管。到 2022 年,有 32 个重要的工业生产机器学习模型,而学术界只有三个。构建最先进的人工智能系统越来越需要大量的数据、计算和资金,与非营利组织和学术界相比,行业参与者固有地拥有更多的资源。
- 传统基准测试的性能饱和。AI 发展快速迭代,但相关基准测试的发展却并没有并驾齐驱。此外,达到基准饱和的速度正在加快。许多用于衡量 AI 进展的传统基准测试,如 ImageNet 和 SQuAD 似乎已不再够用。不过目前也有新的、更全面的基准测试套件在推出,如 BIG-bench 和 HELM。
-
人工智能对环境既有帮助也有危害。新研究表明,人工智能系统会对环境产生严重影响。根据 Luccioni 等人的数据,到 2022 年,BLOOM 的训练排放的碳比一名从纽约到旧金山的单程航空旅客排放的碳多 25 倍。尽管如此,像 BCOOLER 这样的新强化学习模型表明,人工智能系统可用于优化能源使用。
-
世界上最好的新兴科学家或是人工智能?AI 模型开始迅速加速科学进步,并在 2022 年被用于帮助氢聚变、提高矩阵操作效率并生成新抗体。同事,人工智能技术也开始被用于构建更好的人工智能。Nvidia 使用 AI 强化学习代理来改进为 AI 系统提供动力的芯片设计。谷歌最近也使用其大型语言模型之一 PaLM 来建议改进同一模型的方法。
-
有关滥用 AI 的事件数量正在迅速增加。根据跟踪与人工智能道德滥用相关事件的 AIAAIC 数据库,自 2012 年以来,人工智能事件和争议的数量增加了 26 倍。
-
几乎每个美国工业部门对人工智能相关专业技能的需求都在增加。在美国有数据的每个部门(农业、林业、渔业和狩猎除外),与人工智能相关的职位发布数量平均从 2021 年的 1.7% 增加到 2022 年的 1.9%。美国的雇主正越来越多地寻找具有人工智能相关技能的工人。
-
在过去十年中,人工智能领域的私人投资首次出现同比下降。2022 年全球 AI 私人投资为 919 亿美元,较 2021 年下降 26.7%。与 AI 相关的融资事件总数以及新投资的 AI 公司数量也同样下降。尽管如此,在整个过去十年中,人工智能投资表现出显着增加。2022 年,人工智能领域的私人投资金额是 2013 年的 18 倍。
-
越来越多的公司采用 AI 技术。根据麦肯锡年度研究调查的结果,尽管采用率近年来一直稳定在 50% 至 60% 之间,但 2022 年采用 AI 技术的公司比例自 2017 年以来已经翻了一番以上。采用 AI 的组织报告称,它们实现了显着的成本降低和收入增加。
-
政策制定者对人工智能的兴趣正在上升。AI 指数对 127 个国家立法记录的分析表明,通过成为法律的包含“人工智能”的法案数量从 2016 年的 1 项增加到 2022 年的 37 项。对 81 个国家关于 AI 的议会记录的分析同样表明,自 2016 年以来,全球立法程序中提及 AI 的次数增加了近 6.5 倍。
-
中国公民是对人工智能产品和服务感觉最积极的人群之一,高于美国。在 2022 年的 IPSOS 调查中,78% 的中国受访者(在接受调查的国家中比例最高)同意使用人工智能的产品和服务利大于弊的说法;其次是来自沙特阿拉伯(76%)和印度(71%)的受访者。只有 35% 的美国受访者(在接受调查的国家中比例最低)同意使用 AI 的产品和服务利大于弊。
此外,报告还指出在 2022 年的趋势中,DALL-E 2、Stable Diffusion 和 ChatGPT 等生成模型已经成为时代精神的一部分。但它们在表现出显著能力的同时,也引发了道德问题。Text-to-image 生成器通常在性别方面存在偏见,像 ChatGPT 这样的聊天机器人可能会传递错误信息或被用于邪恶目的。
且推动了许多 AI 技术进展的大型语言模型也变得越来越大、越来越昂贵。例如,2022 年发布的旗舰模型之一 PaLM 的开发成本为 800 万美元。比 2019 年首批推出的大型语言模型之一的 GPT-2 成本高160 倍,体积大 360 倍。
更多详情可查看完整报告。