AI Agent（AI智能体）是什么？

前段时间，《清华团队领衔打造，首个AI agent系统性基准测试问世》一则新闻引起了广泛的关注，来自清华大学、俄亥俄州立大学、加州大学伯克利分校的研究团队便提出了首个系统性的基准测试——Agent Bench，用来评估 LLMs 作为AI智能体在各种真实世界挑战和 8 个不同环境中的表现（如推理和决策能力）。

AI-Agent（AI智能体）火爆全网，它之所以能够成为一个越来越备受关注的方向，很多程度上是因为 LLM 为 AI-Agents的落地应用提供了可行的技术实现路线，其次是有很多 AI-Agents 相关的项目火爆出圈。

在6月份，Open AI的Safety团队的负责人Lilian Weng发布了一篇6000字的博客介绍了AI Agent，并认为这将使LLM转为通用问题解决方案的途径之一。

Lilian Weng现为OpenAI应用人工智能研究负责人，主要从事机器学习、深度学习和网络科学研究。

AI Agent（AI智能体）究竟是什么？

接下来，我们将根据这篇博客，总结一下关于AI Agent的相关内容。

所谓AI Agent，就是一个以LLM为核心控制器的一个代理系统。业界开源的项目如AutoGPT、GPT-Engineer和BabyAGI等，都是类似的例子。

LLM的潜力不仅限于生成精美的文稿、故事、文章和程序；它可以被框定为一个强大的通用问题解决者。也就是说，AI Agent本质是一个控制LLM来解决问题的代理系统。LLM的核心能力是意图理解与文本生成，如果能让LLM学会使用工具，那么LLM本身的能力也将大大拓展。AI Agent系统就是这样一种解决方案。

还没有了解AutoGPT，可以看看我的另一篇文章：AutoGPT是什么？ – rincky的文章 – 知乎 https://zhuanlan.zhihu.com/p/654020142

以AutoGPT为例，一个经典的案例是对大模型输入一个问题：找出一个投资机会。正常情况下，一个LLM是无法给出具体的操作的。

而AutoGPT的思路，是首先告诉LLM，这个问题LLM一般可以解决这个问题，给出几个选择，然后LLM会挑选一个方法，可能是浏览雅虎财经/谷歌等等，也可能是阅读某个文件（pdf），然后AutoGPT本身就可以根据选择的结果继续执行，这种执行可能是用谷歌搜索，也可能直接访问某个文件，但这些都是LLM无法做到的。

AutoGPT完成这些任务之后继续带上之前的记录发给LLM，继续询问新的解决方案。这就是一个简单的AI Agent的案例。

在这里，我举个简单的例子，去理解AI Agent（AI智能体）。

假设你计划一段舒适的旅程，你需要考虑到许多因素，例如目的地选择、交通方式、酒店预订、旅行活动等等。AI智能体就像是你的旅行顾问，它可以帮助你分解这个复杂的任务，为你提供周到的建议。

首先，它可以根据你的偏好和预算，帮你规划目的地选择。然后，它可以通过使用外部API来获取附加信息和功能，比如查询交通工具的时间表和票价、搜索酒店的可用性和价格等等。

AI智能体还可以通过短期记忆和长期记忆来学习和记住你的偏好和需求，这样在你下次旅行时，它可以更好地提供个性化的建议。

此外，AI智能体也可以通过自我反思来提供有效的解决方案。如果你对之前的旅行体验不满意，AI智能体可以从错误中学习，并在下次规划中避免类似的问题。

AI智能体就像是你的旅行顾问和助手，它利用规划、记忆、工具使用和自我反思等功能，帮助你更好地规划和执行旅行计划，提供个性化的解决方案，并让你拥有愉快的旅行体验。

AI Agent组成部分

Lilian Weng认为一个AI Agent系统应当包含如下图所示的几个部分：

1.规划（Planning）:

在AI智能体中，规划是预测和决策的核心。通过将LLM与优化的规划策略相结合，我们可以期望AI智能体能够面对复杂的情境并做出长远的决策，而不仅仅是短期的反应。

1.1 任务分解（Self-Reflection）:

任务分解说明了AI智能体在面对复杂问题时的方法。它不是盲目地解决问题，而是将问题分解为更小、更容易管理的部分，从而更有效地找到解决方案。

1.2 自我反省（Self-Reflection）:

自我反思是AI智能体持续学习和改进的关键。它意味着代理不仅仅是执行任务，还会思考其行为，了解其错误，并从中学习。

2.记忆（Memory）:

对于AI智能体来说，记忆不仅仅是存储信息。它是一个动态的系统，可以帮助代理理解过去的事件，预测未来的情况，并在新的情境中做出决策。与人类的记忆相比，AI智能体的记忆有可能更加精确、可靠，而且可以针对性地检索。

2.1 记忆类型:

文章中提到了不同类型的记忆，这些记忆可以是短期的或长期的。每种记忆类型都有其特定的应用和功能，使AI智能体能够在不同的情境中存储和检索信息。

2.2 最大内积搜索（MIPS）:

MIPS是一个关于如何高效检索信息的技术。在AI智能体的上下文中，这意味着当代理需要从其记忆中检索信息时，它可以更快速、更准确地找到相关的信息。

3.工具使用（Tool Use）:

智能体使用工具的能力强调了LLM不是孤立的。它可以与外部环境互动，使用工具来增强其能力。这为AI智能体提供了巨大的潜力，使其可以在特定的任务中超越其本身的限制。

整篇文章为我们提供了一个深入了解如何使用大型语言模型构建强大AI智能体的机会。这些AI智能体将具有复杂的规划、记忆和工具使用能力，能够解决和对应各种各样的复杂问题。

这意味着，未来的AI智能体将更像一个全面的多功能智能助手，而不仅仅是一个文本生成器。

今后我会分享更多类似有价值的观点，关注我，一起学习，一起成长！

文章参考：

1. Lilian Weng博客地址：https://lilianweng.github.io/

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

AI Agent（AI智能体）是什么？

n8n实战：Webhook、条件判断与API集成详解

谷歌太壕了！编程Agent大招至简：开源且免费，百万上下文、多模态、MCP全支持

老黄新鲜一刀，RTX 5050正式官宣

国产GPU历史性时刻！摩尔线程、沐曦同日获IPO受理

一张小卡片敢卖999？原来是智能体AI硬件

让AI主动干活，给你找服务，鸿蒙“6”啊

这个AI能救命！提前6个月发现胃癌病灶，突破医学影像认知，达摩院做成了

科大讯飞“AI+教育”再提速：学习机功能升级引领行业发展

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM | Transformer作者团队

多模态AI黑马刷榜后再造神器：一个产品搞定图片视频播客生成，自带百种特效，大牛梅涛团队出品