当前生成式模型主要用于内容创作和信息筛选。然而,最近关于AI智能体(能够独立参与用户定义目标的实体)的研究和讨论表明,通过为AI提供类似于1990年代互联网的经济通道,我们可能会看到AI的实质性进步。
为了实现这一目标,智能体需要能够代理它们可以控制的资产,因为传统的金融系统并不为它们设置。这正是加密货币发挥作用的地方:它提供了一个数字化支付和所有权层,具备快速结算能力,特别适合用于构建AI智能体。
在本文中,我将向您介绍智能体及其架构的概念,研究中的案例如何证明智能体在超越传统LLM方面具有新兴特性,并探讨在基于加密货币的智能体构建解决方案或产品的项目。
什么是智能体?
AI智能体是由LLM驱动的实体,能够规划和采取行动,通过多次迭代实现目标。
智能体架构
智能体架构由单一智能体或多个智能体组成,共同解决问题。
单智能体架构:一个语言模型独立执行推理、规划和工具执行,尽管没有来自其他智能体的反馈机制,但人类可以选择向智能体提供反馈。
多智能体架构:涉及两个或多个智能体,每个智能体可以使用相同或不同的语言模型和工具。智能体可以单独或协同使用工具,通常每个智能体都有特定的角色。
智能体架构的配置文件
智能体具有配置文件或角色,定义了提示的特定应用和行为对LLM输出的影响。这可以通过以下方法实现:
手工制作:人工指定的配置文件,灵活但耗时。
LLM生成:由LLM生成的配置文件,包含围绕组成和属性的规则集,有时包含少量示例样本。
智能体架构的记忆
智能体的记忆存储并利用从环境中获取的信息,用于制定新的计划或行动,使智能体能够根据经验自我进化和行动。这可以通过以下方式实现:
统一记忆:类似于通过情境学习或持续提示实现的短期记忆。
混合记忆:结合短期和长期记忆,短期记忆是当前状态的临时缓冲区,而长期记忆则永久存储在数据库中。
智能体架构的规划
智能体将复杂任务分解为更简单的子任务来解决。
无反馈规划:智能体在执行行动后不接收对未来行为有影响的反馈。
带反馈规划:智能体根据外部反馈迭代地细化子任务。
智能体架构的行为
行为将智能体的决策转化为具体结果,可以包括任务完成、通信和环境探索。
智能体架构的能力获取
智能体必须具备特定任务的能力才能在动作空间内正确执行动作,主要通过以下两种方法实现:
微调:在人工标注、LLM生成或真实行为数据集上训练智能体。
无需微调:通过复杂的提示工程和/或机制工程使用LLM的先天能力。
文献中的智能体案例
这些案例展示了不同应用场景中智能体的应用:
生成式智能体:在虚拟环境中模拟人类行为,例如a16z AI Town的实现,展示了多智能体系统的社交行为。
描述解释计划选择(DEPS):能够完成多达70多项Minecraft任务的零样本多任务智能体。
Voyager:Minecraft中首个由LLM驱动的体现终身学习的智能体,能够不断探索并学习新技能。
CALYPSO:设计用于游戏“龙与地下城”的智能体,协助创作和讲述故事。
Minecraft中的幽灵(GITM):能够完成游戏中任务的智能体,例如挖掘钻石。
SayPlan:基于LLM的机器人大规模任务规划,能够执行长期任务规划。
HuggingGPT和MetaGPT:分别用于执行多种挑战性任务,如语言、视觉和其他复杂任务。
ChemCrow:用于化学任务,如有机合成和药物发现的LLM化学智能体。
BabyAGI和AutoGPT:通用基础设施示例,用于创建、确定优先级和执行任务。
加密中的智能体示例
这些示例展示了智能体如何在加密领域中发挥作用:
FrenRug:基于GPT-4的智能体,用于推广土耳其地毯的游戏,通过链上节点投票决定智能体购买的提案。
Autonolas在Gnosis上的预测市场智能体:用于预测市场的智能合约包装器,通过监控和分析市场实现预测。
ianDAOs GPT<>Safe演示:使用syndicateio交易云API在Safe多重签名钱包上自主管理资产。
游戏智能体:在游戏环境中执行各种角色,如店主、旅行商人和任务提供者。
Safe守护天使:用于监控和防御钱包安全威胁的智能体。
Botto:链上艺术家的智能体,作品通过投票决定并在市场上销售。
值得关注的智能体项目
这些项目展示了正在关注的智能体应用:
AIWay Finder:去中心化知识图谱,提供区块链生态系统的虚拟路线图,用户通过识别智能体使用的路径获得奖励。
Ritualnet:用于设置多智能体架构的推广节点。
Morpheus:点对点网络,代表用户执行任务。