那么,人工智能代理的真正定义是什么?
人工智能代理究竟是什么?它仅仅是一个能访问外部API的大型语言模型(LLM)吗?
答案是:差不多。 我们所说的AI代理,主要指基于LLM的代理。想象一下ChatGPT这样的通用LLM,但并非直接使用,而是为其配备各种工具来增强其能力。
例如,询问ChatGPT明天的天气。LLM本身无法回答,因为它无法实时访问天气数据。但如果我们提供一个工具(例如,一个接受日期和位置作为输入并返回天气信息的API),它就能检索并显示这些数据。这就是LLM利用外部工具的例子。
这些工具可以是任何代码,例如天气API、计算器,甚至复杂的数据库查询。ChatGPT Search就是一个实际例子,它作为一个代理,使用专用工具搜索网络并返回结果。
更进一步,一个工具本身也可以是另一个AI代理。这就产生了代理递归调用其他代理的可能性,每个代理都利用其他代理的优势。 真正的挑战在于设计有效的架构,在这些代理之间合理分配任务,确保它们在项目中无缝协作。
如何开始构建AI代理?
从头开始,至少目前是这样。尽管大部分代码已整合到库和可复用函数中,但AI代理开发仍处于早期阶段。
一些初创公司提供可集成到项目的闭源工具市场(例如AssemblyAI或LangChain的工具集),如果您需要更大的灵活性,GitHub也是一个不错的选择。像mkinf这样的平台正在兴起,通过托管可通过API调用的定制工具来填补这一空白。
框架的作用是什么?
LangChain和Haystack等框架简化了AI代理有效运行所需的复杂编排。它们就像粘合剂,将所有组件连接在一起。构建AI代理实际上是在创建一个需要处理多个任务的系统:连接工具、管理工作流程、跟踪对话,有时甚至需要连接多个代理。这就是框架发挥作用的地方。
AI代理的未来
AI代理是一个充满活力且快速发展的领域。它们有望实现一定程度的自主性和适应性,从而改变我们与技术互动的方式。从自动化复杂工作流程到实现系统之间更高水平的协作,可能性似乎是无限的。
无论您是好奇的开发者、希望集成AI代理的企业,还是仅仅对这个概念感兴趣,现在都是参与的最佳时机。这个领域还很年轻,塑造其未来的机会非常多。
关注mkinf的X账号或加入我们的Slack社区,不错过后续精彩内容。