为什么今天你还可以做agent产品?
当你有Codex/Claude Code的时候,为什么你还是应该/可以做agent产品?理论上,你的agent产品能做的,Codex/Claude Code都能做。特别是,当你的agent产品实际上都是Codex/Claude Code写出来的时候,你可以很容易提出一个抽象推论:即便你做的这些产品,somehow增加了某种价值,因为你是Codex/Claude Code写出来的,难道他们不可能完全动态的根据用户意图生成出来吗?即便今天还有某种技术上的限制,但是这显然是原则上成立的,那么为什么你还可以/应该做自己的agent产品呢?而如果你要做agent产品,它应该具备什么样的基本形态?
我想这是一个非常深刻的问题。
我是这么想的:产品的本质,不只是实现客观世界(不管是数字世界还是原子世界)的功能组合,它首先是人(的意识)通往“客观世界”的接口,这意味着它首先是概念,是一个我们的认知用来组织我们生活和活动的工具,例如“数据分析”,数据分析并不是一个客观世界的范畴,它是一个认知组织的范畴,因为客观世界并没有办法界定什么是数据分析,数据分析基本上是算术、逻辑、统计学和机器学习在我们的意图组织下的组合,对这种观念活动的打包,就是一种观念产品,在什么意义上叫观念“产品”呢?因为人们会说,做一下“数据分析”,用“数据分析”支持一下决策,我们的思维在把它作为一个工具去调用。
当我们有这样的观念产品,我们就在现实世界物化它。最简单的数据分析产品是表格,这个产品最初仅仅是一个观念形式,就是把信息按照格子去编排,让同一列和同一行共享某种语义,that’s it,这就是UI的基本形式(最初它是在纸上),然后围绕这个基本形式,人们给它附加种种功能,自动化、简化围绕表格的基本功能,从而创造了历史上最伟大的软件:Excel,Relational Database etc。我说这些的意思是什么呢?如果我们从今天往回看,我们容易把这些产品看作表格上面的功能,但是在最基本的层面,这些产品在最底层的意义上,首先表格本身,我们要有这些产品,首先不是因为我们要完成这些任务,而是因为人按照表格的形式组织自己对世界的认知!正是因为我们的思维调用表格这个形式来做一些事情,围绕表格的那些观念形式和物理功能才涌现出来。
数学、统计学、逻辑这些更通用的工具在某种意义上容纳了数据分析,但我们仍然需要数据分析。我们需要有一个观念工具,来组织特定上下文中的特定任务集合,没有这个工具,我们甚至不能够大致地理解和沟通我们要做什么。这就是为什么人类组织中存在数据部门,而软件产品中存在“数据分析”产品 — 当然,软件产品的粒度要比数据分析还小一些,这是过去物理世界能力的限制。今天我们的物理世界演进到了agent世界,它使得独立于人的物理世界,很大程度上可以端到端的完成一些智能任务。那么我们就会提出这样的问题:
还有agent产品吗?如果我们把agent理解为达成人意图的工具,那么它将在多大程度上“端到端”?是越“端到端”越好吗?它还有某种领域划分的存在吗?还是one agent for everything ? chatbot是它的基本形式吗?
我认为这些问题都是非常难的问题,回答这些问题我们需要两个方面的知识,一方面是人类观念形式的知识(与其说知识,不如说理解),所有我在上面的论述,都是为了说明产品首先是一种物理世界和观念世界沟通的接口,是对人如何认知和操纵世界的设计,因此,理解人,是理解这些问题的第一个方面;第二个方面是世界的物理约束,例如我们问多大程度上“端到端”,这显然和ai的能力有关,agent产品的基本形式,也和ai的能力有关,例如,今天的数据分析agent产品(例如data copilot)不以显式表格作为基本的产品形式,是因为ai的动态UI生成能力很好,它可以随时在问答中生成表格UI,这些都会改变产品的设计和产品的边界。
基于我的理解,以下是我对这些问题的回答:
首先,今天还是会有agent产品,明天也会有,更远的以后会不会有?我不知道。
为什么会有呢?
第一,赋予agent一个名字,一个领域的边界,它首先是一种认知接口。我们做的Data Copilot就是这样,它给了一个概念,一个场所,让用户去做他们脑袋中已经认知到的“数据工作”。在这个意义上它是一种品牌和观念复用。就像我们去便利店说买可乐,不会说买甜水,我们甚至不再产生买甜水的念头,因为可乐是一种有效的、成功的认知压缩。Data Copilot也是,你的一天从Data Copilot开始,你很清楚你要做什么,这个名字已经给了你的思维一个边界,一个形状,从另一个通用agent开始,你则需要自己给你的思维一个边界,一个形状,这不是多数人类被设计的工作方式。
第二,通用agent有所有的能力,也就意味着它有所有的perspective,它工作在一个更大的任务空间,这意味着当我们需要它做“数据分析”或者其他特定任务的时候,我们需要为它提供额外的上下文。而领域agent,就是预先定义的任务空间(一组相对有限的任务),预先定义的角度,预先定义的UI形式,我们把这些叫做领域agent的UI,没有这个UI,用户也必须要ad-hoc的想象和发明这些UI,这是不工作的,也是低效的。这里我可以举出很多例子,在Data Copilot上用户问的每个问题几乎都是例子,它们在一个通用agent上一定会有一个不同的回答,而这个问答,在模型能力相等的情况下,几乎总是更偏离用户意图的。在最基本的层面上,用户也几乎总是要去界定通用agent要怎么展示数据,怎么做可视化,怎么组织数据相关的信息 —— 这些当然是可以做的,但是它将是很多工作,而当用户做完这些工作的时候,它实际上就是on-the-fly的构建了一个数据分析的agent,这个agent在其他任务上又表现出用户不想要的UI。
因此,as far as data analysis这个概念本身还存在于人的脑子和人类组织,data agent这个产品是成立的,当然,它未必需要是独立的产品,但它一定是产品结构里面不可规约的一部分,因为人的思想里还没有规约这个观念。
这些UI看上去是trivial的,实际上正是今天用户使用vs不使用某个agent产品的gap。例如,Data Copilot做了非常好的Asana和Slack集成,你可以在你现在工作的地方,最近的地方引入数据分析能力,看上去make sense对吗?实际上用户从这些地方使用的很少,包括我自己,我宁愿去浏览器打开Data Copilot,把Asana链接粘贴过去,也很少直接在Asana用Data Copilot。首先是认知路径上的负担,我们的大脑并不是喜欢最短的操作路径,我们喜欢的是最短、最确定的认知路径。同时也有UI的因素,有的人不用Slack/Asana是因为他们显示不好表格和图表,一些小的UI差异,really matters。
第三,我曾经指出,领域智能=通用智能+领域知识+能力集合。领域知识的生成和组织、能力集合的构建和orchestration,是领域相关的,这是agent产品需要被构造的第三个原因。
参考我的文章:
https://blog.dreambubble.ai/posts/from-agent-to-domain-intelligence-a-self-evolving-knowledge-engine
https://blog.dreambubble.ai/posts/environment-as-a-service-agent-as-the-interface
简单来说,所谓领域智能,就是通用智能不能开箱就做好的任务集合,而通用智能和领域智能之间的gap,就是领域知识和能力集合。我在SEKE这篇文章中指出:自演化知识引擎(SEKE)是领域智能在知识问题上的答案,这当然是我的个人观点,但是我想所有人都会同意我的领域智能=通用智能+领域知识+能力集合的公式,同时同意,领域知识将按照领域知识的方式组织,那么领域知识作为一种基础设施将是存在的,as far as该领域存在,当然,为了完成领域相关的工作,agent还需要一组能力,例如对于数据agent来说,需要访问数据库的能力,访问数据仓库的能力,访问数据管线的能力等等,能力和知识打包在一起,就是领域智能的基础设施,不管我们是不是用UI暴露它,它都需要存在并被调用,这在一定的意义上也叫做产品。
因此,我认为今天和明天还会有agent产品,我这里说agent产品,就是说领域agent产品。
关于UI的形式。很远的未来,我不知道,今天和明天,我想chatbot是最基本的形式,因为chatbot是几千年来对人类来说最自然的组织沟通的形式,它满足了持续性和上下文的隔离,也非常自然的符合人类认知有context window这个基本事实。另一种思路是用人类协作的模型去构建agent matrix的UI,这样它就可能长得像某种任务管理平台或者工作流平台,但我不会bet on这个方向,我认为这些orchestration并不具备长期的产品价值,因为产品最终是关于人的,而不是关于物理世界本身的,就像HTTP,TCP不是产品一样,agent orchestration本身不是产品,尽管它可能是重要的基础设施。
最后,agent端到端的程度,则决定于人类能在什么端到端的程度上verify它。我的猜想是,它可能在短期不像我们想象的那么端到端,例如在数据分析任务上,我们恐怕不能指望“帮我对这个问题做分析,决定下一步”,因为这种端到端的任务,不只是智能问题,还是组织意图的问题,同样的问题,同样的数据,在不同的上下文(组织背景)下,人们期待的结果可能完全不同,而组织意图流动到人工智能是困难的,这就导致这个时代的agent更多的会是执行者,而不是主导者。
这个问题会不会改变呢?我想,新一代的组织和产品可能会改变,因为新一代的产品和组织,在开始的时候就会按照如何让AI得到全部的上下文来做端到端优化来设计,这种范式革命,就是消灭旧领域,创造新领域的革命。而在新的领域中,我们就会看见新的产品形态,我们今天当然不知道那是什么,但那一定非常不同,不同到只有今天我们认为错的东西,才可能在未来是对的。