OpenAI 大神 Karpathy 最新分享:为什么 OpenAI 内部对 AI Agents 最感兴趣

品玩   2023-06-26 20:56:52

Andrej Karpathy 这位 OpenAI 联合创始人最近在一个开发者活动上发表简短讲话,谈论了自己和 OpenAI 内部对 AI Agents (人工智能代理人)的看法。

Andrej Karpathy 对比了过去开发 AI Agent 的困难和现在新技术工具下开发的新机会,他还不忘调侃自己在特斯拉的工作,是 " 被自动驾驶分了心 ",他认为自动驾驶和 VR 都是糟糕的 AI Agents 的例子。


(相关资料图)

对于新的机会,Andrej Karpathy 认为此刻正是再次回归神经科学,从中寻求灵感的时刻——正像在深度学习早期发生的那样。

另一方面,Andrej Karpathy 认为普通人、创业者和极客在构建 AI Agents 方面相比 OpenAI 这样的公司更有优势,大家目前处于平等竞争的状态,因此他很期待看到这方面的成果。

他还透露,如果一篇论文提出了某种不同的训练方法,OpenAI 内部的 Slack 上会嗤之以鼻,认为都是他们玩剩下的。但是当新的 AI Agents 论文出来的时候,他们会认真兴奋的讨论。

以下是此次分享全文:

大家好。

我受邀就 AI Agents 的话题说一些激励的话。我认为 AI Agents 在某种程度上跟我是很近的关系,让我以一个故事开始,这是一个非常早期的 OpenAI 的故事,那时 OpenAI 可能只有十几个人,在 2016 年左右,当时的潮流实际上是 RL Agents(强化学习代理人)。

每个人都对建立代理人非常感兴趣,但在当时主要是基于游戏,人们的兴奋点围绕着像 Atari 这样的游戏公司,而我当时在 OpenAI 的项目试图将 RL Agents 的重点放在用键盘和鼠标使用电脑上,而不是游戏。

我想让它们变得更有用,可以做很多工作,这个项目被称之为 World of Bits。

我和几位同事最后发表了一篇论文。这不是一篇非常惊艳的论文,因为实际上这是基于 RL 强化学习方法的。我们的网页非常简单,上面可以让人比如预定一个航班或者订购一些食物等等。

这一切显然是行不通的,因为技术还没有准备好,在那时做这些东西是不明智的。

事实证明,应该完全忘记 AI Agents 这件事,去做语言模型。

五年之后我们回到这里,期间我被自动驾驶分了一点心,但现在 AI Agents 重新酷了起来,而我们的工具箱完全不一样了,我们处理这些问题的方式也完全不同了。

事实上,你们所有人都在研究 AI Agents,但你们可能没有使用任何强化学习方法。这太疯狂了,我不认为我们当时会预见到这一点。这简直太有趣了。

下面我花一点时间谈谈为什么 AI Agents 如此火爆。我想很明显,对很多人来说,AGI(通用人工智能)将充分利用 AI Agents 的能力,不是一个,而是很多个。也许将会出现数字实体的组织或文明,我认为这是非常鼓舞人心的,甚至有点疯狂。

不过,我也想为此泼点冷水。 我认为有一大类问题很容易想象,很容易构建、演示,但实际上很难制作称为产品。很多事情都属于这一类,比如我想自动驾驶就是一个例子。

自动驾驶很容易想象,也很容易构建汽车绕街区行驶的演示,但将其变成产品需要十年时间。同样的道理,我觉得 VR 也是如此,让它发挥作用需要十年时间。

我认为 AI Agents 某种程度上也是如此。很容易想象它的场景,非常激发人的兴奋感,但我认为如果你参与其中,你应该投入十年时间来让它真正发挥作用。

我想说的另一件事是,我认为现在回到神经科学并在某些方面再次从中获得灵感是很有趣的,深度学习的早期阶段就受到了神经科学的启发。

思考它们之间的关系是非常有趣的,特别是我认为很多人都把语言模型当作解决方案的一部分,但如何构建一个完整的,拥有人类所有认知能力的数字实体呢?

显然,我们都认为我们需要某种潜在的系统来规划、思考和反思我们正在做的事情,这是神经科学发挥作用的地方。

比如,海马体是非常重要的,AI Agents 中什么东西发挥着海马体的作用,用来实现储存记忆,标记检索等等这些功能?

我们大致已经了解如何构建视觉和听觉皮层,但还有许多的东西我们并不知道在 AI Agents 中意味着什么。

比如视觉游戏在 AI Agents 中是什么样子的?潜意识的所在地——丘脑在 AI Agents 中又相当于什么呢?

这非常有趣。事实上我今天带了一本神经科学的书,David Eagleman 的《大脑与行为》,我发现这本书非常有趣和有启发性。

从神经科学中汲取一些有趣的灵感,就像早期我们设计单个神经元时所做的那样,今天我们也许应该再次这样做。

最后我想用一些鼓励的话结尾。一个有趣但不明显的事情是,你们(指现场观众)构建的 AI Agents 实际上处于当代 AI Agents 能力的最前沿,所有的大型 LLM 机构比如 OpenAI、DeFi 等,我怀疑他们都没有处于最前沿。

你们正处于最前沿。

举个例子,OpenAI 非常擅长训练 Transformer 大语言模型。如果一篇论文提出了某种不同的训练方法,那么我们 OpenAI 内部的 Slack 群组里的讨论会类似于,哦是的,有人在两年半尝试过,它不起作用,我们对这种方法的来龙去脉非常了解。

但是当新的 AI Agents 论文出来的时候,我们都非常感兴趣,觉得它非常酷,因为我们的团队并没有花费五年时间在这上面,我们并不比你们更多掌握什么,我们正在与你们所有人一起竞争。

这就是我为什么认为你们处于 AI Agents 能力的最前沿的原因,这对 AI Agents 的发展来说是非常重要的。

资讯