编者按:目前 AI 被笼统划分为“弱人工智能”、“强人工智能”、“超人工智能”三个类别。甚至在很多业内专家(比如洪小文)眼中,只有“强”、“弱”AI 的区别,因为“超人工智能”离我们实在还很远,难以捉摸。这样的笼统分类显然不利于大众对于各项 AI 技术进行认识和理解。因此,一些专家开始提出基于技术难度和 AI 智能水平的分类、分级方法。其中,美国学者 Arend Hintze 提出了对 AI 的四级分类, 而最近,Intuition Machine 联合创始人 Carlos Perez 又提出了针对深度学习的五级分类。这些分类方法对各层次 AI 技术进行了简单的归类,有助于初学者更好地认识 AI 。
上个月,密歇根州立大学副教授 Arend Hintze 发表了一篇很有价值的短文章《理解 AI 的四种类别:从响应式机器到有自我意识的存在》( “Understanding the four types of AI, from reactive robots to self-aware beings” )。文中,他提出了对 AI 的四级分类:
响应式
这是最基本的 AI 类型,无法产生记忆,不能利用过去的经验做决策。它们是“专才”而非“通才”,为完成特定任务所设计,不能胜任其他任务。
有限记忆
当前行为能够参考刚刚发生的事件。但记忆是瞬时的——无法用于未来决策。
心智理论( Theory of mind)
这是一个心理学术语,意思是能根据他人行为,推导、并理解他们的想法和动机。这一类型的 AI 能够归纳出周围环境、和与之交互的其他代理的“表征”( representations,AI 术语,详见“表示学习”)。
自我意识
AI 的终极课题。目前对于它的描述大都是猜想。
对此,AI 专家 Carlos Perez 表示,他喜欢这个四分类法远远超过目前广泛使用的“强人工智能 vs 弱人工智能”二分类法(ps:或者再加上“超人工智能”成为第三个类别)。Arend Hintze 的方法把弱 AI 分为三个类别(响应式,有限记忆,心智理论),这给了我们更多概念,来区分不同的 AI 应用。但 Carlos Perez 又评论道,该分类法似乎来自于 “GOFAI” 思路(老式 AI),潜台词是它已经过时了;另外,从有限记忆、能够使用部分过去记忆做决策到心智理论,这步子迈得太大了。
于是,Carlos Perez 提出了他自己的 AI 分类方式,按能力把 AI 划分为五个级别。他表示,该分类法主要针对深度学习,希望对 AI 从业者来说更细致、更有用。它能帮我们看清楚 AI 目前在哪个阶段,以及将来会走向何方。
Perez 表示:“对当前 AI 技术进行评估,我们缺少一个好的概念框架。这可能只是由于大多数 AI 评论人无法跟上最新的深度学习进展——需要读的东西太多,而且最新发现不停刷新我们现在对 AI 的理解。”
我们来看看 Perez 针对深度学习能力的 AI 分类:
该级别包含全连接神经网络( fully connected neural network ,FCN),卷积神经网络(convolution network,CNN)和它们之间的各种组合。这些系统把一个高维度矢量作为输入,得到单个结果,一般是对输入矢量的分类。
你可以把这些系统看成无状态函数,意味着它们的行为只是一个针对当前输入的函数。一个热门研究领域——生成模型,就属于该类别。简单来讲,这些系统凭它们自己是十分强大的。
这个级别包含 “C 层”网络中整合的记忆因素。LSTM 就是一个例子:记忆单位嵌入在 LSTM 节点中。其它类似的变形还有,神经图灵机器 (NMT) 和 DeepMind 的可微分神经计算机(DNC)。在对行为进行计算时,这些系统会维持状态恒定。
该级别与 CM 有些相似。但 C 层网络能获取的信息不是原始内存,而是符号化的知识库(symbolic knowledge base)。雷锋网获知,事实上 Carlos Perez 就发现了三种符号化整合:1. 转移学习方式( transfer learning approach);2. 自上而下方式 ;3. 自下而上方式。第一种方式用一个符号化系统作为正则化矩阵(regularizer)。第二种方式在神经表征底层的最上层加入了符号化元素。第三种方式跟这相反,C 层网络直接与符号化知识库关联。
在这个级别,系统直接建立在 CK 之上,但是,它已能够使用不完美的信息做推理。这类系统的代表是 Alpha Go。只是 Alpha Go 采用的不是 CK 而是 CM 级别的能力。正如 Alpha Go,这类系统能通过与自身的对抗模拟来训练自己。
这个级别和 Arend Hintze 的“心智理论”类别十分近似,多个代理神经网络联合起来解决问题。这些系统被设计来完成多项目标。我们其实可以在对抗网络中运行它的原始版本:与判别器和生成网络一起学习归纳。在博弈论驱动的、能战略战术性解决多重问题的网络上应用该概念,就能得到高度灵活的系统。但是,我们现在还达不到这个水平,前面那些级别仍需要很多研究来完善。
每一层级别,都带来了上个级别没有的新能力。比方说,C 层系统只能预测反因果关系(anti-causal relationships)。 CM 级别的系统能完成不错的翻译。CIK 级别系统能玩战略游戏。
我们可以看出,除了没有“自我意识”级别,这个分类法和 Hinzte 四级分类高度相似。在这些“基础”级别全部达到之前,Carlos Perez 不准备探讨自我意识。这个分类同样没有提到零样本学习(zero-shot learning)、一步学习(one-shot learning)或者无监督学习。据雷锋网所知,后者仍然是 AI 基础挑战之一。正如 大牛 Yann LeCun 所形容:
“假设机器学习是一个蛋糕,强化学习是蛋糕上的一粒樱桃,监督学习是外面的一层糖衣,无监督学习则是蛋糕糕体。我们知道怎么做糖衣和樱桃,但不知道怎么把糕体做出来。”
在最近的演讲里,Yann LeCun 开始用预测学习(predictive learning)来替代无监督学习。这是一个很有意思的转变:它展示出 LeCun 在如何做蛋糕这个问题上,观点发生了微妙变化。在他眼里,这是 AI 技术大幅进步所必需的基础。换句话说,在建设好预测学习的地基之前,在现有监督学习的基础上加入更多记忆、知识库、协作代理这些能力会十分困难。
雷锋网获知,在最近的 NIPS 2016 大会上,LeCun 展示了这幅 PPT:
这列出了 AI 进步的主要障碍:
机器需要学习世界运作的方式
AI 要学习海量背景知识
机器需要能够感知环境的状况
机器需要更新并记忆环境的状况
机器需要学习和计划
智能和常识等于:感知+预测模型+记忆+推理和计划
这些能力在反馈回路里用到时,都利用了加速器技术。我们其实在现在的研究中看到过这类元学习(meta-learning)或是学习优化(learning to optimize)。元学习技术带来的主要启示是:当我们能训练机器找出用其它方法找不出的解决方案,研究方法会变得更强大。
这就是为什么,即便深度学习研究有许多难题,我们也无法确定技术进步的速度。但在预测学习领域发生重大突破之前,Perez 的五级分类法应该已经够用了。至于 AI 业内人士如何看待这个新提出的分类法,雷锋网会继续关注。
雷锋网
本文由威海网络公司半岛科技转载整理2019.02.26