Top
首页 > 正文

专访人工智能科学家李世鹏:AI突破的方向何在?

这是一个变革的时代,人工智能正在从各个角落掀起一场新一轮的产业革命。
发布时间:2023-07-03 16:37        来源:赛迪网        作者:赛迪网

【赛迪网讯】当我们站在2023年的历史节点上,无论是向前展望还是向后回溯,我们都能明显感觉自己正处于一个剧烈变化的历史节点上。这是一个变革的时代,人工智能正在从各个角落掀起一场新一轮的产业革命。人们对这场科技升级换代既有恐慌,认为人工智能将抢走大量人类的工作岗位,为经济下行,竞争激烈的人才竞争市场雪上加霜。也有人充满期待,畅想着人工智能可能带来的无限新可能。

微信图片_20230703160547

IEEE Fellow、国际欧亚科学院院士、新一代人工智能联盟联合秘书长、粤港澳大湾区数字经济研究院(IDEA)讲席科学家李世鹏

近日,在2023全球人工智能产品应用博览会上,IEEE Fellow、国际欧亚科学院院士、新一代人工智能联盟联合秘书长、粤港澳大湾区数字经济研究院(IDEA)讲席科学家李世鹏接受赛迪网的专访,对人工智能的认知科学发展提供了自己的研究思考,对我们进一步理解这场人机矛盾与协作的未来加深了认识。

人工智能发展的三个历史阶段

李世鹏归纳梳理了人工智能发展的历史,划分出几个代表性阶段和各阶段对应的特征。

在上世纪五六十年代,人工智能进入了基于符号逻辑的推理证明阶段。在这个历史时期,科学家们做出了很多成果,包括证明数学原理的全部350条定理。但这个阶段的人工智能并不能真正处理复杂的现实问题,因为这个时期科学家更关注抽象的数学概念,但人类实际生活中的很多具体的事情需要用一个抽象的数学概念进行描述才能推理。如何将具体的现实事例与抽象逻辑连接起来,在当时存在许多盲点。

而到了上世纪七十年代,往后的二十多年里,人工智能则发展到了基于人工规则的专家系统阶段。在这个阶段里,科学家和行业专家做到了前人未完成的事业,通过标注规则建立了许多现实问题的抽象逻辑联系。但是这个阶段人工智能发展的方式仍然一个致命的弱点,那就是所有的规则不是科学家们能够穷尽的。

正因如此,人工智能在本世纪初期的2007年又迎来了深度学习浪潮。在这个新阶段里,科学家打开一个新的思路,只要拥有足够多的标注数据,在深度学习模型里,总能算出一个模型来。而在今天,数据标注已经不再局限于专家,普通的智力水平就可以做这个事,所以有大量的数据标注能进入到深度模型里面训练,造就了语音识别、人脸识别以及物体识别等一系列人工智能里突飞猛进的发展成就。

如何突破人工智能发展瓶颈

虽然深度学习大模型对人工智能带来了突飞猛进的成就,但并非没有缺陷,其最大的缺陷就在于在一个领域做好不会那么容易迁移到另外一个领域,所以对一个领域标注大数据的依赖性就变成它的瓶颈。研究者们也不断创新思路突破标注大数据瓶颈,比如通过算法的一些扩展,采用生产对抗网络(GAN)生成一些训练数据,亦或者把知识图谱与深度学习结合起来。但虽然取得一些进展,却仍没有解决根本问题。

另外,一些学者提出了因果学习框架来解决问题。因为我们今天的大数据深度学习实际上只利用了数据之间的相关性而没有利用事件的因果性进行训练。而我们为了发掘了数据的因果性,就可以对其中一些数据进行干扰,或者注入新的数据。让因数据一旦发生变化,则相关的果数据也随之发生变化,由此揭示数据之间的因果性。而因果数据越来越多,我们就可以利用某种程度假想的推理得到一些结论,就实现了更高层次的智能水平。

另一方面,还有一些科学家试图仿照人类的大脑的生物结构构建人工智能,用人造的神经元堆在一起仿照人脑做类脑人工智能。

李世鹏表示:“到今天为止,最大的类脑实际上还不足以跟人类的大脑相比,因为它需要的神经元比我们想象中复杂的多。”

从认知科学打破人工智能瓶颈

除了以上的尝试,今天的科学家还在认知科学方面提出了打破人工智能瓶颈的方法。这种方法最早由MIT的Josh Tenenbaum教授提出,他将人类的智能当做一个黑盒子。从人类认知的行为观察反推认知机理,对模拟机器人形成新的机器学习方法。这样用人类的方式扩展AI,就能让机器像人类一样慢慢生成智能,像婴儿一样开始,像孩子一样学习。

认知科学告诉我们,首先,人的智能有一部分是“生而知之”。新生儿的大脑不是空白,而是有一些与生俱来的脑神经的连接,也许是通过基因编码遗传下来的。这给我们的启示是,也许我们每次训练模型应该在已有模型的基础上开始,而不应该总是从零开始。

其次,人类认知能力大部分是后天学来的,“学而知之”,这给我们三个方面的启示。

第一是建立基础模型,大多数人类在5至7岁的时候,其基本的认知模型已经建立起来了,以后上学、中学、大学只是一个知识的积累,而基础模型则不会发生太多改变。这就意味着如果方法正确,人工智能也会很快得到一个收敛的基础模型。

第二是建设多模态的训练机理。这是打破以前的单一模态的深度学习,人类的学习是一种多模态的学习,涉及听觉、视觉、触觉、嗅觉等等。一个模态只能是一个片面的认知,人类只有把多模态组合在一起,才会形成对某个特定事物的全面理解。

第三是归纳。我们会从实际经历的观察中归纳出一些具有高层次的抽象的东西,人类的大脑不只是拥有记忆的功能。

最后是“习而知之”。对于一个具体的问题,我们会通过获得通用认知能力推导出更好解决这个问题的方法。即一个大前提就是通用的,小前提就是具体的,最后我们才能得出结论,这是典型的推理三段论。

李世鹏表示:“如今大模型捕捉的是利用巨大的数据集、巨大的模型参数获得一个普适性的模型,所以工作得更好。传统的深度学习往往从有限的标注数据中获取模型,但它永远学习到的是局部的知识,这是两者最大的区别。”

李世鹏表示:“目前GPT所作的事情,基本可以和人类认知科学对应起来。比如非监督学习的聚类能力本质上就是对具有共同属性的事物进行聚类,实际上就是抽象出事物的属性,也就是说具有了归纳能力。只不过这些归纳出来的结果还必须通过人类的有监督的介入(微调、提示等)才能与人类认知发生联系。”

不过,目前如GPT在内的人工智能在提供事实的能力方面仍然缺乏,因此其能力与人脑相比仍有很大缺陷。但可以预见,在不久的将来,很容易将与人类一样拥有记忆力,甚至远超人类的记忆能力与GPT结合起来,那时候超级人工智能可以跨越人机之间的巨大鸿沟,走向通用人工智能,为世界带来更大的震撼。

每日必读

专题访谈

合作站点