6G、大模型、卫星互联网的深入研究,正在成为数字技术和数字产业的新赛道,事实上也在给数字经济和数字化发展开疆辟土。抛开具体的科学技术,如何从融合、产业和生产关系的角度来认识这些研发现象呢?
Q:在当前数字经济背景下,九章云极作为国内人工智能领域领先企业,在AI基础软件供应商角色上是如何自我定位的?
A:AI基础软件供应商是九章云极的一个核心定位。对于基础软件大家可能并不陌生,特别是经常接触操作系统、办公软件的人。基础软件是一个宽泛的概念,在芯片设计领域有EDA软件帮助完成芯片的设计,在工业领域有CAE、CAD等软件进行工业设备的制造设计。企业利用这些软件对某个行业里最核心的资产进行设计、开发。而人工智能的模型也需要进行开发、运行和管理。所以AI基础软件包含了一整套AI平台和软件工具,让企业、政府客户可以对AI模型进行开发、应用和管理。
Q:您认为AI基础软件作为硬核科技的重要赛道,在数字经济发展中将会扮演什么样的角色?
A:我认为当前数字经济已经成为国民经济的重要组成部分。近期,我看到一份数据,122万亿元的GDP里,数字经济产生的GDP占到了50万亿元。在数字经济当中,有一个重要的新基建叫做算力建设。在当今社会中,我们需要大量的算力,这主要来自对智能化的需求。我们需要从数据中构建大量的模型,提供智能化的决策流程和工作流程。这些算力消耗最终都要体现在模型的开发、管理和运用中。这些也都离不开九章云极提供的AI基础软件。
如同你买了一台电脑用来办公,你必须要有一个操作系统或一个办公软件才能达到办公的目的。在各行各业的智能化过程中,基本逻辑是相似的。所以在数字经济的发展中,智能化是最重要的推动力量。大量的算力投资最终要转化落地成各行各业真正的效能提升,离不开基础软件面向客户所需要的最终场景应用,更好地把算力利用起来。AI基础软件既是数字经济的必需品,也是数字经济的助推剂。
那么,九章云极在数字经济背景下又该如何布局呢?中国发展数字经济有其鲜明的特性。比如西方的一些国家以服务业为主,他的先进技术运用在金融、法律、制药等行业服务更为明显。而我国制造业非常雄厚,政府也强调推动实体经济发展。因此,智能化在我国不仅要为一些IT基础比较先进的金融、通信等行业服务,还要考虑为庞大的制造业产业升级服务。所以,九章云极推出的AI基础软件在一些核心关键领域的大型制造企业,特别是央企的一些龙头企业都有广泛布局。
Q:在ChatGPT大模型AIGC火爆的背景下,您如何看待大模型发展趋势,当前大模型的开发应用存在哪些挑战?
A:ChatGPT大模型AIGC的火爆确实成为整个行业巨大的推动力量。当前大模型的发展应该用百花齐放来形容。我觉得还是可以得出一些基础性的判断,虽说有点儿乱花渐欲迷人眼,但我们还应分析大模型的终局是出现一到两家垄断还是出现多家并存?
从现在的角度来看,大模型不太可能出现一两家对所有行业、所有场景的垄断,而更可能是各个行业出现垂直类的大模型。根据不同的行业数据,建立各自的优势和壁垒。不同的场景利用大模型技术赋能各自的行业。当前,大模型有着非常多的发展路线,我认为算力的发展会让成本下降。长期来看,硬件提供的算力也会同质化,软件的效率会成为模型最终控制成本和效率的关键点。
九章云极与大模型之间是否存在联系呢?我们的目标是让“云中云”战略与大模型相结合。“云中云”战略就是把九章云极的核心产品嵌入到各个云的服务厂商当中,最终实现An AI Cloud in the Clouds。在数字经济新基建当中,由三股力量来推动。第一个是算力建设,第二个是大模型建设,最后一个是央企云的建设。在过去的两年中,发生了一个很大的变化。原来以互联网公司为首的公有云服务厂商正在慢慢让出部分市场份额,比如中国电信的天翼云、中国移动的移动云。央企从各条业务线构建自己的云服务。央企云的建设也代表了我们国家云计算产业运营进入新的阶段。九章云极也积极地参与这个过程,把大模型的技术通过云的形式覆盖千行百业。
Q:在产品线扩展的路线和规划方面,如何结合当前大模型做整体的战略和决策?
A:以前,九章云极DataCanvas产品家族是让客户可以自主地做小模型。现在大模型时代,在技术方面又需要有一些新变化。除了构建模型的需求,还要基于一个大模型,针对行业情况进行调优。并非每一次都从零开始建构自己的模型,而是从以前造模型、用模型变成了调模型、用模型,当然也有部分龙头企业拥有自主的大模型。
当前,九章云极的技术栈以及产品线会做进一步的丰富和整合,形成不同的产品包,以适应不同的客户需求。小模型拥有成本优势,迭代更快。未来,九章云极会提供大+小的模型组合,大模型的基础模型加上扩充的一系列模型服务,我们称之为Model and Service。
Q:如何看待人工智能新技术对行业的影响?
A:大模型的发展对于基础软件是一个非常大的推动力量,在大模型发展过程中,基础软件会越来越成为决定因素。虽然硬件、算力是基础,但算力在未来同质化现象会越来越明显。在软件层面,效率和成本的决定权就会越来越大。因此,基础软件需要继续进行创新,进一步给大模型的算法进行各种优化。
我们都知道,大模型是基于Transformer算法,人类发明它的时间并不久,依然存在大量的优化空间。基于Transformer的专用芯片也会不停地出现,这都会让大模型的成本降低。
另外,大模型的发展趋势将是多模态,不只是对文本和图片进行建模,对传感器数据也可以进行一体的模型建模。多模态对以前的基础软件提出了新的算法融合需求,在训练中因为多模态导致了输出训练数据更加难以获得,因此会产生一些新的工具,如ChatGPT。它们是从互联网上获取数据集然后进行训练,而不是依靠自然获取数据进行训练。利用大模型先去生成数据,再在生成的数据上进行训练,在今天的自动驾驶里面已经开始使用相关的技术了。
方磊,毕业于清华大学、Syracuse University 电子工程及计算机系(EECS)硕士、Virginia Tech 电子及计算机应用系(ECE) 博士。原微软必应(Bing)搜索部门数据科学家,并作为早期团队成员参与开发微软云计算平台:Windows Azure。拥有20年大数据分析管理经验,是大数据、机器学习前沿技术掌舵者。在分布式系统、设计验证、算法等领域发表论文19篇,引用超过700次。