人工智能技术对推动经济社会数字化转型具有重要意义。近年来,以ChatGPT为代表的生成式人工智能进入人们视野,ChatGPT推出仅2个月,全球月活跃用户数量就突破1亿。凭借深度学习和语言交互优势,生成式人工智能技术正创新应用于政务、教育、金融、医疗等领域,国内更是出现“百模大战”。文心一言、通义千问、携程问道等各类通用、行业、垂直大模型不断涌现,带动国内算力、数据、模型等行业发展,为推动生成式人工智能的创新应用提供动力支撑。
数字政府建设是我国推动国家治理体系和治理能力现代化的重要抓手,与大数据、人工智能、区块链等数字技术紧密相关的“一网通办”“一网协同”“城市大脑”等新模式已经成为数字政府建设的重要成果,数字技术与政务业务的融合正成为政府数字化转型的共识和发展趋势,2022年印发的《关于加强数字政府建设的指导意见》更是将推动政府决策科学化、社会治理精准化、公共服务高效化作为2025年发展目标,这也为生成式人工智能技术融入数字政府建设指明了方向。
一、生成式人工智能技术在数字政府领域的创新应用越来越丰富
生成式人工智能技术是人工智能技术的一个重要分支,目前尚无统一的定义。根据百度百科定义,生成式人工智能是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。可以看出,算法、模型、数据是生成式人工智能技术的主要要素。就大模型和生成式人工智能两个出现较多的概念而言,简单来说,大模型是生成式人工智能的一种表现形式。近年来,随着生成式人工智能的兴起,其在数字政府领域中的探索应用越来越丰富,主要体现在三个方面。
(一)辅助智能问答提升政务服务效能
以大模型为代表的生成式人工智能技术在人机交互等领域具有独特优势,它可以替代部分客服、咨询等人工工作,大大降低了人工成本、减少了工作量。目前北京、广东等地积极探索,在不久前召开的“2023全球数字经济大会”上,北京政务服务管理局就表示,将借助大模型的语言理解、智能推理、数据分析等能力,重点发展基于生成式人工智能技术的政务咨询、政策服务、接诉即办、政务办事等四个方面的场景应用。
(二)辅助智能写作提高政务人员工作效率
基于深度学习的生成式人工智能技术可以对文档、材料等知识库进行快速学习、理解、总结和提炼,通过对提问信息的总结和推理,完成已有信息的整合。尤其对于固定格式规则的文件、合同,生成式人工智能技术往往能取得更好的效果。目前,一些企业致力于打造“AI智能文档平台”,为政府及企事业单位提供信息检索、文本解析、文稿审查、辅助写作等智能文稿服务,提高政务部门人员的公文写作和内容管理效率。
(三)决策大模型支撑政府的智能决策
以数据赋能决策始终是数字政府建设的目标。针对决策支持这一目标,需要基于大数据、人工智能等数字技术,实现数据实时处理和智能分析,以交互式的可视化平台展示成果,为政府决策提供科学依据。基于“大数据分析+可视化展示”为特点的生成式人工智能技术恰恰符合这一应用场景。目前,上海金山区、长宁区探索构建了基于统一标准、统一服务、统一调度、分层分级的大模型体系,为民生服务、城市治理提供决策支持服务。
二、生成式人工智能技术在数字政府领域中的应用存在风险挑战
(一)大模型应用“投入产出比”的挑战
基于深度学习的生成式人工智能技术往往需要大量参数,伴随着模型的升级,参数数量呈爆炸式增长。随之而来的则是训练数据量和训练成本的提高。据统计,GPT-1有1.17亿参数,GPT-4则高达1.8万亿参数,训练数据量和训练成本更是增长数千倍。然而有研究却显示,相较于GPT-3,GPT-4却在“变傻”,针对尚未得到训练的逻辑问题,会出现“一本正经地胡说八道”。在政府数字化转型中对“大模型”等新应用追求的同时,需要关注应用的“适用性”和“投入产出比”等问题。
(二)数据质量和数据安全的挑战
大模型的应用需要基于海量的数据训练。在数字政府领域中,不管是基于人际交互的问答式服务,还是基于数据分析的决策支持模型,“大模型+”引入政府数字化转型的各领域必然要面对数据供给问题。目前,我国政务数据共享开放取得积极成效,然而,“大模型+”在政务领域的高质量应用仍可能受到训练数据质量的制约和影响。同时,大规模训练数据的汇聚往往带来数据泄露风险的问题,数据质量和数据安全的风险挑战将成为制约生成式人工智能技术应用落地的瓶颈。
(三)算法逻辑带来的理念和伦理挑战
基于深度学习的大模型训练往往处于“黑盒”或“灰盒”状态,利用大数据“暴力产出”的相关结果往往比较理性,但却得不到合理的解释。同时,也缺乏对结论对错的判别手段。个体行为的决策往往取决于“理性+感性”,尤其是数字政府中“以人为本”的建设理念。而模型的“理性”决策结果可能与“以人为本”所需的“理性+感性”决策结果不相符。同时,生成式人工智能中存在的“算法绑架”“技术依赖”等风险也会给其应用带来法理、伦理类的各种挑战。
三、推动生成式人工智能技术在数字政府建设中高质量应用的对策建议
(一)提高自主研发能力,推动多类型模型共同发展
以大模型为代表的生成式人工智能技术在人机交互、决策分析等领域具有明显优势,但该技术当前仍处于弱人工智能阶段,其在数字政府领域呈现出的成效并未达到期望效果。建议针对我国各地、各部门的特点,提高大模型自主研发、管理能力,开发适合数字政府建设的模型应用。同时,各地需根据不同场景需求、财政收支等因素,统筹错位发展与适度发展,推动传统经济学模型、小模型、大模型有序发展,提升政务领域的整体数字化、智能化水平。
(二)推动共享开放融合,以高质量数据支撑政务应用
数据是各类人工智能技术应用的基础,生成式人工智能技术在数字政府领域的应用离不开高质量的政务数据、社会数据、互联网数据的供给。建议在国家现有数据共享的基础上,利用隐私计算、区块链等数字技术提升数据共享质量和效能,探索应用数据沙箱等技术推动不同类型数据间融合,以高质量数据供给推动生成式人工智能技术的高质量训练和应用。在数据安全可控的条件下,通过建立数据保密机制和技术屏障,开放高质量可信的政务数据集。同时,统筹各地算力资源,为大模型在数字政府中的应用提供算力支撑保障。
(三)坚持安全和应用并重,推动生成式人工智能的精准治理
今年7月国家网信办联合各部门印发的《生成式人工智能服务管理暂行办法》对生成式人工智能技术的发展、治理等作出指导规范。目前生成式人工智能技术在政务服务等领域的应用仍处于探索阶段,其数据采集、应用成效等问题仍可能是公众和企业担心的问题,建议多渠道并存保障公众和企业各种权利,推动“以人为本”数字政府建设理念。针对数据安全领域,建议在发展和引入大模型时,坚持安全和应用并重,多措并举规避数据、算法等泄露风险。
四、结语
目前,以大模型为代表的生成式人工智能技术仍处于弱人工智能范畴,这决定了其对数字政府建设领域的影响不可能是颠覆性的,需要各地各部门结合地区、行业特点适度超前探索应用,重点关注成本、数据、算法等风险挑战,坚持“以人为本”的数字政府建设理念,推动传统模型与大模型共同发展,数据共享和数据融合持续发力,权利保障和数据安全同步考量,推动生成式人工智能在我国数字政府建设中的应用培育。