Top
首页 > 正文

公共资源交易大数据 分类分级研究

公共资源交易是优化营商环境的组成部分,是要素市场化配置的重要内容,也是关联政府和市场的纽带。公共资源交易大数据的安全、合理应用不仅能够助力公共资源交易改革发展,也能够有效地反映我国经济态势。
发布时间:2023-08-23 10:22        来源:数字经济杂志        作者:付宏燕 国家信息中心 高级工程师

一、问题的提出

公共资源交易指涉及公共利益、公众安全的具有公有性、公益性的资源交易活动,是我国政府创新配置资源方式的重要体现,是现代市场经济体系的重要组成部分。有竞争性无排他性,属于政务公开的范畴,也是衡量我国营商环境的晴雨表。作为要素市场化配置的关键环节,公共资源交易是否统一规范、公开透明、高效便捷,已经成为反映地区营商环境的重要窗口。

公共资源交易领域主要包括工程建设项目招标投标、政府采购、土地使用权和矿业权出让、国有产权交易(简称“四大板块”),以及公立医疗机构药品、医用耗材、医用设备集中采购等。2019年12月《全国公共资源交易目录指引》印发,将以市场化方式配置的机电产品国际招标、海洋资源交易、林权交易、农村集体产权交易、无形资产交易、排污权交易、碳排放权交易等九大类16小类公共资源纳入交易平台。公共资源交易大数据来源于1000多个地方公共资源交易平台的交易业务活动,在国家级交易平台和交易领域主管部门已形成稳定的数据归集机制。但从国家到地方仍无有效支撑其流转和应用的数据分类与安全分级约束。按照运用大数据加强公共服务的战略,推动海量公共资源交易数据之间的连接、交互、有序流动,促进多主体、多场景使用,可产生无可限量的经济和社会价值。合理、清晰的分类和分级对于指导公共资源交易数据的管理、使用和安全保护非常必要,也是目前迫切急需的。

二、公共资源交易大数据构成和业务特征分析

(一)覆盖交易流程的链条式结构化数据

公共资源交易以分交易领域的项目/标段交易进展为主线,围绕入场登记、招标、投标、评标、定标、合同签订的业务环节,形成链条式结构化数据,海量且实效性强。在所有领域的交易场景中,市场主体不仅是公共资源交易活动的发起者和组织者,也是公共资源交易行为的直接参与者和实现者,如招标人、投标人、评标人、中标人和交易代理机构等。同一交易活动中不同角色的市场主体具有不同的权利和义务,共同完成同笔交易业务。而同一个主体也可以不同角色参与多个交易活动。主体的交易行为通过交易流程不同场景的数据留痕得以体现。目前四大板块涉及交易市场主体100多万家,仅工程建设项目招投标和政府采购领域进入交易平台的年度成交项目就超120万个。交易业务与主体行为关系对应到链条式结构化数据中,同笔交易通过不同领域范围的项目/标段编号唯一标识并按时间先后串联业务环节,主体行为则通过交易活动中的角色标识和统一社会信用代码的身份标识共同串联相关数据表达出行为记录。

(二)支持跨地域跨部门的业务履职和协同办公

公共资源交易数据不仅仅存在于微观的交易活动中,原始交易数据从地市级、省级交易平台产生,并按照相关规范要求格式转换后,级联式实时传输至国家级平台,可按主题重新组织支撑更高层的宏观应用,同时整合治理后开放共享给地方或政务部门,辅助简化标书材料制定、评标业绩判定、成交项目监管等。例如市场主体的成交记录从2021年开始共享,实时支持全国邮储银行进行信易贷中小企业的融资评价。

三、公共资源交易大数据分类

(一)基于业务应用和数据逻辑关系指导分类

公共资源交易大数据复杂多样、影响面广,分类的目的是梳理交易数据资产更好地进行管理和业务使用,并以该类别为基础支撑后续安全定级,所以分类应从业务应用维度出发,按照业务视角普遍认知的交易领域共同属性或特征,以及交易流程相互间存在的逻辑关联进行科学系统的分类,保持与国家、地方和行业法律法规关于数据分类分级的标准相一致。在同一分类维度内,同一条交易数据只能分入一个类目,避免造成后续复杂定级难以执行,也不宜将所有数据集中划分到某个或若干个类别中,导致业务特征不够清晰,无法定位。

(二)采用线分类法,结合多方认知设计分类体系

从交易业务的层次包含与逻辑关系上,链条式结构的公共资源交易大数据是逐级展开并细化的,同层之间不交叉重复,不同层级类之间构成业务隶属关系,符合GB/T10113-2003《分类与编码通用术语》中的线分类法。

从国家政策制定层面,分交易领域有不同主管部门,制定各自领域的规定和交易约束,如工程建设招投标的主管部门国家发改委发布《电子招标投标办法》,政府采购的主管部门财政部发布《政府采购货物和服务招标投标管理办法》,土地使用权出让的主管部门自然资源部发布《招标拍卖挂牌出让国有建设用地使用权规定》。

从地方交易平台履职层面,不同交易领域提供的交易服务也不尽相同,在信息公开环节也是分交易领域发布招标公告和成交公示。从市场主体和公众认知层面,参与交易活动或查询交易信息时,默认先选择交易领域再判断所属流程环节,最后精准定位具体信息。多方面综合考虑,宜采用线分类法形成由交易领域和交易流程组成的若干稳定类目,排列成自第一层逐级展开的分类体系。

(三)层级清晰和业务完整的数据分类目录树

将交易领域设置为第一层数据大类,同层的不同领域为并列关系。交易领域下按交易流程设置第二层数据子类,该层的不同交易流程环节并列。交易流程下按具体交易场景设置第三层数据子类,为最小数据类。所有数据大类和子类构成公共资源交易数据资源分类目录树。

数据资源分类目录树的一、二层子节点和三层叶节点横向表达出交易领域到交易场景的业务包含关系,整个分类体系清晰汇聚了所有交易领域在不同交易流程环节的所有交易场景数据。第三层的每个叶子节点均对应一个数据集,关联到数据库结构中,即为数据表信息,其多个数据项即字段在类目归属上均依附该表。纵向的叶子节点从项目开始,通过唯一编号按时间顺序串联至合同,形成一笔完整的交易描述。如交易活动出现流标、投诉等异常,则从项目开始依次串联至招标异常报告或投诉意见处理时流程结束,即为该次异常招标的完整描述。

四、公共资源交易大数据分级

(一)可落地易执行且安全至上的分级原则

按照公共资源交易数据资源分类目录树对数据进行分级标识,所加标记应细化至数据库表的字段且支持技术校对。公共资源交易业务过程有一些特殊安全要求,如开标前不能查询投标人和保证金名单,评标结果公示前不能查询评标专家打分,投诉结果出来前不能查询投诉各方及相关信息等。相关数据安全级别具有一定的时效期限,可因时间变化按照一些预定的安全策略发生改变。当不同级别的数据被同时处理、应用且无法精细化管控时,应按照其中级别最高的要求实施保护。充分考虑多数据关联叠加效应,后者的数据级别应高于原始数据,如汇总统计出的年度总成交量和年度成交总金额的安全级别应高于公开数据。

(二)依数据敏感程度和对要素影响定分级标准

在数据分类基础上,根据公共资源交易数据敏感程度和数据安全性遭到破坏后对国家安全、社会秩序、公共利益、组织和个人合法权益可能带来的潜在影响程度,确定数据安全级别,分为L1级、L2级、L3级、L4级,定级标准参见表1和表2。

(三)特殊交易数据需要特殊定级和变更

法律法规明确保护的数据,应定为L3级或以上;在多交易领域数据中均出现的“通用数据”,如身份证件类型、中标金额单位代码等可按内部数据设置为L2级。涉及个人隐私和商业秘密的数据如项目经理资质证书、社保缴纳记录等设为L3级。如出现没有任何分级标识的数据,默认安全级别为最高L4级。

当涉及安全级别变更时,直接从原始数据复制出来的新数据级别设为与原有数据相同,如从基础库同步至共享库的交易数据。

从多个原始数据合并得出的新数据级别不应低于原有数据,如统计数据。对不同数据选取部分进而合并形成的新数据,如主题分析数据,应根据定级标准重新判定。

经汇总、分析、加工后产生的数据,若与原始数据存在较大差异,应对新产生的数据重新定级,定级结果可高于、等于原始数据。

当评标和定标过程等数据公开或披露,以及脱敏或删除关键字段后,可降低安全级别。

(四)以交易数据分类目录树为基础的安全定级

根据分级原则、方法与定级要素,公共资源交易大数据定级参考见表3所示,以工程建设招投标领域为例,一级、二级、三级子类分别对应数据分类目录树的一、二、三层,对应内容指数据集的数据项,即数据结构中库表的所含字段。

五、公共资源交易大数据分级保护要求

(一)安全贯穿数据在所有网络中的流转与使用

从数据来源层到数据应用层,数据安全贯穿始终。一般情况下,公共资源交易的入场登记、招投标流程环节大多部署在互联网,面向市场主体和社会公众提供投标、查询等相关功能,但评标系统多部署在本地内网或政务外网,评标专家可直接现场评标,也可通过VPN利用交易中心的评标机位完成远程异地评标。交易数据的存储和统计分析等应用功能在互联网和政务外网都存在,而与省级、国家级交易平台进行数据传输、共享的功能均通过政务外网完成。

因此,从公共资源交易数据产生到应用的整体架构角度,结合多网络部署情况,将交易数据在生命周期内的流转分为数据采集、传输、存储、访问、共享、开放、销毁几个阶段。

(二)分级保护要求随安全级别升高而更加严格

不同安全级别的数据,应结合数据流转的不同阶段制定相应的保护要求。L1级交易数据的安全要求最低,采集设备符合安全认证,数据传输不需要加密,存储时建立数据备份机制并定期执行增量、全量备份即可,可开放共享。如需销毁应建立数据销毁审批机制,采用删除、覆写等方式销毁。

同时,为防止爬取大批量数据关联时产生较大业务价值,应采用日访问量限制、IP地址限制或者每分钟访问次数限制等反爬策略。

L2级交易数据采集应在L1级基础上增加对数据完整性的校验,通过VPN建立安全通道访问政务外网,设置简单的身份标识与鉴别机制,增加对数据访问行为的审计与分析。

L3级交易数据采集和存储均应在L2级基础上增加用国密算法加密,采用口令、密码、生物识别等两种或两种以上组合的鉴别技术进行身份鉴别。L3级数据的共享、开放应由数据主管部门审批授权并完成技术层面的脱敏,数据销毁时应当采用无法还原的不可逆方式。

L4级数据采集和传输均应在L3级基础上增加水印溯源等技术,对数据泄露风险及行为进行追踪定位,采用账号动态授权并增加对相关账号的风险监测,不允许共享和开放。

六、结束语

截至目前,公共资源交易数据的信息公开、传输交换等均已在全国形成稳定的动态更新和同步机制,但从国家到地方对交易数据的安全认识、应用深度迥然不同。多个省份正在加快推动构建交易数据一网共享、交易一网通办、服务一网集成、监管一网协同的“全省一张网”新格局,对交易平台的交互贯通、交易业务全面协同提出了明确需求和更高要求,合理的公共资源交易数据分类分级将协助规范化梳理数据,提升对数据的安全意识,促进交易数据的充分共享和安全使用,对于不同行业构建政务大数据的流通共享体系也具有一定参考价值。

每日必读

专题访谈

合作站点