随着互联网的高速发展,“万物数据化”浪潮奔腾而来。4月9日,中央重磅发文《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》(下称《意见》),数据首次被纳入生产要素范围。数据资源已经成为关键的生产要素,而海量数据的处理与分析要求构建大数据中心。这必然要求作为“底座”的数据中心不断扩大规模,不断优化,升级数据基础设施才能更好地支撑整个中国数字经济的升级和持续发展。
近期,中央也密集点名“新基建”。新基建正成为朝野共识、地方纷纷发力、市场积极响应的战略性新举措。新基建的核心是数字基建,在5G、人工智能、区块链等新技术业务驱动下,市场呼唤更先进的“新基建”数据中心,呼唤绿色、安全、海量的数据存储基础设施。面对时代的需求和国家政策的要求,城市数据湖作为DT时代数字经济基础设施应运而生,为政府在大数据时代实现海量数据存储和计算提供了可能。城市数据湖是区别于传统数据中心的一种新型的数据中心模式,是支撑数据采集、传输、存储、计算、分析、应用、安全等能力的新一代数字经济基础设施,
新基建的赛道已开启,城市数据湖正在成为“新基建”的“弄潮儿”。
城市数据湖,顺应大数据时代发展的产物
目前,巨量数据存储的高成本、数据安全度低、数字资源开发利用程度不足等问题都制约了数字经济发展。磁存储在能耗和寿命等方面的缺陷,使其在面对海量数据长期存储时显得乏力。数据湖依托蓝光存储低能耗、高寿命、高密度(普通磁存储设备寿命只有3-5年,蓝光存储能实现至少50年无需更换存储介质)等优点,为大数据长期存储提供了根本保障,同时为数据量几何倍增长的情况提供了集约化实现能力,避免了设备和空间的浪费,具有“海量、绿色、安全、生态”四大特色。数据湖建设势必成为新时代数据存储发展的新方向。
数据湖是面向政府、企业、个人,融合数据感知、存储、分析为一体,以高效降低存储能耗和成本的光电磁全介质混合存储系统为基础;以满足数据存储读写速度、存储时间、存储安全、分布式存储等全需求场景为目标;以收集、整理、开放数字经济核心要素“数据”,发展区域数字经济为己任;以实现数据资产受托保管、受托治理、受托交易的数据银行为核心商业模式;以人工智能、云计算、云存储为主要服务形式,实现“超级存储”、“超级连接”、“超级计算”相配套的新一代城市数字经济基础设施。
数据湖四大特色:海量 绿色 安全 生态
城市数据湖作为新基建,“新”在哪儿?
数据作为生产要素参与收益分配,将推动大数据更大规模更深层次的应用,同时对“新基建”数据中心的发展提出更高要求。城市数据湖区别于传统的IDC,作为新基建的“新”主要体现在以下几个方面:
新范式:海量、绿色、安全、全介质、全场景、智能、智慧。以蓝光为主介质的光磁电混合全介质、全场景存储绿色节能、安全可靠、拥有海量数据,并将智能、智慧融为一体,城市数据湖不仅仅是升级版的IDC,更是新型数智化数据中心,又能引导新兴产业,也是新型信息消费的市场,同时也与其他领域新基建相互支撑,是数字产业化、产业数字化的新引擎。
新技术:新基建发展驱动存储技术革新。大数据时代,为了在浩如烟海的数据中捕捉到有价值、可利用的信息,需要一个能够容纳无穷多数据信息的巨大信息库,以便在满足庞大存储需求的同时,精准而快速地对数据进行捕获、分析、加工和处理。光磁一体存储技术为实现海量数据的低成本存储提供了可能,使其最大程度发挥价值。基于500G以上超大容量蓝光光盘技术的光磁电混合存储架构,融合人工智能算法实现高低频冷热数据的EB级长效存储和高效计算支撑。数据湖人工智能引擎,提供AI中台及人工智能多场景算法平台,开发AI基础算法层,为跨行业、跨组织、跨领域、跨链融合业务提供算法支撑。
新体系:数据共建共享共用新路径。数据湖致力于构建以数据为中心的体系模式,通过数据流的引领,打破城市信息资源的壁垒,打通经济社会发展的信息“大动脉”,成为信息时代数据开放共享的新载体。同时,为各级政府进行数据资源共享提供合作平台和技术媒介,实现跨层级、跨部门、跨系统的数据资源查询和利用。
新应用:“数据湖+行业大数据应用”,实现数据增值。围绕政府、企业、个人对数据价值的N次碰撞分析挖掘和深度应用需求,面向大交通、大安全、医疗、教育等跨行业应用场景,提供鲜活的生态级解决方案,使沉淀的数据在行业应用场景中大放异彩。
新生态:产业生态构建的强载体。依据“一个数据湖就是一个产业集群”的理念,围绕数据湖基础设施构建产业生态,不断延伸上中下游产业链条,实现以数据驱动产业发展的新模式,以数据流引导技术流、业务流、资金流、人才流等。聚合并带动一个多层级、多产业的生态体系,助力城市加速孵化新兴产业,推进“数字经济”与“产业经济”深度融合。
城市数据湖能为“数据要素市场”加什么“料”?
数据要素市场化配置上升为国家政策。《意见》提出,要推进政府数据开放共享,提升社会数据价值资源,加强数据资源整合和安全保护并强调引导培育大数据交易市场,为数据要素市场配置指明了方向。城市数据湖有望在数据要素市场配置发展进程中,担任不同角色,发挥不同的作用。
一是数据存储及备份,城市数据湖沉淀海量数据,将成为“数据要素市场”最大的数据原材料供应商。
二是数据治理,城市数据湖提供数据清洗、加工、处理、分析等服务,同时是大数据加工工场。
三是数据应用,大数据创新应用产品及应用场景解决方案的制造商。产品旨在利用各类尖端技术,为用户提供海量数据存储、数据分析、数据管理、数据开放、人工智能应用等大数据服务,以及城市驾驶舱、交通大脑、公安大脑、视图库、“数据湖+医疗”、“数据湖+教育”“数据湖+防疫抗疫”等应用解决方案,使数据湖真正成为城市不可或缺的大数据基础平台设施。
四是AI服务,“算法商店”。通过AI算法推理平台、AI算法训练平台、机器学习建模平台、数据标注平台、算法解析服务、文本智能分析平台、城市视频管理平台等,提供视频AI服务、图片AI服务、文档AI服务、认知计算等。
五是数据交易,数据银行。数据湖一面拥有基础设施的属性,一面拥有着数据银行的属性。在数据确权和隐私保护的基础上,面向全社会提供数据受托存储、受托治理、受托分析等第三方数据融通服务。
简言之,数据湖解决了以下几个问题:
海量数据的存储问题—建湖
数据溪流的汇聚—引水
数据的处理、分析与应用、数据资源化—水资源利用
满足不同客户需求、数据资产化—数据增值、变现
同时,数据湖创新性地提出并践行数据产业发展的“五化理论。大数据时代,巨量信息与移动终端升级带来数据资源的碎片化应用,以及导致不完整、不全面的数据价值挖掘结果。政府和企业只有通过打通数据壁垒,建立全面化的数据关联分析,推动数据的规模化应用,完善数据产权保护制度,实现数字的资产化管理和开展数据证券化业务,才能使数据价值得以有效发挥,将数字资产作为数字经济发展的关键生产要素,驱动数字产业化生态良性发展。
数据湖:天上有云,地下有湖
城市数据湖,未来发展之路
未来数据湖的发展路线,是从提供社会大数据一级开发和存储服务的数字经济基础设施,发展为数据银行,进而通过大量的数据标注和算法开发打造“算法商店”,最终实现存储介质到认知计算的进化,赋能湖内外“认知医疗、数字孪生城市、数字永生、智慧交通、智慧公安”等人工智能和大数据应用场景落地,使数据湖发展成为有深度数据挖掘和分析应用能力的城市级DT产品,助力区域数字经济转型。
为实现数据湖从基础设施向数据银行、认知计算的进化,需要通过开展云计算、湖存储业务,夯实大数据采集、传输、存储、分析、应用等数据链各环节的技术、产品和服务;通过开展城市大脑和数据增值业务,挖掘数据湖中长期存储数据的二次分析价值,将海量、多源、异构的数据转变为高价值、结构化的数据,为搭建数据交易市场,实现数据变现奠定基础;通过开展数据安全服务,构建数据湖数据安全和隐私保护技术体系,为数据银行的运行提供安全保障。
目前我国数据要素市场化配置尚处于起步阶段,在数据确权、开放共享、自由流通和数据安全等方面仍面临诸多困难和阻碍。随着相关配套措施的完善、政府数据开放共享的切实推进、数据要素市场的培育发展、数据资产管理的强化、数据要素治理体系的构建和不断完善,城市数据湖的发展将迎来不可阻挡的“星星之火,燎原之势”。