2020年,几乎所有巨头都瞄准了“视频”这个靶子:阿里、华为、字节跳动等切入视频会议市场,抖音快手全面推进直播电商;腾讯力推斗鱼虎牙合并,加大视频号的投入;金山云率先提出沉浸式视频云服务解决方案。
视频已不仅仅只是一种娱乐方式、广告呈现形态,正在成为愈加重要的信息载体,而且已经扩展到了民众知识增量获取、数字化营销、企业效能提升、产业供应链优化等方面,也逐步内化成社会基础设施,成为推动经济增长的又一动能。
这一系列的变化,正如2020年发布的《中国视频社会化趋势报告》中所言:“在经历了‘影视视频时代’之后,‘网络视频时代’的信息化、移动化不断加速视频产业化进程,基于技术创新、产业升级以及更宏观层面的驱动力,我们正在加速进入一个全新的‘视频社会化时代’。”
视频社会化,发展正当时
2020年以来,视频与现实生活更紧密了。
晚8点蹲守在李佳琦直播间,已经成为许多“美妆控”每日必修课。手握家中财政大权的妈妈们也开始在各直播间中穿梭,购买原产地直销的鲜花、水果、蔬菜等一手商品;去年“双十一”,购物一族已经不再盯着网店秒杀界面,而是手眼不停地在直播间里下单抢购。
去年双十一伊始,淘宝两大主播薇娅、李佳琦就带货近90亿元。也是在去年,电商直播用户规模超过3亿,艾媒咨询数据显示,该年电商直播市场预计将达到 9610 亿元,即将突破万亿大关,同比增长 122%。
不仅是直播带货,视频会议、远程教育、高清赛事直播、AR/VR都在2020年站上了风口。受疫情影响的各个国家都有相应的动作鼓励开展远程教学,大约60%的国家创建了自己的远程学习平台,2020年上半年AR相关融资达到55.1亿元。
本数据经VR陀螺整理
市场各方都已看到了视频实用属性正在上升,可以直接服务实体经济和经济转型。云计算、5G、AI等的发展,进一步打破视频生产的成本和技术门槛,视频作为传播主力媒介的地位被不断夯实,应用场景不断拓宽,2021年这一进化还将延续。
而视频除了作为重要的传播媒介外,在内容生产方面也在不断地发生着新的变化。不止是在各个不同的垂直行业里,大量的UGC(即用户输出内容)内容也如雨后春笋般涌现,整个视频行业一片向好。从高清内容生产、加工、推流、传输、分发、拉流到用户终端,视频内容占据了整个互联网80%的流量,用云量也随之直线攀升。
作为计算、传输等底层基础设施的提供方,云厂商们早已嗅到先机,在云编解码、AI应用、边缘计算等前沿技术积累已久,并针对视频这一应用有了专门的解决方案。
比如阿里云针对直播电商,设计了整体架构基于阿里视频云承载高并发下的视频流处理,使用负载均衡、云主机、云数据库、对象存储和CDN支撑电商核心系统,使其能够实现自适应码率推流、多路视频转码鉴黄、低延时直播、直播导购定向营销的功能;腾讯云则推出长短视频一体化解决方案,其中包括“媒资管理+短视频SDK+小程序插件+超级播放器”的产品能力等。
而金山云则很早便明确了视频云“向上 AI 化、向下边缘化”的发展策略,基于高清、VR、互动,在IaaS、PaaS层进行全面布局助力企业打造更为沉浸式的视频体验。
技术创新变革:满足视频新时代发展需求
基础技术的创新和发展是推动视频进入生产、生活各个领域的重要动能。
在视频产业早期,电影、电视的生产和传播被专业大众传媒机构垄断,观众无法开展进一步的互动。随着信息化、移动化的发展,摄影机、手机等拍摄终端使用频率迅速上升,视频创作分享平台崛起,“人人会拍、万物可拍”的时代到来,人们的交互方式从文字、图片、音频,发展到短视频、高清视频、AR/VR等交互更加生动、沉浸的形式。
无论互动、沉浸式视频的发展,还是视频新时代的推进都离不开云计算架构的支撑。4G移动网络和C端光纤网络宽带有限,传统数据中心扩容难、灵活度低、造价高,都难以满足高清化、高互动、高实时视频的发展需求。而云计算架构却因其可弹性扩展、稳定、高复用的特性而备受用户青睐。
拆解各大视频云服务商的服务,其背后底层技术集中在资源云化、存储算力部署、视频编解码、CDN加速、多终端支持、安全等方面。云计算对于视频的支撑是横跨内容制作、传输、分发、再到用户接收等几乎全环节,以保障自身能将视频内容清晰流畅、低时延、高质量的呈现在用户眼前。
其中,视频编解码是视频内容能否为用户带来极致体验的关键技术。视频编解码技术的主要作用是在可用的计算资源内,追求尽可能高的视频重建质量与压缩比,以达到节省带宽和存储容量的要求,同时满足在各种设备上进行显示的目的。换言之,视频编解码的先进与否直接影响了视频内容的质量、传输速度、呈现效果,进而影响视频提供方的成本和收益。因而对视频云服务商来说,编解码技术也将是核心竞争力之一。
在这一方面,金山云作为较早进入行业的专业视频服务提供商,一直走在行业前沿。金山云的策略是,将算法、AI、编码技术三方面有机融合,打造智能超高清编解码方案。金山云首先在H.265、AV1等主流编码基础上,加上自研的算法和编解码技术打造了集智高清、KSC265、KIE、KAV1等多组编解码技术产品。
从整个行业观察,由ITU-T和ISO/IEC联合开发的H.264/AVC编码技术仍旧是当今大多数厂家使用视频编码技术。视频编解码技术一直在进化,H.264/AVC从出现至今已有20余年,已越来越难以满足视频高清化的需求,H.264对2K、4K视频的支持较差,以4K电影为例,以H.264的压缩率处理,大小仍会超过100G,这对高清视频传播非常不利。
“要满足未来蓬勃增长的3D、VR等沉浸式视频需求更是困难。既要高清,又要视频体积小,单靠H.264显然不可能。”金山云方面表示,“因此在2014年的时候,金山云就已经开始了新一代编解码技术的研究。”
金山云采用的H.265以及第四代标准AV1(AOMedia Video 1)编码技术,相较于H.264/AVC,这是更先进一代的技术。从数据上看,“集智高清”结合KSC265编码方式,可将高清视频码率节省60%,解决卡顿问题的同时降低带宽成本。而金山云近期将发布的可商用版KAV1,相较于KSC265的基线水平,在保证高清下可将压缩率提升10%~20%,编解码效率也更高,更好地支持未来超高清大带宽的视频转码。
作为第四代标准,AV1具备比H.265标准更大的优势,例如在超高清视频的编码压缩上,支持更高比特率、更宽的色彩空间、更高的帧率。同时更能满足对于专利费敏感、Web端有大量播放需求、以及有4K及以上分辨率视频观看用户的需求。不止是金山云,如今更先进的H.265以及AV1被越来越多先进厂商采用,如Adobe、Amazon、Google等技术巨头。
先进编解码技术的加入,使得视频供应方在视频质量和视频大小两方取得了更好的平衡,也让视频以更高质量、更低成本深入到更多产业当中去。
5G+边缘计算:助力视频互动体验升级
视频云解码技术的优化,使得视频在内容处理端的效率、质量都得到了大幅度的提升,接下来要解决视频传输方面的延时和流畅问题。
5G网络给出了绝佳的解决方案。5G高速率、高容量、低时延、低能耗的特点,使视频行业诞生了全新的形态,受众可以高速、高质地观看4K、8K超高清视频,获得更清晰、逼真和流畅的视听体验,同时,更为轻松地使用AR/VR设备通过视频与数字世界交互,享受现实与虚拟交织的沉浸式体验。
尽管5G为视频行业带来了丰富想象力,但也有不足之处,比如处理和存储数据的成本高,对于不同的应用场景支撑弹性适应能力弱,大规模的数据激增也会影响5G主干网络的传输效率。在传输网络侧,硬件技术提升有限的情况下,为了满足5G时代新应用对网络性能的要求,必须要对网络结构进行优化。
一项急需云厂商们解决的问题就摆在眼前。对此,金山云交出的答卷是,以边缘计算降低5G处理和存储数据的成本,同时解决传输侧对5G不同应用场景的支撑问题,这是因为边缘计算使计算和数据存储更接近收集它的设备,能够更快地处理和存储数据,减少了需要在集中式或基于云的位置进行处理的数据量,大幅缓解骨干网的压力,从而实现更高效地实时数据传输的应用,减少延时。
简而言之,边缘计算能够增强云厂商对未来的应对能力。
于是,金山云在实现内部服务的边缘计算化后,就开始对外开放边缘计算平台及能力。目前,金山云已经可以提供边缘主机、边缘容器、边缘PaaS等多种灵活易用的产品形态,并且计划在技术选型、资源储备、技术储备等方面继续建构边缘计算的服务能力。
对于5G海量设备联网的“万物互联时代”来说,诸多高带宽和低延迟的应用都需要边缘计算基础架构的支持,有第三方数据预测,未来80%的算力将下沉到边缘。要满足这种量级的算力需求,云厂商必须在节点布置、算力调度、网络选型等方面都需创新和突破。
在这些方面,金山云先是基于K8S框架布局边缘计算节点,帮用户实现15ms的低延迟接入;同时使用去中心的网络拓扑,消除RTC通信网络抖动、大幅提升联网稳定性;另外,在运营维护上,则支持智能运维,让用户无感知调整网络状态。
“未来互联网80%内容都将视频化。” 基于云计算公司对数据天然的敏感度,金山云CEO王育林这样表示,“行业趋势跟技术趋势要兼顾,视频产品服务能力不断提升的时候,就可以逐渐渗透到不同行业。”
新兴的视频应用已经展露头角,比如将5G、4K、AR/VR技术与文旅展览相结合,将博物馆、城市地标搬到线上,VR直播与线下的导览互动相紧密结合;再如视频互动融入教育、医疗,实现教育资源共享,提升就诊问病的效率;亦或是直播带货解决产业链供需痛点,远程协作办公提高企业运行效率。这些应用无一不需要强大的底层编解码、传输产品的支撑。
视频云作为底层架构的重要性已经被越来越多的行业企业看到。一整套视频云方案融合了先进的解码技术和边缘计算的算力提升,包括从底层解码、传输到PaaS层的应用,甚至涉及到SaaS层真正的直接交付。这样的方案更能使5G的特点发挥到最大,也更大程度地支撑超高清、VR/AR等互动式视频技术与产业融合。
未来的视频:垂直细分服务于产业
一切的技术革新最终都是为了支持应用产业向前发展。
视频云技术也不意外。一个不可磨灭的趋势是,从消费互联网到产业互联网,应用场景也已打开,视频等互联网相关技术都将更进一步融入和服务现实社会。
如何顺应趋势,更好地将视频融入和服务现实社会?融合先进技术,对各类垂直应用提供针对性的个性化支撑也许是最优解。因为垂直行业的分化已经越来越明显,不同的垂直应用有着各自不同的视频技术的要求:在视频会议领域,对于清晰度要求不如电视、电影,但对双向实时播放和延时的要求更高;在远程教育领域,则需要更高效、更稳定的应对高并发,保证多边实时互动的流畅;而对于直播来说,与外部链接的对接顺畅,转换流畅则更为重要;而对于VR这类沉浸式视频,要求实时互动延时极低,视频画质极高(曾有数据表明要满足人眼真正的沉浸式需要50k分辨率)。
以金山云为例,顺应趋势为垂直领域提供优质的视频云解决方案,也进一步构成了金山云难以被突破的“护城河”。
瞄准超高清和VR应用,金山云发布了VR+8K全链路直播解决方案,提供从采提供从采集、拼接、编码、存储、分发到播放的完整端到端一体化能力。这套基于FOV+AI方案,可以针对不同内容分配不同码率,在画质不变情况下降低75%码率,进而节省带宽,同时将VR视角切换延迟控制在30~60ms内,有效消除VR普遍存在的晕动问题。例如,在VR游戏中,该技术的出现能提升云游戏的画质,同时帮助云游戏降低“网络时延”,使得相关头显的“运动到成像时延”大幅缩短,从而优化设备效果,让用户体会身临其境的感觉。
另外,AI和算法的加入,也使得金山云的编解码更加灵活,可以根据视频场景进行优化,满足垂直领域的需求。具体而言,金山云AI可对视频场景进行识别,对体育、秀场、游戏等场景匹配不同的编码模板;通过ROI区域检测,捕捉视频画面中人眼视觉焦点,对焦点区域做画质增强,同时还能识别不同类型图像质量,制定不同优化策略。
凭借深厚技术的积累以及行业的提前布局,金山云得以持续为80%以上的视频头部客户提供服务,包括字节跳动、B站、爱奇艺等知名厂商。
放眼未来,视频的“虚”与产业的“实”将会结合越来越紧密。这一趋势也已被顶层设计者和资深行业参与者看到。打造数字经济新优势。”的要求。腾讯创始人马化腾提出“全真互联网”,其中提到:“通信、社交在视频化,视频会议、直播崛起,游戏也在云化......这是一个从量变到质变的过程,它意味着线上线下的一体化,实体和电子方式的充分融合”。
而这样的“充分融合”的一项标准便是“能否实现沉浸”。只有实现沉浸,才能让人们身临其境,自如地进行互动。而目前实现最佳路径就是超高清视频和VR。
以支撑超高清视频、VR、互动视频等沉浸式视频应用的视频云产品也更将有机会得到快速发展,赢得更多的市场。根据IDC发布的《中国视频云市场跟踪》报告显示,2019年中国视频云市场规模达到46.2亿美元,同比增长46.3%。到2024年,中国视频云市场规模将超过220亿美元。
可以说这是一个潜力巨大、政策利好、需求旺盛的市场,是每一个技术创新者、方案设计者、应用实践者都不能放过的蓝海。视频社会化时代的大门已然打开,底层设施建设者已经先一步迈入市场。接下来,上层应用陆续入场,一场视频充分参与的产业变革正在进入高潮。