5G时代的到来对新闻传播的形态产生了重要影响,对媒体来说,音频已经成为新闻传播的新阵地。2021年,众多主流媒体加速入驻喜马拉雅,借助喜马拉雅TTS ( Text-to-speech)技术加速制作新闻类音频节目,让听众有了更多的渠道听到更权威的新闻。
TTS技术又称语音合成技术,是将输入的文本转换为语音的技术统称。喜马拉雅音频算法团队自研的TTS框架已处于行业领先水平,目前已经广泛被运用于新闻等多种内容的制作中。
据悉,已有超过20家主流媒体和优质自媒体接入喜马拉雅TTS进行日常音频内容生产,包括新京报、环球时报、潇湘晨报、时代周报、海外网、刺猬公社等,共上线超过40张专辑,日均生产约500条声音,覆盖新闻短资讯及长资讯。其中,新京报在喜马拉雅的TTS专辑共有16张,包括《新京报评论》、《鲸快讯》、《运动家》、《贝壳财经》、《政事儿》等,涵盖财经、政治、体育等多方面的内容,日均产出声音超过300条。表现亮眼的《鲸快讯》自2021年7月上线后,曾连续多周位列喜马拉雅新闻类专辑新品榜第一位,现在也仍位于喜马拉雅新闻类内容热播榜的前列,播放量近7000万,得到了用户的广泛好评。而环球时报上线的《环球观察》专辑播放量也近千万,评分高达9.2分。时代周报则上线了专注于财经新闻的《时代周报》专辑、专注于深度报道的《猛犸工作室》专辑和专注于区域报道的《读城记》。
新京报APP运营部副主编、音频负责人梅栋表示,通过喜马拉雅的TTS技术,新京报快捷地实现了文字报道向音频的转化,开辟了新京报在音频新媒体的新赛道,让新京报优质报道有了新的附加价值,有了触达用户的新方式,突破了新京报内容传播的阈值。
据悉,目前喜马拉雅新闻类内容中日活跃用户量最高的专辑均为TTS生产专辑。许多用户表示,这些来自权威媒体的TTS新闻专辑,时效性强,且客观可靠。一位用户评价《鲸快讯》说:“挺好的一档播放新闻的节目,时效性强、内容全面、涉及广泛、播放清晰。”另一位用户评价道:“就喜欢这类短资讯,突出重点即可,适合坐车的时候听,时效性高,声音也不错。”可见,好的TTS技术与权威媒体内容的结合,既能够满足人们对于新闻实时性的需求,同时也满足了人们对好内容的需求。
TTS技术将助力喜马拉雅在现有的“UGC + PGC + PUGC”内容生态之外,进一步拓展AIGC的可能性。未来,喜马拉雅将通过TTS技术平均每日为媒体生产1万至2万条新闻声音内容。对于用户来说,TTS技术的应用,会给他们带来更丰富的好内容。而对于媒体来说,在无需投入更多人力的情况下,TTS技术将为他们打开新媒体转型的新渠道,让好的内容触达更多的用户。
喜马拉雅已在TTS领域潜心钻研多年,已经拥有非常成熟先进的TTS框架来支持新闻类声音内容的生产。目前,喜马拉雅新闻TTS支持多种标准普通话男声和女声的音色选择,也支持多种生产方式,包括同步、异步、流式,每分钟内能转化约3000字左右。
负责喜马拉雅TTS技术研发的喜马拉雅智能语音实验室团队中拥有多名语言学专家,他们从科学专业的角度,定义了新闻播报中发音、韵律、重音、风格等标准规范,是喜马拉雅TTS精品品质的强力保障。喜马拉雅TTS新闻音库制作也已建立起完善的标准化流程,从音色选择、版权签约、声音录制、数据标注、模型训练等各个环节,都有完整的工具和质量把控。
技术上,喜马拉雅TTS通过使用基于BERT模型的多任务建模,在文本正则化、多音字识别、韵律预测等NLP任务上,取得了行业领先的精度,使得TTS能够对新闻中的日期、数字、缩写、人名、生僻字、英文词等进行正确发音。另外,喜马拉雅TTS采用自研的声学模型和声码器结构,既能高度还原录音数据的音色和韵律,又能学习和迁移其他音色的风格,从而让AI合成音的新闻播报也拥有更加细腻的情感和抑扬顿挫的起伏。
喜马拉雅智能语音实验室的卢恒博士表示,喜马拉雅在小说TTS音色演绎方面已经积累了丰富的经验。他说,用TTS音色演绎小说是非常难的,需要学习小说中的抑扬顿挫、情感表达、上下文关系,区分旁白和对白,并最终将作品完美演绎出来,这正是喜马拉雅的优势。而这些经验可以运用到新闻TTS中来,让新闻类的TTS内容更加准确、生动。
目前,传统媒体或者自媒体若需要基于已有文字内容开发音频内容,只需通过智能音频平台或接口服务,选定喜马拉雅已有的TTS音色,喜马拉雅便能快速将这些文字转化为音频内容进行站内分发。同时,喜马拉雅也支持媒体定制新音色,尽管这会需要更长的开发时间。
音频的伴随性、多场景共存等特性,能够很好地满足新时代下用户获取信息的习惯。在车载智能终端方面,喜马拉雅与多个头部车企品牌牵手,特斯拉中国、通用、上汽、吉利、比亚迪、蔚来汽车、理想汽车等都在合作名单中,为车主提供海量音频服务。在家用智能终端方面,喜马拉雅与阿里巴巴、小米、百度、腾讯、华为、美的等头部企业达成合作,将内容生态与硬件产品进行广泛的连接。 喜马拉雅在全场景生态上的布局,让媒体所生产的新闻资讯,可以渗透到用户生活的各种场景,满足不同用户群体碎片化阅读需求。
据透露,喜马拉雅仍在持续推进不同音色的签约和制作,以及多情感、多风格的TTS技术研发与升级,进一步提升内容生产的质量和效率。未来喜马拉雅将会推出更加全面的新闻音色矩阵和更加自然逼真的新闻播报风格,助力更多媒体无缝衔接文字和声音内容,抢占音频新阵地,不断打开对于声音的想象,让技术加持声音、让声音服务生活。