近日,人工智能研究领域顶级会议NeurIPS(神经信息处理系统大会)正式在官网公布NeurIPS 2020接收论文表。阿里安全图灵实验室与中科院计算所等科研单位共同完成的《启发式领域适应》(Heuristic Domain Adaptation)获录入选。
作为国际公认顶级会议,NeurIPS代表当今机器学习人工智能领域的最高水平,主要聚焦于人工智能和自然神经信息处理,具有广泛的国际影响力。今年,第33届NeurIPS会议创纪录接收并审阅了来自全球各国提交的9454篇论文,主题涵盖算法、深度学习、应用、强化学习和规划、神经学和认知科学等,最终仅1900篇论文被收录,录用率仅为20.09%,创历年来接受率最低纪录。
阿里研发跨媒介多功能鉴黄模型
阿里主导研究的《启发式领域适应》论文成果,致力于解决机器学习模型领域适用的难点。研究团队通过将经典的“启发式搜索”思想,融入到领域适应问题中,来解决在数据不充分情况下的模型训练问题,进而实现将人工智能从现有数据学习到的知识迁移到未知场景中。比如,在鉴黄场景下,目前该研究成果技术可直接从电商场景迁移至直播场景中应用。
论文第一作者阿里安全图灵实验室实习算法工程师崔书豪举例介绍说,与电商场景不同,直播场景不仅有主播等人物,还常常有桌椅家具等繁杂的物品背景,这些差异会导致电商场景下的搜索识别技术迁移应用效果不佳。通过将“启发式搜索”思想融入,研究团队构建了启发式领域适用的基础架构,并通过相似性、独立性、终止点等角度进行约束,使算法模型在相同计算量下,达到最佳效果。
论文共同作者、中科院计算所研究员王树徽介绍:“针对复杂任务和场景,迁移学习的鲁棒性(稳定性)与可扩展性主要体现为如何更好地提取领域不变特征。相比以前的研究,本研究所提方法能够更好地实现复杂迁移学习任务的域不变特征学习,提高了多种迁移设定下的泛化性能。”
目前,该成果主要用于内容安全识别,如直播或动漫人物及速写场景下是否涉黄等。
阿里安全新一代安全架构核心技术入选AI顶会NeurIPS,该成果主要用于鉴黄等内容安全场景,目前该研究成果技术可直接从电商鉴黄场景迁移至其他场景。
“AI技术应用,在不同的场景下可能有着同样的任务目标,但如何更好地将AI在某一场景下习得的知识用于不同场景,是‘领域适应’致力于解决的问题。”阿里安全图灵实验室高级安全专家华棠介绍说,人们对能够实现领域适应的AI需求越来越大,诸如安全领域的暴恐识别、不良场景鉴定(如区分成年人和未成年人吸烟)等。
内容识别技术国内领先获权威认证
消费者每天面对的信息流越来越海量,其中不乏有害信息,这会严重侵扰网络环境的健康发展,内容识别与审核角色的重要性因此凸显。阿里安全图灵实验室负责人薛晖介绍,阿里安全通过研发,将内容识别技术产品化,形成云盾内容安全(绿网)解决方案,并将其深入到直播审核等领域。
在9月底举行的2020年人工智能开发者大会(AIIA2020),绿网内容识别技术通过中国信息通信研究院性能评估测试,还获得了官方权威证书,这也标志着绿网产品的内容识别技术,已达国内领先水平。
“以深度学习等为代表的人工智能技术,已成为当前安全智能化的重要组成。”华棠表示,风险或违规样本收集成本较高,业务存在对抗和变异等特点,使得深度学习模型无以为继,因此研究探索基于小样本和增量学习技术的模型训练与迭代,变得非常重要。
薛晖透露,目前阿里正围绕诸多生活中的内容安全审查需求,研发智能化审查一体的内容识别技术。在阿里发布的新一代安全架构中,“安全运营层”就致力于将这些领先技术能力沉淀为标准体系,最终形成“安全中台”,从而解决数字新基建建设的“安全施工标准”问题。