明朝万达基于对数据安全市场深刻理解从实际应用场景出发,对自主Chinasec(安元)网络数据防泄漏系统中提升基于深度学习的智能文本识别与文档分类技术,以更加精准而高效产品形态为企业数据安全护航,实现与企业共赢。
随着企业信息化水平的不断提高,企业在产业与服务、营销支持、业务运营、风险管控、信息披露和分析决策等经营管理活动中积累了大量的业务数据,一旦这些业务数据丢失或泄漏,则有可能造成巨大的经济损失,或在社会、法律、信用、品牌上对企业造成严重不良影响,如何高效准确识别业务数据是企业数据安全所面临的核心问题。
传统数据防泄漏系统将关键字、正则表达式作为唯一匹配规则,面对企业复杂多样的实际生产环境,导致大量的误报和漏报问题,针对非结构化数据基于上下文的内容识别,一直是信息安全领域的难点和壁垒。
自然语言处理能够基于文本语义特征,短时间内分析海量文本,快速实现针对文本的分类管理,与传统的数据发现策略相融合, 帮助企业准确识别业务数据,并在此基础上,对敏感数据施加动态化的按需防护,切实有效的保障业务数据的安全存储和流转。
作为明朝万达Chinasec(安元)核心产品之一,Chinasec(安元)网络数据防泄漏系统部署在企业外网出口,对外发数据包进行会话重组与文件恢复后获取内容,通过策略匹配的方式来实现外发数据的内容管控,以防止企业敏感数据传输到企业外部。
本次系统升级新增智慧文档分类功能,分为训练、预测、纠错三个阶段。训练阶段主要利用深度内容分析引擎和聚类等相关算法,分析大量人工标注的原始样本集,根据文本内容的语义特征和格式自动按照内容进行主题梳理,并可通过人工干预灵活调整语义相似度,获得满意的分类效果并生成预测模型;预测阶段主要利用预测模型实时感知检测敏感数据的使用状况,实现对企业外发数据的有效预测与精准分类;纠错阶段主要对预测模型的误报行为,支持用户手动标注误报功能,对预测模型的准确率造成积极正向干预,为数据动态分类分级奠定基础。
将自然语言处理技术和分类分级相结合的智慧分类功能对企业外发数据按照敏感级别进行有效分类并智能归档,大幅降低传统关键字、正则表达式识别的误报率和漏报率,是敏感数据管理的重要突破,为企业实现细粒度、差异化管控提供了重要支撑。
明朝万达是业界领先的数据安全解决方案提供商,拥有源于清华大学并积累多年的技术优势,已申请多项数据安全领域的发明专利。目前公司已累计申请专利近300项。
在数据安全技术领域,明朝万达深耕十余年,运用自主研发的Chinasec(安元)数据安全系列产品,基于国内首创的“动态数据安全”理念,覆盖数据产生、存储、交换、使用等全生命周期的重要环节,在金融、政府、公安等领域已得到广泛应用,并获得客户的一致好评。