Top
首页 > 正文

云从的AI探索之路:别让人工智能留在学术里

发布时间:2020-11-03 18:53        来源:TechWeb        作者:

如果从1955年约翰·麦卡锡提出人工智能的概念算起,人工智能的商业化速度其实不太让人满意。

最初的60年代中期,技术乐观主义围绕着斯坦福大学人工智能实验室,不少杰出工程师主动跃入这一充满前景的领域,彼时的战争形势更是让军方不断加大对人工智能与机器人研究的资助。

然而,军方的过多干预,以及有关伦理道德困境被推上了台面,促使部分摇摆不定的工程师们逃离了这一阵营,让人工智能技术的发展陷入滞慢。

将近半个世纪过去,尽管科幻电影还是忍不住对AI角色浓墨重彩,但向善发展的数字技术已经开始对大众生活产生显性影响。智能人脸识别、智能语音交互、机器人送餐服务……业界一度流传的“AI恐惧”在“人机协同”中得到化解,下沉去魅,生出了与现实接轨的活力。

人工智能的商业化速度真的太慢吗?实际上,科幻画面逐渐变为现实,并不是一个简单的过程。云从科技创始人周曦也曾提出,人工智能的主要挑战之一源于其商业化的长链条特点。

“如果我们永远只在学术里,帮助不了人,也做不了什么事。”站在人工智能的十字路口,周曦选择摘下学术的帽子,转身跨向产业界,去打造实实在在的商业化AI链条。

毕竟,只有无数商业化的AI链条,才能真正编织出未来的AI世界。

从学术到应用

2015年创立云从科技前,周曦已经在学术界拿下了一张不错的履历。

在获得了中国科学技术大学硕士学位后,2006年,周曦进入美国伊利诺伊大学(UIUC)攻读博士,师从计算机视觉之父Tomas S.Huang(黄煦涛)教授,成为当年黄教授在全球招收的三名学生中的一员。

在美学习期间,周曦与团队先后战胜MIT、东京大学、IBM、Sony等著名研究机构,六次拿到世界智能识别大赛冠军,发表的数十篇论文被引用上千次。留美五年,周曦也曾在IBM、微软、人工智能领域的“西点军校”NEC美国加州研究院等从事研究工作。

在常规的剧本中,拔尖的国际科研经历本该指引着周曦在学术、技术研究道路上越走越远,但在2011年,周曦就放弃了海外的高薪工作。

彼时,中国科学院正计划在重庆筹建研究院,急需人才资源,现任的中国科学院重庆研究院院长袁家虎几番邀请周曦回国。最终,周曦不仅受命归来,还联合UIUC图像生成与处理研究室、新加坡国立大学学习与视觉研究组创办了重庆研究院智能多媒体技术研究中心,成立了一支20多人的年轻团队,共同研究计算机视觉技术。

这支中科院战略性先导科技专项中唯一的人脸识别团队,也就是云从科技最初的形态。

2013年,眼看芬兰一家公司推出了全球首款刷脸支付系统,周曦立马带领团队在不到一年的时间里实现了技术跟进。然而,由于受到商业合作限制,周曦意识到团队的科研成果“只能停留在实验室”,内心产生了触动。

思量许久,恰逢中科院鼓励科研人员创业,周曦与团队集体放弃中科院的编制和收入,决意“把人脸识别的技术在中国做起来”。

2015年,云从科技正式在重庆成立。那时起,初次创业的周曦,也终于尝到了技术研究与商业实践之间那道鸿沟的苦涩。

曾给银行提供了48种不同的解决方案、要求项目团队全天24小时蹲守上海改善系统……用周曦的话来说,“从核心技术走到产品、从产品走到行业解决方案、从行业解决方案走到销售、从销售走到整个服务体系,这一圈只有亲自走完,才能得到行业客户的认可,才能真正知道如何解决问题。”

调整好心态和工作节奏后,云从科技陆续参与国家AI标准制定、国家人工智能基础资源公共服务平台与人脸识别系统产业化应用平台的建设,在国内金融、安防领域的人工智能板块中发挥作用。如今,云从科技早已从创业的小办公室搬到了独栋大楼,当初十几人的团队也突破了两千人的规模,遍布在多个城市。

从语音到图像

虽然一直在图像识别阵营深耕,但周曦等本科和硕士修习的都是语音识别,算是以语音识别出身。

拿过美国声纹识别冠军,也在微软做过语音识别研究,到了2006年,周曦通过视频资料意识到水下摄像头可以用于溺水判断,受到极大启发,发现图像应用可以帮助到更多人,到美国便转向图像和视频识别领域。

相对于语音识别技术的成熟,图像识别技术领域当时尚且还处于百家争鸣状态,更重要的是,此前在语音识别阶段积累的方法论和系统思想经验,让周曦的团队占据了先天优势。

“语音有很多做得很好的算法和思想,我也在图像上实践。果不其然效果很好,2006到2010年间拿了很多世界冠军。拿了这么多冠军我就想,总要做什么有意义的事儿吧。这个东西要实用,不管是检查零件还是挽救溺水的生命,在各种场合下要能帮到大家。”周曦始终相信,作为人工智能技术的一部分,视觉与图像识别能够横跨电商、金融、安防等领域实现应用价值,有更丰富的探索意义。

在图像识别阵营,云从一直在核心技术上处于领先地位。如3D结构光,作为图像识别领域的AI独角兽,自2016年5月份开始,云从科技就将结构光技术应用在银行、手机、家电等各个场景,两年后云从科技在国内首发了“3D结构光人脸识别技术”。同年,OCR领域的重要指标——国际文档分析与识别大会(ICDAR)测试集被再次刷新,云从科技位列榜首。近五年,云从还在跨镜追踪技术上实现了三次重大突破,实现了该技术的商用。

在图像识别领域之外,云从也没有完全退出在语音识别领域的探索。2018年底,云从科技宣布在语音识别技术上取得重大突破,刷新了全球最大的开源语音识别数据集的世界纪录,错词率降到了2.97%,WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新原先记录。

2019年3月,云从科技与上海交通大学联合宣布了在自然语言处理(NLP)上取得一项重大突破:所打造的原创模型在大型深度阅读理解任务中取得了超越人类高中生的准确率,成为世界首个机器阅读理解超过人类排名的NLP模型。

从细分技术商用趋向高度集成与通用

根据发展路径来看,初期的云从选择了金融安防领域的人脸识别技术,作为细分方向进行突破。

目前,云从已经占据了国内银行大半市场。据官方透露,截至2020年9月30日,在金融领域,云从科技已经为包括工行、建行、农行、中行等超过400家金融机构和全国超过十余万个银行网点提供智能服务。

经历几年发展,云从也为安防领域中特定细分需求带来了产品,其中在深入理解公安业务实战需求基础上,结合ArcGIS等各类离线地图技术,通过接入监控摄像机、各类人证核验设备等,它在2018年初发布了火眼人脸大数据平台。

不久后,中国民航管理干部学院与云从科技正式成立“智慧民航联合研究中心”,针对民航领域的大数据、机器学习等方向开展联合创新研发,并根据市场和行业发展的需要进行产品化和产业化研究,基本确立了云从在民航领域的地位。

2018年,云从发布了首款高性能AI摄像机——“炬眼”智能人脸识别相机,把进攻方向指向了软硬一体化。三大板块上千个场景打造出更为成熟的算法,借助首款AI摄像机的发布,云从实现了将AI技术应用到硬件优化上的突破。

业务日渐成熟后,云从的产品研发方向也伴随技术发展而有所转变。

2018年5月,云从开始与电信运营商的合作,上线IBIS(集成生物识别平台)人脸识别身份核验功能。值得一提,这里云从提供的人脸识别身份核验平台已经包含了生物识别,开始向多种技术融合发展。尔后,云从科技与英国Warwick大学、华南理工大学联合对跨媒体大数据智能计算关键技术及应用平台进行研发,证实了云从产品形态开始从单一领域技术融合向多领域技术集成发展。

2019年是云从科技产品高度集成和走向标准化的一年,其中包括云从发布的“CF-FP-E1”的最新刷脸支付终端产品,以及云从科技与东方航空、华为、中国联通一起打造的“东航智慧出行集成服务系统”正式落地北京大兴国际机场等。今年7月世界人工智能大会上,云从科技发布的“轻舟”平台,则是云从再次在高度集成和通用平台探索上的一次成果展示。

从细分技术商用趋向高度集成与通用化,目前,云从科技的产品形态主要是基于既有的软硬件技术提供特定场景的解决方案,覆盖了金融、安防、民航、零售等领域中多样的场景。

从数据算法到人机协同

发展至今,从一开始的人脸识别到如今囊括语音识别、自然语言处理等多个领域,云从科技的发展路径其实已经有所不同,如今的云从更强调人机协同。

2020年上半年,云从科技在版图扩张上动作频繁。据多家媒体报道,云从科技具体经营项目申报新增机器人、物联网技术研究等。天眼查数据也显示,云从科技具体经营项目申报开始新增人工智能算法软件的技术开发与技术服务、人工智能硬件销售、机器人的技术研究、技术开发、物联网设备销售、物联网技术研究开发等。

周曦提出,不再囿于识别,云从开始步向人机协同,新增机器人、物联网的原因由此可循。

2017年,云从科技开始着手研发人机协同平台,将人机协同战略作为核心战略,以期"以人的长处弥补计算机的短处,人和机器形成配合关系,机器同时服务于专家侧和用户侧两侧"。

今年5月,云从科技公布了将在广州打造国内首个定位于人工智能基础设施的全国领先人机协同开放平台的计划。他认为,人工智能和人之间不应该是独自割裂的,而应是可以交互、理解,甚至于可以影响和改变,就像真正的人和人协作一样。

“相比于理性而冰冷的计算机,人类在处理抽象化、情绪化、非逻辑性的问题上似乎有着不可逾越的优势,我们只是在大量重复、海量计算和海量记忆上逊于计算机,而通过人机协同,将这些问题交给计算机,就能很好地弥补我们的短板。”周曦属于典型的技术乐观派,在他看来,人工智能未来不会取代人类,也不会战胜人类,而是以人机协同的方式作为服务于人的工具。

配合自动驾驶、解决医疗专家稀缺资源与海量病患需求之间的矛盾、将智慧城市治理效益发挥到极致……周曦希望,AI能够把稀缺资源以更大的量级扩展出去,让每个人享受更好地服务。未来,“人机协同”模式下的人工智能技术,将覆盖人机交互、人机融合、人机共创三大内容,成为带动整个社会高效率运转的核心技术。

2019年初,周曦把人工智能的产业发展总结为学术研究、行业验证、商业落地、行业平台、智能生态五个递进的阶段。

周曦认为,“头部AI企业平台化,顶尖AI企业生态化”将成为产业趋势,而云从科技当下的探索之路还处于平台阶段,正努力向生态化阶段前进。

每日必读

专题访谈

合作站点