Top
首页 > 正文

伯俊CTO洞察:AI模特换装背后的隐忧和挑战有哪些?

发布时间:2023-07-10 10:00        来源:中文资讯网        作者:中文资讯网

今年伊始,ChatGPT的东风不仅吹向了国内科技圈,也吹向了包括零售电商在内的许多细分领域。

ChatGPT是AI行业发展的一个里程碑,正在引发一场生产力变革。它在市场营销等方面已多有应用:设计师用它快速生成图像和视频,文案人员用它帮助自己写文章、写文案、写脚本……甚至已经有不少领域在用ChatGPT“搞钱”了。

我们也从各种新闻报道中可以看到,曾经数万元成本才能拿下的假发模特实拍,如今依靠ChatGPT和Midjourney,仅用10分钟就能生成好几版,而且实测模拟显示,AI绘图会比实拍更加真人化,渲染完成之后绝对要比人工拍的好。

AI模特换装真的有这么好吗?现在遇到的问题有哪些?

A642C186-1DDC-4085-A04F-7C88EC44F0BE.png

AI模特换装带来的隐忧

正所谓“外行看热闹、内行看门道”。作为CTO,我认为把一项新技术注入产品,去赋能业务的时候,要考虑很多因素。当前这个阶段,大模型进步非常快,但还是有很多问题没有解决。

另外,用户场景的需求本身也不完全一样,应用程序的运行环境也不一样。比如知识更新需要重新训练大模型,费时费力,所以它的时效性有缺陷,无法做到对最新消息的知晓,对信息时效性要求高的场景并不适合。大模型是千亿级参数的,需要设备端和云端实时连接,所以对于网络通讯能力较弱、低功耗的设备不太适用。

因此,大模型虽然在很多地方适用,但也有一些场景不适用,作为企业,要去考虑如何调整,如何去抓住机会。

区别于以往的人工智能产品,ChatGPT不单单是文本生产的工具,其强大的语言处理和生存能力也增加了很多的用户体验,同时也为我们降低了生产经营、交易的成本,同时也提高了企业的经营效率,而这种大规模的适配器以及迭代的能力也是ChatGPT的特点,它在特定的领域、专业语言以及自动化的客户服务等各方面都做出了巨大的成就。

7DA1AC39-B660-4939-924D-B9BA6AF42B47.png

我个人认为ChatGPT在零售行业,未来有非常广阔的发展空间。

随着数字化、智能化时代的到来,消费者对于购物体验和个性化需求的要求越来越高。尤其在服装电商领域,消费者更加注重对服装的直观了解和购买体验。因此,对于电商商家来说,如何降低营销成本、提高营销质量,成为亟待解决的问题。

以模特换装为例,目前市场上服务的商家均表示,通过AI模特换装,能够为电商商家提供更好的营销解决方案,可以降低商家的营销成本,还可以提高商家的竞争力和展示效果,让消费者更直观地了解服装。

我们了解到目前AI模特换装从技术和实际情况都带来一些问题和隐忧。

我了解到,一位电商从业者在AI技术上投入了约200多万,打算从此不再雇用真人模特;一位淘宝服装店主正在培训技术人员,等夏季上新时就换上AI模特;一位模特经纪公司老板正在学习AI绘画工具,打算不再聘用签约模特。

种种做法,让很多人觉得真人模特会失业。事实上,这种担忧目前还是多虑,以现在的技术而言,AI模特换装还不能做到完全自动化。

7F660C5F-F1CC-49d4-8B41-9F79F26BA04A.png

目前AI生成的人物图已经较为成熟,海量的人物照片已经被喂进AI的大模型中,在此基础上,可以通过自定义训练集对模型进行微调,比如脸、衣服的部分。据了解,目前做AI模特的同行,大多是直接使用已训练好的模型。

一般来说,只要输入相应的文本关键字,AI就能生成相应图片。如果商家想要一位棕色长发的女性模特形象,那么输入“棕色”“长头发”“女性”的关键词,AI就会生成不同样貌的棕色长发女性。在此基础上,如果商家偏好其中某一个,可以固定参数,在之后的换衣步骤中使用同一位AI模特。

不过AI图看多了之后,还是能分辨出不是真人,比如AI的脸都长得差不多、身材也类似,有些腰细得不太合理。目前,许多训练好的AI模特模型都使用了来自日本、韩国的数据,长相带有明显的日韩风。这也是为什么很多用AI做模型的小公司,训练了数个自定义模型,再混到原先的模型里,生成的脸还是带有原来模型的感觉。

其实,很难去校准一个完全脱离AI味的东西。这个局限性当然可以解决,比如你再去训练,但是每一次训练,成本又上去了。

9C1B40DE-1473-4c3c-99C7-750ED12623E5.png

再比如,即便使用AI生成的图片可以多达每秒30余张,甚至更多,但是从真人视角去看,可以使用的可能一张都没有。

对于使用AI模特的商家而言,换装试衣的技术非常关键。目前商家的做法主要有两种方式可以实现:一种是拍摄衣服各个角度的照片,借助LoRA模式训练这些照片,生成模特穿上这条裙子后的各个姿势图像;另一种方式是重绘,需要把衣服套在石膏假人上并拍照,将衣服部分固定下来,再生成AI模特和仿真背景。

不过这样还是存在很多问题。前者生成的图像不能保证百分之百地还原衣服,可能有10%的细节会丢失。比如,原本衣服上的一朵小花,生成后可能会变成一个圆点,这种情况下,需要再进行细调或人工后期。而后者,每次将衣服套上模型并拍照,也会增加时间成本。从你拍下来的照片,到直接一张成品的图,没有那么自动。

441E230D-DC02-4bff-AFCC-A61D7E2990DE.png

机遇和挑战

实际上,AI模特仍有局限,目前AI模特的繁琐之处在于生成之后仍需人工筛图,比如AI生成10张图,其中可能有几张质量不高,或细节画错,这时候就需要人工筛选出更好的图,再进行后续操作。

据我观察,AI模特的技术已经具备,但能否大规模商用,取决于成本和效率。假如说成本还不够,或者成本不合算,即使有技术也没用,但是大家都看到这个前景了。

围绕着ChatGPT和AI,国内已经有不少厂商早已开始投入研发和进行相关业务场景的布局,这也是当下最火热的赛道。

F5B7C9D4-D0E8-40fc-BAD9-30662DF47A3C.png

以科大讯飞为例,前不久,科大讯飞星火认知大模型正式上线,这也意味着科大讯飞正式加入类ChatGPT模型的竞争。

众所周知,科大讯飞可以说是智能语音领域的王者。虽然已经有多家平台推出了类ChatGPT模型,但是主打“AI+行业”模式的科大讯飞可以更好的将人工智能运用在各个行业之中。这在目前国内的人工智能市场中,是独特的存在。

科大讯飞的星火AI可以很好的将企业结合在一起,围绕着知识问答、代码编程、数理推算、创意联想、言翻译等多个使用场景,通过海量的文本代码和知识学习,通过自然对话的方式,理解用户需求,并有效执行任务。

这一切的背后都是服务用户和消费者。

事实上,早在2021年,科大讯飞便与我们伯俊科技进行了合作,共同探索私域经营。

作为伯俊的战略客户,科大讯飞和伯俊科技再次联手,伯俊科技将通过构建商品统一服务能力、一方数据沉淀能力、全渠道联合库存能力、全渠道订单服务能力、全渠道信息敏捷响应能力、数智化分析评估能力,助力科大讯飞实现数字化转型。

在星火AI加持下,伯俊科技将为科大讯飞提供可靠支持,为其消费者业务的数字化转型打下坚实基础,共同推动零售行业技术进步和业务协同发展。(作者系伯俊CTO陈雨陆)

F5E7561E-7ACC-487a-81F3-855D1A61EC99.png

每日必读

专题访谈

合作站点