先人一步, 玩转AI

随着人工智能的不断发展,人脸识别算法别用途越来越广泛,人脸识别应用开始转向人脸融合、贴纸、美颜等一系列高阶玩法

1.从工具到社交,娱乐至上

互娱应用,人脸识别契合着行业发展。

起初随着智能手机兴起,人们的自拍分享需求渐渐旺盛,美颜滤镜,作为与手机硬件深度结合的产品,见证着人们变美的时代,此时,人脸识别算法的美颜功能也同事达到了鼎盛。

随着4G时代带来,短视频社交成为人们生活热点,美颜滤镜、贴纸也应用于各大互娱平台中,并成为不可分割的一部分;对于短视频内容生产者来说,甚至已成为核心竞争力。因此,诸如快手、抖音等平台,都以自研算法,并结合客户群画像,独自研发,同时也为视频人脸识别技术带来了极大影响。

滤镜是图像美化中必不可少的步骤, 所谓滤镜,最初是指安装在相机镜头前过滤自然光的附加镜头,用来实现调色和添加效果。2008年,美图一炮而红,人们发现,原来滤镜还可以这么玩,自此,美颜滤镜开始了从工具到美学定义者的转变。

早起的传统算法,主要是先使用人脸识别特征关键点算法,勾画有效区域,然后在不同的区域进行亮度提升、去噪声等算法,实现美颜滤镜。

随着深度学习的兴起,研究人员们开始更关注结果,设计师将原图P成美化完成后的结果图,并用于训练。人们美颜后,究竟想变成什么样?研究重心也开始偏移。

贴纸,人脸融合,则是人脸识别算法那更高阶的玩法。核心还是人脸特征关键点,对于贴纸和人脸融合来说,关键点的数量越多越好,对齐的越准确。人脸融合,则是将两张人脸的关键点进行融合。

人脸美颜

2.不断进取,人脸识别技术感知智能

人工智能承载了业界对于世界改造的期望,一定程度上说,人脸属性识别、视线估计、gan等,从感知智能程度上往前更进了一步,但是因为技术不够成熟、商业应用领域狭窄等原因,至今未得到大规模商业应用。可以说,人脸识别技术想跨越到认知智能,AI与AI之间相互融合,依然还有很漫长的路要走

2.1 人脸属性识别

年龄、性别,高兴、悲伤、愤怒等情绪,获取用户更多维的数据,丰富用户画像、个性化推荐、广告展示等等场景,听着很美好,对不对?毕竟在数据为王的时代,数据就是价值。但是,商用化还是存在技术硬伤,识别准确率也就70%左右。

近日,美国等5名专家,耗时两年,查阅1000多项研究,在论文《再论人类情感表达:从人类面部表情辨别情绪的方法论面临的挑战》(论文原名为:《Emotional Expressions Reconsidered: Challenges to Inferring Emotion From Human Facial Movements》)中表示:人类情绪的表达方式及其丰富复杂,很难靠简单的面部表情识别,人们生气时,在平均不到30%的时间里他们会皱眉,故皱眉不等于愤怒,皱眉知识“愤怒”的众多表达方式之一。同时,表情和语言、情境的相关关系也非常大。

2.2 视线估计

视线估计和人脸识别技术的特征关键点比较像,检测完人脸之后,再检测人眼以及眼球,并锁定眼球中心等关键点位置,根据坐标来锁定视线方向。主要应用于课堂上,评估学生注意力;AR VR等新型硬件交互,通过视线方向,自动切换视频中的位置等;广告投放,评估行人对广告的注意力;目前而言,市场体系还是比较小,未得到大规模应用

情绪人脸识别

2.1 GAN

全称为生成对抗网络,初衷是生成不存在于真实世界中的数据,使得AI具有创造力或者想象力,也是目前AI领域一个比较热门的研究方向。

gan的核心网络分为生成器与判别器;生成器负责凭空捏造数据,判别器负责判断数据是否是真数据;两个核心网络相互博弈,直至动态平衡,让生成的数据无限逼真与真实数据。

如图,随机噪声就是随机生成的一些数,也就是gan生成图像的源头。

人脸识别矢量图

生成器根据一串随机数生成一个假图像,并用这些假图去欺骗判别器而判别器通过真图和假图的数据(相当于天然的label),进行一个二分类神经网络训练,并判别输入的是真图还是假图,给出一个分值。举个例子,真图是一系列的人脸照。起初,生成器生成的的照片,肯定是乱七八糟的,但是判别器会去判断打分,告诉生成器,你生成的不是真图(人脸照),于是生成器根据深度学习,反向传播等,不断去修改自己的图片,然后,生成的图片会越来越趋近于真实人脸,直至动态平衡。

gan受到关注,很多原因,比如:

(1 本身是无监督的。目前人工智能的绝大部分能够商业应用算法都是监督算法,所谓监督算法,就是需要海量的样本,并进行人工标注,人为去告诉深度学习网络是是否正确,并传播训练,所以行业也有“有多少人工,就有多少智能”的调侃。

(2 让AI具备想象力,比如将模糊图变清晰(去雨、去雾、去抖动、去马赛克等),能脑补情节 很多paper都在研究gan的发展前景。

3.结语

任何技术,也都遵循着从技术发展—>技术成熟—>商业落地的发展规律

技术的池子不断创新,同时商业也从技术池中,探索合适的技术,改造世界;

人脸识别作为一项复合性技术算法,既拥有现在,同时也在不断开拓未来。虽然困难重重,但前景令人心动。