全文共1905字,预计学习时长4分钟
现在的世界比以往任何时候都更专注于人脸检测。只需看看最新发布的智能手机:大多数手机现在允许用户用面部解锁手机,或至少可以捕捉可能偷手机的人的照片。
例如社交媒体Facebook提供自动标记用户和朋友的功能,或查找包含用户但尚未标记的图像。Snapchat提供了流行的面部滤镜,使用户看起来像海盗或小狗。在Google相册中,可以按照相似的面孔对照片进行分组,以便轻松找到最好朋友的所有照片。最后一个情况,人脸检测技术已经涉及一些有争议的话题,如DeepFakes或FindFace。
认识Pepper
另一项吸引人眼球的技术是机器人技术。Pepper是最受欢迎的人形机器人之一。他可以说话、倾听、做手势、跳舞,甚至可以识别你的情绪。但Pepper目前无法做的就是记住人脸。今天将展示赋予Pepper这种能力的方法。
人脸识别
那么如何才能让Pepper“看到”与他说话的人,从而提高对话和交流的质量?必须采取一些措施来实现这一目标。
通过相机捕捉图像
Pepper有两个内置相机。一个在他的平板电脑上,另一个在他的前额上。因为Pepper可以移动他的头部,所以更容易从前额相机捕捉人的脸部,如下图所示。
人脸检测
示例:用于面部检测的过滤器。
在识别脸部之前,Pepper首先需要检测到脸部的存在。这通常通过Viola Jones算法实现,该算法使用一组过滤器来判断图像的当前片段是否包含人脸。该算法通常用于相机中以发现人脸,并用方框标记。
Pepper实现了人脸检测功能,但为了识别相应的脸部,需要拍摄全尺寸彩色图像。因此,结合了Pepper检测面部的能力,确保在拍摄图像之前一个人正面向相机。这样,如果此人突然移动,Pepper不会不小心拍到一张墙或桌子的照片。
人脸检测算法的结果
预处理
检测到脸部时,可以将注意力集中在一个人身上。不需要下一步,但有助于进一步处理。希望将检测到的脸对齐,以便眼睛水平对齐,且位于处理后图片中的同一位置。还可以应用直方图均衡和伽马校正。在最后一步中,裁剪图像。
对齐眼部
特征提取
现在可以将图像转换为数字向量,用于描述人物。听起来是不是很高深?简化它只包含两个功能:肤色和性别。指定深色肤色为-1,指定白皙肤色为1,并指定为女性为1,男性为-1。有了这个,就可以将人们放在这个特征空间上:
[性别,肤色]
摩根·弗里曼:[-1, 1]
乌比·戈德堡:[ 1, 1]
小罗伯特·唐尼:[-1,-1]
艾米莉亚·克拉克:[ 1, -1]
通过这样的赋值,可以计算出这些向量之间的欧几里德距离( Euclidian distances ):
有许多可选的其他特征,如鼻子大小,头发颜色或头部形状。但是,必须训练分类器来查看每个特定的功能。但不是手动操作,可以用神经网络来选择和调整最佳功能。幸运的是,一些研究人员已经这样做了,所以我们也可以使用它。对于给定的图像,这样的网络返回128个数字。为了使面部识别起作用,同一个人的图像产生的数字应该距离很近,而不同人的图像产生的数字的距离更远。
最后,将计算的矢量与矢量数据库进行比较,以预测Pepper正在观察的人是否曾经也遇到过。
交个朋友
可以使用这种技术让Pepper记住人。如果Pepper遇到你并且还不认识你,他可以要求你自我介绍。然后,他知道你的名字时,可以拍照并将其转换成数字向量。现在你有一个朋友:Pepper。如果Pepper再次见到你,他将能够计算他已经遇到的所有人的数学距离,并预测与你最相似的人。你总是会和自己最相似,这就是他怎样检索出你的名字。
琐事
有一种叫做面容失认症的认知障碍会导致记忆面部的一些问题。人们经常通过查看某些细节来解决这个问题,例如衣服、头发颜色或肤色。这与神经网络所做的非常相似。它不能感知整个人脸,所以它试图捕捉到许多特征,这些特征结合在一起时,就可以识别出这个人。
总结
这个解决方案开启了许多新功能,从简单记住别人的名字开始。Pepper现在可以检索正在讨论的最后一个主题。他还可以知道一些关于他遇到的人的情况,比如他们的喜好或爱好。他可以把人们带回最后一次谈话中的情绪。这种互动将使他成为一个更加真实的人形机器人。还可以授予Pepper从你的帐户发送邮件的权限。有无限的可能性,只有我们的想象力才是极限。
留言 点赞 关注
我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”
(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)
转载:https://blog.csdn.net/duxinshuxiaobian/article/details/101359397