人脸识别技术的滥用真的无解吗?

以上内容抄送 @科勒KOHLER、@正通汽车、@江苏大剧院JSCPA

人脸识别技术的滥用真的无解吗?

封面图片:Lianhao Qu

昨日的3·15晚会报道了部分商家在店内安装人脸识别摄像头,并且在未获同意的前提下私自储存并使用了所捕获的人脸信息。报道中涉及的商家包括科勒卫浴、江苏大剧院与正通汽车4S店。如果你还没有看过这篇报道可以观看下边这段视频。

2021年3·15晚会
中央电视台3•15晚会已经成为一个符号,是中国消费者最信赖的守护消费品质的舆论阵地。
请从10分06秒开始观看

该报道在互联网上引起轩然大波,毫不意外大部分人都表示了自己对该技术的担忧。

图像来源:果壳

首先表明观点:根据2021年1月1日正式实施的中华人民共和国《民法典》第一千零三十五条,晚会中报道的行为是违法行为,应当依法予以处理。

在这篇文章中,我想从技术角度切入,先来介绍下人脸识别技术的原理,然后再谈谈可能的解决方案。

人脸识别的原理

人脸识别是通过面部特征来区别不同人类个体的能力。我们在成长过程中习得了这份技能,并且在大脑中记忆了若干对自己重要的人的长相。然而对于脑中只有01的机器而言,识别人脸这项技能必须被分解为可计算的数学问题,然后再逐个解决。目前大热的人工智能人脸识别的背后其实是以深度学习为核心的解决方案。在这个方案中,人脸辨识被等价为判别两张图像中人脸的相似性,相似程度越高,是一个人的可能性越大。

三张人脸,哪两个相似程度更高?图像来源:Disney

即便你从未见过他们,上图中右侧两张图像人脸的相似程度更高,这是我们凭借人类的视觉系统与大脑做出的直观判断。而机器则首先使用一个预先打包好的计算规则来对三张图像分别执行运算,并为每张图像输出一个独特的数字组合。这个独特的数字组合被用作相似度的计算。

人脸相似度计算过程。图像来源:尹国冰

上图展示了三张人脸图像的相似度计算过程。正常情况下,最终输出的三个相似度数值中,相似度2最高,代表中间人脸与下方人脸很可能是同一个人。

技术滥用的背景

在这个简化过程图中,运算规则正是深度学习发挥作用的地方。它的输入为人脸图像,输出为数字组合。这里的数字组合其实是一个固定长度的向量,也被称为特征向量。基于深度学习的人脸识别方案一直在追寻更加合适的特征向量生成方式。这个过程本身已经不是什么秘密。甚至如果你原意,我在GitHub上开源了一套人脸识别模型的生成方案,你可以使用它来获得特定条件下98%以上的识别准确率。当然,目前以人脸识别为业务的公司这个数值均在99%以上。某种程度上,这项技术的门槛变低了。这是技术被滥用的第一个前提条件。