本文概述
面部识别不仅限于计算机科学领域。它具有可靠的业务应用程序。
这十年来最热门的流行语之一是面部识别。
这是应用机器学习的一部分, 可以检测和识别人脸, 迄今为止, 对于计算机而言, 这个问题一直非常困难。从而为企业, 政府和个人打开了一个充满激动人心的可能性和挑战的全新世界。
如果你是业务负责人, 并且一直在想什么大惊小怪的, 以及在此新开发中是否有实用程序, 我们将为你提供帮助。在本文中, 我们将研究面部识别的历史, 面部识别的发展, 当前用途, 争议, 部署以及更多其他方面。
到最后, 你将掌握面部识别技术的全部含义, 以及对企业的意义。
让我们开始吧!
面部识别的演变
对于有关面部识别的所有宣传和媒体报道, 该技术已经存在了一段时间。检测人脸的第一个严肃的算法工作是2001年发布的Viola-Jones对象检测框架。尽管它是用于识别图像中对象的通用框架, 但它很快被成功应用于人脸检测。该算法受欢迎的主要原因是它的速度。虽然训练过程非常缓慢, 但是检测过程却非常快。
早在2001/2004年, 运行此算法的普通台式计算机就能够在0.07秒内处理300px X 300px帧(更多信息请参见此处)。准确率虽然无法与人类获得的水平相提并论, 但却达到了90%的惊人水平。
但是, 直到2010年至2020年这十年间, 卷积神经网络才成为实现面部检测的最佳方法, 真正的进步才得以实现。原因是基础架构即服务(IaaS)提供商通过云计算提供了原始处理能力和巨大的系统内存。有史以来第一次, 计算机在识别人脸方面一直在击败人类, 特别是当涉及大量随机人脸时。
面部识别如何工作?
面部识别是一个多步骤的过程, 涉及多个专用子系统。
以下是各个阶段的含义:
检测/跟踪:预处理阶段的这一部分负责识别和跟踪给定图像或视频文件中的面部。完成此过程后, 我们肯定会知道给定输入中有一张面孔, 并且可以对其进行进一步处理。跟踪阶段还负责跟踪某些需要的部分, 特定特征或表情。
对齐:由于给定图像或视频中的面部不遵循任何准则, 因此面部识别问题更加复杂。该人可能会放大或缩小, 从树后窥视或出现在侧面轮廓中, 这使得人脸检测的问题更加棘手。这就是面部对齐的目的:它告诉我们在给定的图像/视频中, 面部线条在哪里, 以及面部特征的轮廓是什么。
特征提取:顾名思义, 在此阶段的过程中(我们现在处于识别阶段), 脸部的各个特征(例如眼睛, 鼻子, 下巴, 嘴唇等)以以下形式提取:可以在下一阶段由算法使用。在此阶段, 计算机已经收集了足够的硬数据, 可以使人唯一地分辨出来。
特征匹配/分类:在此阶段, 将从特征提取中接收的输入与给定的数据库进行匹配, 以推断出该人的身份。此阶段也称为分类, 因为可能需要该算法对面部进行分类, 而不是单独识别它们。
一旦该过程结束, 我们就可以确定给定的面孔是否是我们比较过的数据库的一部分。最终输出还可能包含标记, 这是我们在Facebook上惯用的方式。
部署注意事项:服务器端与客户端
面部识别既可以在服务器上也可以在用户与之交互的设备上工作。例如, 当你将照片上传到Facebook时, 算法将在服务器端运行;另一方面, 使用你的脸来解锁设备的ID系统需要在客户端运行。那么, 哪个更好?
老实说, 这不是哪个更好。服务器端和客户端部署都有其优势, 实际上, 企业部署了混合系统。建议的做法是在服务器端训练模型, 而训练数据和处理资源没有限制。对模型进行训练后, 就可以将其打包并部署到客户端, 从而提高了系统速度并维护了用户的隐私。
将所有内容发送到服务器会导致延迟, 这在某些情况下可能是严重的或无法接受的。同时, 将所有内容都保留在客户端将导致模型较弱。
面部识别的准确性如何?
准确性在面部识别中不是一个非常明确的术语。主要原因是这是一个模糊的问题, 包括各种混乱的输入(昏暗的光线, 被头发部分遮盖的脸部, 摄像头的质量等), 甚至是欺骗性的输入(稍后会详细介绍!)。结果, 涉及面部识别的神经网络需要针对眼前的问题进行调整, 从而限制了其范围。因此, 尽管工业面部识别系统可能拥有100%的准确性(通常是这种情况), 但是当被要求在拥挤的照片中识别面部时, 同一系统甚至可能甚至没有20%的准确性。
在一项研究中, 一种特定类型的面部识别算法能够达到98.52%的准确度, 高于人类在同一测试中达到的97.53%的准确度。在另一项法医学研究中, 人工判断和算法相结合在某些情况下产生了最佳结果。
底线-对于重点明确的应用程序, 面部识别是我们拥有的最佳工具。
在哪里使用面部识别?
即使在开发可行算法的短期内, 面部识别也发现了极其有用和令人兴奋的应用程序。其中一些引人注目, 但有些则从根本上巧妙地融入了日常生活, 以至于我们几乎不停地思考下面的内容。
Facebook可能是现代人脸识别系统在工作中最常见的例子。上传照片后, 社交网络就可以检测到脸部。不久前, 你被要求标记朋友, 而现在Facebook可以自行标记。
Facebook的一项很酷的新应用程序是一种功能, 当某人上传了包含他们面部的照片时, 即使这些照片上没有被标记, 它也可以通知用户。
Snapchat大量使用面部检测和识别功能, 其中最引人注目的是有趣的滤镜。
为了使这些滤镜正常工作, 需要完美地检测出被摄对象面部的轮廓和特征, 否则覆盖物看起来将不真实。 Snapchat的另一个流行功能-面部互换也是如此。如果你有兴趣深入了解Snapchat的面部识别功能, 请参阅此处。
Uber一直在与隐私和安全问题作斗争, 而公司武器库中的最新武器是面部识别。该公司推出了一项新功能, 通过使用驾驶员的面部来验证其驾驶员伙伴的身份。该公司在其博客上表示, 在测试了多个面部识别技术供应商之后, 他们选择了Microsoft Face API, 以确保其高质量。有趣的是, 这种实时ID检查在弱光条件下效果很好, 并且能够检测到眼镜。
事实证明, 面部识别在野外很成功, 因此很容易预测它很快就会取代教育机构, 医院, 图书馆等中的其他识别方法。
零售犯罪预防是面部识别应用程序的自然扩展。零售业每年因入店行窃和其他零售犯罪而蒙受的损失估计为450亿美元, 没有什么可以弥补的。现在, 诸如FaceFirst之类的公司正在帮助零售商使用面部识别来检测先前的违规者并向安全人员发出警报。
像其他所有机构一样, 警察监视开始开始使用面部识别。例如, 在英国, 南威尔士州的警察正在使用安装在货车上的摄像机来简化对人群的监视。
尽管这个掌握在警察手中的新超级大国引发了关于个人隐私的激烈辩论, 但警方认为这将有助于他们更好地限制不法行为者。正如南威尔士州警察局副局长Richard Lewis告诉英国《金融时报》:
如果你确定[曾犯过]某人的罪行, 基本上就是说:我们知道你在这里, 请表现出自己。
医疗保健最近有一个出乎意料的应用, 其中面部识别有助于发现一种罕见的遗传疾病, 称为DiGeorge综合征。
DiGeorge综合征在6, 000名儿童中约有1名出现, 并导致身体多个部位的畸形。在这种情况下, 医疗保健问题对于较贫穷的国家更为严重, 因为这些国家没有资源去寻求昂贵的诊断方法。因此, 面部识别以96.6%的惊人准确性为DiGeorge综合征的受害者提供了新的希望。
在航空业, 人脸识别的应用正在迅速发展, 它将很快取代传统的登机牌。当前, 在帮助旅客离开该国时识别旅客的成果有限, 但前景可观。实际上, 美国运输安全管理局(TSA)制定了一项计划, 以广泛使用基于面部识别的生物识别技术。
面部识别的有争议用途
尽管技术的优劣取决于我们, 但技术可以为我们提供动力。因此, 毫无疑问, 像面部识别这样有力而激进的东西正在以一种引起人们对基本人权和道德观念的关注的方式来使用。
有争议的面部识别使用最突出的例子是中国庞大的监视系统, 据估计, 该系统使用了2亿个摄像头来监视其14亿公民。
该系统跟踪人员并评估他们的行为, 并不断更新称为市民评分的指标。尽管拥有强大的国家监控系统(例如跟踪债务违约者)具有一定的价值, 但大多数人将其视为反乌托邦式的未来, 乔治·奥威尔(George Orwell)曾想过。这是一个未来, 政府对个人拥有无限的权力, 并且不存在隐私。
可争议地使用面部识别的第二个例子也来自中国(毫不奇怪?)。这次是学校系统采用面部识别功能, 以确保学生在上课时保持”专心”。新的面部识别系统虽然尚未普及, 但它使用学生的面部进行识别来代替ID卡, 图书馆卡, 考勤系统等。
但令人毛骨悚然的部分是, 该系统监视学生的注意力水平, 使用手机等, 并在超过特定阈值时警告老师。
尽管由面部识别技术提供的视频监控并非中国独有(美国一直在努力使用它来遏制学校中的枪支暴力), 但中国似乎正在比其他任何国家都更进一步。
流行的面部识别API的比较
在使用面部识别时, 你有哪些选择?在本节中, 我们将介绍常用的功能以及各种解决方案之间的相互冲突。
不过, 在开始之前:提醒一下。这些API的发展非常迅速, 你可能会在博客文章中看到该API缺少此功能。不要基于此做出决定。首先分析你的业务需求, 仔细检查所提供的功能, 寻求帮助, 然后再下定决心。
OpenCV的
人工智能研究是一个无底洞。训练和完善人脸识别系统非常困难, 最好是由财大气粗的集团和手头的研究人员组成。但是, 如果你的需求很简单, 并且你希望拥有完全的控制权, 并且当然愿意为一支规模较小的工程团队做好准备, 那么OpenCV可能会为你服务。
它是一个开放源代码的计算机视觉库, 非常准确, 可用于所有编程平台。这是一个令人毛骨悚然的示例, 说明了如何使用Python和OpenCV在25行代码中启动面部检测系统!
现在, 你可能会遇到一些博客, 说OpenCV没有人脸识别功能。好吧, 这是一个完整的谎言, 这里有证据。总而言之, 如果需求简单明了, OpenCV可能是你业务的理想选择。
亚马逊认可
Rekognition是来自最大的云提供商之一AWS的一种重型产品。它是针对AWS平台的完全托管, 功能强大的服务, 如果你已经在使用AWS进行部署, 则Rekognition可能是最佳选择。
Rekognition提供的一些令人兴奋的功能包括:
- 实时分析(将图像或视频上传到S3时)
- 广泛的面部分析(性别, 头发颜色, 面部表情, 眼睛是否睁开等)
- 路径(捕获视频中已识别对象的路径)
- 场景和活动检测(室内/室外, “踢足球”等)
- 审核不安全的内容(例如裸露)
Rekognition的最大优点也是最大的缺点–你将很难与非AWS服务一起使用它, 以致你不得不放弃。
凯罗斯
与Rekognition形成鲜明对比的是, Kairos通过API向你提供AI(押韵是无意的, 我们发誓!), 从而使你可以完全控制数据和服务器。 Kairos将自己定位为隐私至上的服务, 并且对亚马逊和其他与政府勾结的公司极为批评(顺便说一句, ACLU也是如此)。
Kairos可以处理图像和视频, 并具有你希望现代人脸识别API提供的所有出色功能。它具有Rekognition中的一些令人惊讶的功能, 但是如果你不需要它们并且已经在管理数据, 为什么还要麻烦?
对于那些对隐私怀有偏执狂, 甚至不想通过网络发送数据进行处理的人, Kairos可以进行内部部署, 但是价格取决于你的使用情况, 价格可能会很高。
Google Cloud Vision
Google已选择区分其图像和视频的面部识别服务。图像API被称为Cloud Vision, 而视频服务则被称为Video Intelligence。
尽管以图像为中心的服务与AWS所提供的服务非常相似, 但视频服务具有很好的分类和搜索功能。这对于拥有大量视频档案的公司可能会需要分析或搜索的公司很有用。
也就是说, 视频智能在编写时就缺少面部识别功能, 而这些功能似乎仅在Cloud Vision中提供。对象跟踪和文本检测也在beta中, 远远落后于Amazon的产品。
Azure Face API
随着微软(最终)对云产品的重视程度超过了台式机, 最终, Azure Face API是一种令人愉悦的产品。它具有你所期望的所有有趣功能(检测, 识别, 面部分组, 相似的面部搜索, 情感等), 并且与视频同样有效。
现在, 这与面部识别并不严格相关, 但是值得一提的是, Azure还提供了客户计算机视觉服务, 使你可以根据需要使用输入并训练模型。
就像Google的服务一样, 主页上也有一个游乐场, 这使测试API很有趣!
顶级人脸识别服务之间是否存在重大差异?并不是的。目前该领域竞争激烈, 新功能的推出比披萨更快。如果你已经绑定到特定的生态系统, 则可以使用他们自己的面部识别服务。否则, 如果你的需求是特定的(控制自己的数据, 仅需要简单检测等), 则可能要选择其他供应商。
反面部识别系统
正如一些研究人员致力于完善面部识别技术一样, 其他研究人员则忙于开发技术来欺骗他们。这样一种有趣的发展是对抗眼镜, 它看上去对人类来说是正常的, 但是却欺骗了专家的面部识别系统。
话虽如此, 但这些眼镜尚无法在市场上买到, 尽管研究人员称这些眼镜可以轻松地进行3D打印。
另一个有趣的发展是在Kickstarter上推出了ekō眼镜。尽管现在取消了该产品, 但它采用了一个非常简单的想法:每天只需花费45美元的普通太阳镜即可反射光线, 从而使照相机和视频监控设备变得一团糟。
就像网络安全领域一样, “黑客”和研究人员正在为实现完美竞赛而在人脸识别中锁定号角。在2014年左右, 我们发现迷彩妆的普及使人们无法识别面部识别功能, 但不再可行。会有人脸识别的AES加密吗?只有时间会给出答案!
面部识别适合你吗?
可以从面部识别中受益的业务是涉及人的业务, 是的, 这意味着那里的每项业务!尽管目前面部表情识别的使用似乎受到政府, 大型企业或科技创业公司的拥护, 但没有理由使你的企业无法从中受益。
当我们结合一点点创造性思维时, 可能性是无穷无尽的:在酒店中问候和识别客户, 在人海中找到你的朋友, 寻找相像的人(也许被用作演员), 发现工作个性访谈(再次, 我们只是在这里让想象力疯狂起来;这种研究可能没有实质性内容), 当高价值客户走进时定制银行体验。 。 。有无数种使用面部识别的方法, 无论大小, 都可以使你的业务表现更好。
总结
很快, 面部识别将变得如此广泛和普遍, 以至于我们甚至都不会注意到它(例如手机?)。底层技术已经接近完美, 但在现实世界中, 这不仅是检测面部的问题, 还在于我们可以使用该功能做什么。
听起来很有趣, 并且有兴趣了解更多信息?查看有关计算机视觉的精彩课程。
评论前必须登录!
注册