文/孙建伟上海云思智慧信息技术有限公司产品研发中心首席架构师
当前人脸识别已经得到广泛的应用,像刷脸办卡、远程贷款、自主开户、人脸支付、人脸考勤、人脸门禁、刷脸登录等应用已逐步融入到人们的工作、生活中。这些应用一般以手机、平板、USB摄像头作为人脸捕获设备,近距离捕获高清正脸照,在捕获人脸时会有较强的人机交互,如捕获的人脸会呈现在对应的手机、平板或电脑显示屏上,也会在屏幕上指示相关操作。然而有些应用场景因人流量较大,对单人的识别时间有较高的要求,如果通过增加人脸采集设备与识别设备势必对场地、成本提出更高的要求;另外从用户体验的角度考虑,不是所有的应用都需要较强的人机交互,弱化人机交互或无人机交互会很大程度上提升用户体验。本文阐述的无感人脸识别可解决大流量和消除人机交互,只需提升后端的算力即可提高人流量的上限。通过多个人脸采集设备(一般为监控摄像头)从不同距离和角度捕获人脸图片,再通过轨迹融合、人脸图片质量评估选出较优人脸图片进行识别,使得在低照度、低分辨率时也能有较高的识别率。系统的识别率随引入系统的人脸采集设备的数量增加而指数级提升,这主要是因为系统类同并联系统构建而成。
打造无感出入口
日新月异,人工智能、深度学习已经应用到工作、生活的方方面面。人脸识别因其应用性较强更是得到广泛应用,在深入应用后用户对人脸识别的需求也逐步提高,而无感人脸识别就是从用户体验、交互时间、人流量、实施场地等方面考虑提出的,以满足用户更加丰富的需求。无感人脸识别应用推荐无人机交互或弱人机交互的方式为用户提供服务,人员无需任何智能设备的使用经验,也不需要对系统进行一些学习,不同年龄、不同教育背景的用户都能获得相同的用户体验,可以说用户在使用无感人脸识别时几乎感觉不到系统的存在。因无需人机交互或弱人机交互,故此交互时间接近为零,人员通过人脸采集点无需停顿、对视人脸采集设备,只需正常行走通过即可。一般通过人脸闸机或人脸考勤机时需要一一通行,当人流量大时会出现大量人员的滞留等待,而无感人脸识别可应对大人流量,只需增加算力和采集设备。另外无感人脸识别对实施场地要求较低,不需要安装人脸闸机或定点的人脸面板机,可选择在人员通行的过道顶棚、角落或大门内则等处安装枪机、球机进行人脸采集并实现无感人脸识别,这样使得设备不用安装在人员过道或固定的人脸采集点处,从而不影响人员正常通行。可见无感人脸识别对实施场地的要求更低,人脸采集设备安装位置的选择余地更多。
无感人脸识别在人员通行的过道顶棚、角落或大门内则安装若干人脸采集设备,人脸采集设备的数量以捕获的画面能覆盖所有区域为佳,一般用2台人脸采集设备即可满足需求,每台人脸采集设备可独立完成人脸采集以及跟踪,并标识每个进入画面的人员。捕获的人脸先进行人脸图片质量评估,如得分满足要求,则按一定的策略进行优选,并在一个周期内输出一张较优的人脸用于后续识别。人脸采集设备优选出的人脸图将汇总至后端服务器中,服务端将多个采集设备的人脸图进行融合,对未识别的人脸进行对比、识别,识别结果将回传至人脸采集设备,人脸设备将由此确定是否需要继续进行优选。
使用多源融合提升系统鲁棒性
如果多个人脸采集设备采集的人脸各自进行对比、识别,这将会浪费前端人脸采集设备和后端服务器的算力,也会产生冗余的通行记录,同时也会提高系统的误识别率。引入多源融合将多个人脸采集设备采集的人脸进行融合,也就是将进入不同画面的相同的人员进行关联,进而后端服务器可以统一对比、识别,各采集设备共享识别结果。由于不同的设备的安装角度,在多个采集设备中优选可以得到得分更高的清晰正脸照,清晰正脸照更利于对比、识别,从而降低系统的整体误识别率,提高系统的识别率。从并联系统的可靠性计算公式可得(如单系统的可靠性为90%,则三重并联系统的可靠度为99.9%),多源融合后系统的整体识别率将以指数方式提高。
出入在海量人流下的应对
无论是办公楼宇还是厂区,上下班时间点的人流量都会比较大,如100人集中办公的工作区在上下班时间点会出现5~10人的人流峰值,而几万人的厂区更是会出现几十上百的人流峰值。出现人流峰值对系统会有相当大的冲击,一般表现为来人漏拍、误识别为其他人员,来人漏拍主要是算力不足,无法在人员行进过采集点的时间内捕获且对比、识别人脸。误识别也主要因算力不足,无法优选出较为清晰的正脸照而造成人流峰值时误识别率变高。
应对人流峰值冲击最为简单的方法是增加算力,包括前端人脸采集设备和后端服务器资源,很显然这种方法会直接增加系统的投入成本,一般建议前后端算力资源配为均化流量后消耗50~80%的资源可完成计算任务为佳,简单说来设备的平均CPU使用率为50~80%即可。另外一种行之有效的方法是优化资源使用配置,优化资源使用配置的主要思想有:算力因尽量保证均分到每个来人;如果捕获的图片经评估不满足最低得分则应该尽早排除;系统应该开设一个合适的任务缓冲池来缓解峰值冲击带来的问题。
引入边缘计算优化系统
边缘计算有不少优点,如:减少数据传输开销、充分利用前端设备算力节省成本、部署更加灵活性、提高系统的整体鲁棒性。无感人脸识别推荐向采集设备方向转移计算任务,或者在采集设备就近构建边缘计算节点。向采集设备方向转移的计算任务又可以分为只检测和检测、识别同时完成两种。只检测的完成人脸捕获、人脸图形质量检查、人脸跟踪这三项任务。检测、识别在采集设备中同时完成的则需要完成人脸捕获、人脸图形质量检查、人脸跟踪的同时做人脸对比、人脸识别,前者向上级计算节点或服务器推送人脸图片、跟踪信息以及人脸图片质量信息。后者上级计算节点或服务器推送人脸图片、跟踪信息、识别结果(如为注册人员则返回标识,否则标注为陌生人)。在采集设备就近构建边缘计算节点的方案对采集设备的要求较低,采集设备只需提供视频流,边缘计算节点收到采集设备的视频流后做后续任务。后续任务包括:人脸捕获、人脸图形质量检查、人脸跟踪、人脸对比、人脸识别,当然人脸对比、人脸识别根据需要可以转有服务器节点完成。边缘节点推送给服务器节点的信息同上,包括:人脸图片、人脸图片质量信息、跟踪信息、识别结果。
由此可见人脸采集前端设备或边缘计算节点只向服务器节点推送结构化后的信息,数据传输开销显著下降;通过调节由前端设备完成的任务多少可以让前端设备处于算力饱和状态;网络传输视频流时容易丢包,通过边缘计算从则面解决了丢包视频帧变花进而导致的误识别提高问题;通过授权让边缘节点获得一定的独立工作能力,如让边缘节点控制开门,这样在服务器节点不可用时,系统整体通过服务降级实现系统的可用性。在使用边缘计算的情况下服务器节点可以不作对比、识别,仅仅做一些管理、调配、融合和决策任务就能让系统正常工作。
高体验应用场景实例
办公楼宇周边、办公楼宇底层大厅、办公楼宇楼层租户各自的大门处都可以使用无感人脸识别。办公楼宇周边可以检测徘徊与逗留等,可以只对未注册人员做这些检测,对注册人员系统可以不预警,这点非常有意义,系统的预警事件应该为提高安保人员的工作效率而设计、实现,像安保人员巡逻、内部人员抽烟、内部人员等待访客产生的事件均无意义。
办公楼宇底层大厅可以完成陌生人预警、配合梯控、混入预警、滞留预警、逗留预警等,从系统提供的功能列表不难看出“办公楼宇底层大厅”对应的功能相对“办公楼宇周边”较多,用户对“办公楼宇底层”的相关安防需要比对“办公楼宇周边”要高很多。注册人员(内部人员)从底楼大门进入、到通过大厅、再到进入电梯全程均是无障碍式的,对未注册人员可以通过语音、大屏等引导进行访客登记。
办公楼宇楼层内可以实现人脸门禁、人脸考勤、混入预警、滞留预警等。人脸门禁也就是刷脸进门,功能同人脸面板机,但无需定点式刷脸,一般无感人脸门禁会配置自动移门一起使用,人们对红外感应自动门的体验应该比较熟悉,无感人脸兼有红外人感应自动门的体验和人脸识别带来的高安全性。系统可以将部分或全部人脸采集设备配置为人脸考勤节点,如果配置为人脸考勤节点,则捕获并识别为员工时将计入考勤,在多个采集设备的协同工作下,其漏打卡的几率比员工自己打卡还要低不少。混入预警、滞留预警是针对访问的,一般在楼层门口会引导访客或陌生人进行访客登记,如果混在员工中进行办公区域则会报警。
总结:基于多源融合的无感人脸识别应用具备低成本、性价比高和用户体验好等特性
基于多源融合的无感人脸识别应用对前端采集设备的要求相对较低,在监控行业内属于中低端设备,系统使用各种优选策略,使得这些前端采集设备上能优选出较优清晰正脸照;系统采用边缘计算、资源的合理调配来优化系统,系统并不需要算力强劲的服务器节点,故此整个系统的成本相对比较低;用户体验好是无感人脸识别的显著特点,无需人机交互,不用使用经验,不需要系统学习时间,来人很自然地进行过采集设备就能完成人脸识别。