首页 » 科学 » 人脸识别的基本事理_矩阵_照片

人脸识别的基本事理_矩阵_照片

乖囧猫 2025-01-16 11:27:16 0

扫一扫用手机浏览

文章目录 [+]

现在AI发展的风起云涌,我们已逐步进入智能时期。
虽然人工智能偏技能类,学习和理解须要一定的技能背景和数学做支撑。
但拆开看,其事理、方法、思路并不繁芜,「不懂技能」的产品经理也能理解。

人工智能牵扯很多学科,知识点盘根错节,须要具备多学科的知识储备。
从学习路径上看,比较适宜做成系列,从浅入深,从根本到运用,逐渐深入。
但无形中提高了学习门槛,降落了学习的兴趣,导致很难坚持。

人脸识别的基本事理_矩阵_照片 人脸识别的基本事理_矩阵_照片 科学

有感于此,我想以一种轻松、探索的视角,跟大家一起摸索,用大略、直白的办法来学习AI。
这样,虽然会有缺点、遗漏等,但学习难度会降落,那就在过程中完善吧,毕竟「模糊的精确大于精确的缺点」。

人脸识别的基本事理_矩阵_照片 人脸识别的基本事理_矩阵_照片 科学
(图片来自网络侵删)

一、人脸识别产品

我们从人脸识别开始,逐步理解其技能路径的演化和事理等,本日先从最大略的事理讲起。

人脸识别实在很早就有了,多年前就以人脸考勤的办法涌现,但由于利用效果不好,用户体验不佳,逐步被市场淘汰。

而这一波人工智能的火热,打算能力、模型等都是其主要推动力,但更主要的是产品能够落地,能够在实际业务场景中利用。

尤其是人脸识别,产品在识别精度、速率、用户友好度等多个方面都有明显提升,用户和市场的接管度明显上升。

二、图像表示

理解人脸识别,先要从图像表示讲起。

大家都知道,打算机能够识别和处理的是二进制,不管我们输入的是文本、图像、声音,打算机都是用一定长度的二进制串进行存储和处理。

我们先以黑白图片为例,看看打算机是怎么表示的。

打算机程序可以将黑白图片可以表示为灰度图像。
在灰度图像中,一个像素利用8个比特位,从而可以表示256个灰度阶,表示范围是0-255。
个中0代表纯玄色,255代表纯白色。

一个字节可以表示一个像素,那怎么表示一张图片呢,用矩阵进行表示。

大略来说,便是表格,比如可以利用8行8列来表示一张88的灰度图片。

这样我们就办理了图像的表示问题,建立了图像和矩阵的等价关系。
图片可以转化为矩阵,通过矩阵也可以恢复原始图片。

大家能算出来下面的矩阵表示什么吗?

对的,一眼就看出来了数字1,看来大家都有搞AI的天赋,加油。

三、图像识别

通过矩阵表示图像后,图像的各种处理就转化为数学问题,可以利用数学的理论和方法进行办理,而这正是打算机所善于的。

我们输入图片,希望打算机能够将内容识别出来,将结果输出。

仍以数字为例,当输入图片并用矩阵表示后,通过将灰度值转化为灰度,可以轻松辨识其所表示的内容。

但在打算机的天下里,只有0和1。
想要通过辨识矩阵内容并将结果输出,就必须建立矩阵到结果的映射。
这样,输入一张图片,经由处理和打算后,才能输出一个数字。

很朴素的想法便是将各个数字所代表的矩阵提前存放在打算机内,当输入一张图片后,打算机通过打算,从而找到最适宜的数字进行输出。

举个例子,更随意马虎理解一些。
比如,打算机内部已经存放了包含数字1和7以及它们所对应的灰度矩阵。

数字1

数字7

当新输入一张图像后,程序会自动打算它的矩阵与这些矩阵的相似度。
相似度打算可利用的公式很多,比如可以利用百分比,间隔等。

大略起见,就利用两个矩阵对应元素之差的绝对值之和或者平方和等,打算机进行快速运算,找到最相似的矩阵,然后将其所代表的数字进行输出。

当输入以下内容时,经由大略打算,可以知道输出结果为 7。

四、人脸表示

既然可以用矩阵来表示图片,人脸也是照片,那么也可以用同样的方法来进行表示,下面的这张人脸可以表示为:

人脸照片

矩阵表示

五、人脸识别

虽然被叫做人脸识别,但更准确的名字该当是「人脸比对」。
人脸识别的背后,是一张待比对图片和人脸底库中的所有照片进行比对,从而判别图片中职员的身份。

一样平常来说,待比对照片便是我们在日常生活中被各种设备所采集的照片,比如通过人脸识别考勤机抓拍的照片。

由于环境、姿势等缘故原由,采集的照片具有很大的差异,导致比对成功率不高。
为了提升比对的成功率和速率,很多时候会同时抓拍多张人脸进行识别,但每次比对的时候输入照片只有一张。

所谓的人脸底库便是我们在系统中提前录入的人脸照片,照片和我们的名字逐一对应。
根据人脸底库中照片数量的不同,可以将人脸比对分为1:1和1:N,由于数量不同这两种方法的打算量和打算方法也不尽相同。

1. 1:1

1:1最常见的场景便是人证比对,比如我们在乘高铁时所碰着的这种设备。

前面的1代表我们从设备中采集的照片,而后面的1代表身份证中的照片,通过将现场采集的照片和身份证中存放的照片进行比对,通过判别持证人是否为本人。

这种情形下只涉及到两张图片的比对,打算量相对较小。

可能用在火车票安检等场景中,以是哀求的精度较高。

身份证中的照片像素较小,通过市情上的身份证读卡器读取出来的照片仅为100100像素旁边,给精度带来了一定的寻衅。

目前这个领域相对成熟,利用场景正在逐步铺开。

2. 1:N

1:N是1张人脸和底库中的N张人脸进行比对。

比如在考勤机中,我们的人脸底库中包含全公司的所有人脸照片。
当上班打卡时,考勤机采集到人脸输入系统,经由比对后输出员工身份。

这种情形下打算量相对较大,时效性和识别精度太低又会影响用户体验,以是厂商一样平常会综合考虑权衡,在设备的参数中标注所支持的人脸数量。

这一波人工智能的发展,带动了1:N领域人脸识别技能的进步,更多的产品能够在各个场景中落地。
比如聪慧城市、聪慧家居等。

海内厂商也借着这一波东风,加快技能研发和产品落地,出身了著名的AI视觉四小龙等独角兽。

本日梳理了人脸识别的基本事理,全体实现过程虽然看起来很大略,但技能却在基本事理的根本上持续完善和进步,终极达到比较好的效果。

下次我们将谈论在繁芜场景下人脸识别碰着的寻衅及办理方案。

作者:AIoT产品,10年B端产品设计履历;微信"大众年夜众号:AIoT产品

本文由@AIoT产品 原创发布于大家都是产品经理。
未经容许,禁止转载

题图来自Unsplash,基于CC0协议

标签:

相关文章