首页 » 通讯 » 详解设备指纹核心算法_装备_指纹

详解设备指纹核心算法_装备_指纹

乖囧猫 2025-01-15 17:43:10 0

扫一扫用手机浏览

文章目录 [+]

比如我们熟知的网络钓鱼、薅羊毛、账号盗取、注册登录等带来的盗用和敲诈都是其身份不愿定性造成的直接后果。

那么,如何担保你的身份确定且黑灰产不会轻易盗取或者模拟呢?

详解设备指纹核心算法_装备_指纹 通讯

设备指纹便是一个不错的选择。

此前顶象在《从Cookie到设备ID,从算法到云+端!
全面盘点设备指纹技能的五代发展》一文中详细先容过设备指纹技能的迭代,感兴趣的朋友可以回顾下。

从设备指纹的观点可知,设备指纹是指通过用户上网设备的硬件、网络、环境等特色信息天生设备的唯一标识,而衡量设备指纹利害的最主要指标便是唯一性和稳定性。

本文就从设备指纹的稳定性和唯一性提及。

要担保设备指纹的稳定性唯一性并不大略

设备指纹作为标识手机或者浏览器的唯一 ID,首先要做的是对用户的设备进行数据采集,但数据采集对付设备指纹技能而言并不是很随意马虎。

首先是法律层面对于用户个人信息数据的保护权限上升。

近年来出台的对个人信息数据的保护条款对付数据采集的权限一贯在持续收紧,具备设备唯一标识浸染的特色可采集率越来越少,一定程度上加大了设备指纹技能的难度。

以前采集设备指纹唯一标识的方法可利用MAC地址(以太网物理地址)、IMEI(移动设备识别码)、IDFA(广告标识符)等类似标识即可唯一标识一个设备。
随着系统的不断更新迭代,加之与黑灰产的对抗逐渐白热化,各种作弊手段和工具的涌现,设备上的各种参数都可以被修改和假造,通过一键抹机,变成一台新的设备,这就影响了对设备唯一标识的效果。
此时就须要设备指纹技能采集更多的信息来担保设备指纹的唯一性和稳定性。

以iOS 系统为例,iOS 14往后IDFA采集须要用户授权才可以,Serial、IMEI等都存在类似情形。
这种变革对设备指纹的打算带来了影响,天生一个稳定且唯一的标识会越来越繁芜。

其次是非常数据增多。

不同的手机型号和操作系统版本会导致采集到的数据有不同的特性。
尤其是安卓,品牌多,操作系统版本多,各种ROM多,数据的可采集性分歧一。

1、以IMEI为例,以下是实际采集到的一些非常数据。

000000000000000

88888888888888

666666666666667

111111111111119

A000005EAAACCC

868686868686863

444646464643346

100000000150705

010000000053015

A0000060A60A0B

A0000070000AAB

2、同样非常的MAC地址。

00:00:00:00:00:0a

02:00:00:00:00:00

00:00:00:00:00:01

00:00:00:00:00:10

6a:aa:6a:aa:6a:6a

00:02:00:00:00:00

00:00:00:80:00:00

10:00:00:00:00:12

f2:0f:f0:02:f0:22

32:12:31:23:32:32

66:00:44:40:06:66

c0:00:00:00:00:d0

00:00:00:00:00:12

04:00:00:50:54:04

这些非常数据或来自被修改的设备,或是非常的ROM,或者是分外的机型设备,其他诸如android_id、Seria也都会存在这种情形。
如果不考虑处理这些非常数据,指纹的效果肯定会受到影响。
以是采集哪些数据用于指纹打算,数据有哪些非常情形,须要有大数据支撑才能制订合理的算法。

并且,指纹打算算法并不是一成不变的,新版本操作系统发布,新型号手机,这些随时都有可能导致数据采集涌现非常,这须要设备指纹具备持续性的对非常数据的监测能力。

末了是黑灰产的作弊手段影响。

设备指纹在风控领域是对抗黑灰产的一个根本工具,以是黑灰产一定会想尽办法来绕过指纹的追踪和检测。
常见的办法是通过各种工具来修正设备指纹使设备指纹发生改变,即人工修改。

设备信息的修改除了可能会影响指纹打算,还有可能会造成指纹数据污染。
大量修改后的缺点数据如果和正常用户的设备产生关联,会导致正常用户的数据受到不可控的影响,而且这种数据想从系统中剔除干净是比较困难的。

基于特色信息精准匹配担保设备指纹稳定性

那么,这就哀求设备指纹做出改变,顶象的做法是通过云+端模式,补足信息采集短板,显著增强设备攻防对抗的时效性和安全性,综合各行业的攻防履历和风险数据沉淀,当新的攻击办法和特色涌现时,设备指纹能够更快的感知应对和准确识别。

详细到设备指纹的稳定性和唯一性上,如何应对呢?

我们先来看稳定性。

稳定性打算逻辑是通过采集到的数据,构建多维度的设备画像,每次设备重新上报数据后,通过算法匹配到最附近的设备,如果找到则利用找到的设备指纹,反之则天生新的设备指纹。

而之以是要强调设备指纹的稳定性,是由于很多操作会导致设备的特色信息发生变革比如App卸载重装、权限变更、重置广告标识符、机器重启、系统升级、修正设备参数、规复出厂设置等等。

想要在以上这些情形下打算出一个稳定的设备唯一标识,当然不可能只依赖一两个设备参数,须要更全面的设备信息来构建一个设备画像。

而要担保设备指纹的高稳定性,则须要采集多维度数据,进行区分度、稳定性、变革周期等方面的全方位剖析,对特色特性的准确剖析帮助算法更合理的利用特色。

以CPU,存储,内存等特色为例,其具备非常好的稳定性,但区分度非常差。
以是这类特色不适宜单独利用,须要和其他特色结合在一起形成互补。

这就须要我们进一步不雅观察其特色稳定周期(特色保持不变的周期大小)和特色稳定变革的难度(改变特色的难易程度),基于特色的不同特性来决定如何利用特色,选取一个特色时,其至少要在某个指标上有明显上风。

综上,不丢脸出,要担保设备指纹的稳定性须要基于不同特色的不同特性,为设备构建多个设备画像(短期和长期),首先要通过相似性搜索算法先定位出一批相似设备,再用精准匹配算法准确匹配。

其基本算法(SimHash)过程如下:

1、从采集设备信息中选取部分作为特色池;

2、根据采集信息的区分度、稳定性、变革难度等,对特色相应处理后进行hash 编码,比如将多个区分度弱的特色拼接后再进行hash 编码,得到编码向量C;

3、根据特色的特性,设定编码向量C的权重W,(把稳:权重W可基于大数据学习得到,亦可根据专家履历设定,不同操作系统版本的设备,权重W可以不一样);

4、将编码向量C与对应的权重W相乘,得到特色向量C’;

5、将所有特色向量C’相加得到一个特色向量,二值化(大于0的值变为1,小于0的值变为0)后得到末了的索引D;

6、将索引D与做事器中的其他设备索引进行相似度打算,(打算海明间隔—在信息编码中,两个合法代码对应位上编码不同的位数称为码距,又称海明间隔。
两个码字对应比特取值不同的比特数称为两个码字的海明间隔。
例如10101和00110从第一位开始依次有第一位、第四、第五位不同,则海明间隔为3)返回相似度在阈值以内的设备信息作为候选池,进行进一步的精准匹配。

须要把稳的是,设备指纹稳定性的效果依赖于是否选取了充分且得当的特色、是否对每个特色的特性有精确的理解、是否采取了符合数据获取现状的得当匹配算法。

算法更新+碰撞检测=设备指纹唯一性“法宝”

再来看下唯一性。

唯一性是设备指纹非常关键的一个指标。

设备指纹作为一项根本做事,是浩瀚数据做事的核心要素,比如用户常用设备、风控中依赖设备的策略、广告唯一标识等。
如果指纹唯一性打算涌现偏差,即碰撞,可能会引起严重的误判。

比如碰撞后,可能会判断出设备涌如今陌生地区,关联陌生账号,导致误惩罚;如果涌现大面积碰撞,会导致风控拦截大批正常用户。
碰撞会直接导致指纹可信度低落,使得线上业务不敢再依赖基于指纹的判断。
以是一个好的设备指纹,唯一性上一定不能有大的偏差。

而导致碰撞的缘故原由则可能由于某些该当具备唯一性的主要设备特色涌现不唯一,亦或是特色选择不当,多个特色组合后唯一性标识不足,当然也可能是匹配算法问题。

因此,在担保设备指纹的唯一性层面,不仅须要具备实时动态更新的算法匹配,更要看重碰撞检测。

首先,就算法更新而言,日常的非常数据的检测仅靠运用是不足的,须要离线仓库定期剖析当前的数据,对涌现的非常特色可以及时创造并提取出来,然后反馈给线上进行算法优化。

就碰撞检测能力而言,顶象也是得到了专利认证。

顶象设备指纹的碰撞检测能力,可避免非常数据进入影响指纹数据。
采取设备的uuid不可逆事理来检测碰撞。
对付同一台设备,多次采集数据进行打算,uuid在这期间可能会发生变革,变革往后则不可能变回以前的uuid,如果一台设备在某次打算后涌现历史uuid,则表明本次打算不可信,涌现了设备碰撞情形。

其基本事理是:

1、设备首次利用App,采集设备数据上报时,指纹做事器下发一个凭据,缓存在客户端,首次下发的凭据称为凭据X1;

2、设备再次利用App,采集设备数据上报时,先检讨是否有缓存客户端在的凭据X1;若有,则携带上凭据X1;若没有,则认为是由于清理缓存导致凭据X1被删除,指纹做事器下发凭据X2,凭据X2与凭据X1不相同;

3、在天生凭据X2往后,采集设备数据上报时再次涌现凭据X1,则判断设备指纹涌现了碰撞;

4、在多次清理缓存的情形下,还包括按涌现顺序依次排列的凭据X3、凭据X4…凭据XN,只要检测到凭据XN之后涌现过此前曾涌现的凭据X1至凭据X(N-1)中的任一个,则判断设备指纹涌现了碰撞;

当然,设备的碰撞检测也有其他办法可以实现,但不适宜沿用指纹本身的打算思路了,由于碰撞时运用已经‘犯错’了,以是上面先容的以一个‘旁路’的办法来检测会更适宜。

此外,顶象设备指纹的打算流程涵盖了数据解析,特色选取,算法匹配,碰撞检测等。

同时,针对私有化用户,顶象供应防御云做事,将云做事设备指纹网络到的最新打算算法同步到防御云平台,私有化指纹可以保持和云做事同步更新。

整体来看,设备指纹在唯一性和稳定性层面,不仅做到了防止采集逻辑被破解或数据假造,从数据采集源头上担保真实性和准确性,并且针对黑灰产对设备参数进行修改假造(修改IMEI、MAC地址、AndroidId、SIM卡信息、机型、品牌等),或是禁用、打消缓存和cookie等风险,能够担保设备指纹保持不变,稳定性保持在99%以上,为每一台设备天生的设备指纹ID环球唯一,不可被修改,唯一性上保持在100%,相应韶光小于0.1秒、崩溃率小于1/10000。

同时,设备指纹作为顶象防御云的一部分,集成了业务安全情报、云策略和数据模型,通过对上网软硬件天生唯一指纹信息,支持安卓、iOS、H5、小程序,可有效侦测仿照器、刷机改机、ROOT越狱、挟制注入等风险。

标签:

相关文章