基于密集行为的欺诈检测算法-LockInfer
论文地址:http://pengcui.thumedialab.com/papers/lockinfer-kais15.pdf
代码地址:https://github.com/mjiang89/LockInfer
一、LockInfer算法概述
1、密集行为的案例
2、低密度密集连接
二、密集行为的类型
三、不同密集行为特征子空间可视化
在模拟的随机仿真图中,在特征子空间中粉丝都在原点周围分散。 在微博数据中,粉丝组 F0 的不重合密 集行为会在邻接矩阵中形成密集块,在特征子空间中形成镭射线。 粉丝组 F1-F3 的重合 密集行为会形成阶梯状结构和珍珠状的子空间分布。
1、不含密集行为的随机图
2、存在不重合密集行为的图
3、存在部分重合密集行为的图
四、密集行为的特征子空间的进一步分析
1、密集块定义
k维度的奇异值分解(SVD)是把形式为 A = UΣVT 的矩阵因子化,其中 Σ 是由前 k 大的奇异值组成的、大小为 k × k 的对角矩阵,U 和 V 是大小为 N × k 的 正交矩阵,其中分别包含左奇异向量和右奇异向量。un,i 是矩阵 U 的第 (n,i) 个元 素,相似的,vn,i 是矩阵 V 的元素。un,i 是第 n 个粉丝在第 i 个左奇异向量中的值。定义 (i, j)-左特征子空间图为点集 (un,i, un, j) 形成的散点图,这就是 N 个粉丝的第 i 和第 j 个左奇异向量的映射。可以同样定义 N 个用户作为被关注人的情况,所以 (i, j)-右特征子空间图就是点集 (vn,i, vn, j) 的散点图。这个图能够可视化所有点,如果恰当使用,是可以解释很多邻接矩阵的内在性质的。
2、构造仿真数据
五、基于特征子空间的密集行为检测算法实现
六、与其他算法的对比
下表给出本工作的 LockInfer 算法与采用特征向量和特征子空间的传统图挖掘方法相比,既有效、又有可解释性,还兼具可扩展性。
先写到这里吧,眼见看花了,需要跟多细节的,回复【论文】,获取中文论文。
SynchroTrap-基于松散行为相似度的欺诈账户检测算法
评论