使用K-means对网站访问者进行聚类
2018 年 1 月 23 日 / 作者: Jeary / 标签: 记录 数据检索 网络安全 日志分析 Web安全 数据分析
在分析Web日志流程中,寻找可疑请求、寻找异常访问者为分析流程中的基础流程,传统的做法是使用正则进行筛选,而这些正则则是通过我们已知的安全经验编写出来的,此时我们可以通过尝试一些新的方法~
一、数据准备
同上篇
二、算法测试
依赖库地址:[K-Means Java实现](https://sourceforge.net/p/yuanboshekmeans/code/ref/master/)
我们下载kmeans库之后将其引用到项目中,并编写测试Demo,测试库的可用性。测试Demo如图:
可以看到我们使用了4个3维的样本数据,数据...