异常值检测的两种常用方法
所属分类 data
浏览量 463
异常值检测
两种方法 三倍标准差判别法 和 Tukey's Test
方差和标准差
标准差 方差的平方根,通常用σ表示
如果数据在平均值的正负一倍标准差(1σ)范围之内波动,则视为正常波动。
如果数据在平均值的正负一倍标准差(1σ)范围之外,并且在两倍标准差(2σ)的范围内波动,则视为普通异常波动数据。
如果数据在平均值的正负二倍标准差(2σ)范围之外,并且在三倍标准差(3σ)的范围内波动,则视为中度异常波动数据。
如果数据在平均值的正负三倍标准差(3σ)范围之外,则视为严重异常波动数据。
Tukey's Test
利用四分位数判断异常值的一种方法
数据的 下四分位数 Q1 和 上四分位数 Q3
根据四分位数估算出一组数据可能的异常最大值和最小值
最大值估算公式 Q3+k(Q3-Q1)
最小值估算公式 Q1-k(Q3-Q1)
超出估算的范围时 ,代表异常
k可以取1.5或3
当k=1.5时,代表中度异常
当k=3时,代表极度异常
上一篇
下一篇
mysql JDBC rewriteBatchedStatements
spring 组件类名相同 bean name冲突
获取有序数组中第一个大于等于目标值的索引
好习惯之预习
小学生的一些好习惯
十五年小学班主任揭秘小学真相