首页  

异常值检测的两种常用方法     所属分类 data 浏览量 290
异常值检测
两种方法  三倍标准差判别法 和 Tukey's Test

方差和标准差
标准差 方差的平方根,通常用σ表示

如果数据在平均值的正负一倍标准差(1σ)范围之内波动,则视为正常波动。
如果数据在平均值的正负一倍标准差(1σ)范围之外,并且在两倍标准差(2σ)的范围内波动,则视为普通异常波动数据。
如果数据在平均值的正负二倍标准差(2σ)范围之外,并且在三倍标准差(3σ)的范围内波动,则视为中度异常波动数据。
如果数据在平均值的正负三倍标准差(3σ)范围之外,则视为严重异常波动数据。


Tukey's Test 利用四分位数判断异常值的一种方法 数据的 下四分位数 Q1 和 上四分位数 Q3 根据四分位数估算出一组数据可能的异常最大值和最小值 最大值估算公式 Q3+k(Q3-Q1) 最小值估算公式 Q1-k(Q3-Q1) 超出估算的范围时 ,代表异常 k可以取1.5或3 当k=1.5时,代表中度异常 当k=3时,代表极度异常

上一篇     下一篇
mysql JDBC rewriteBatchedStatements

spring 组件类名相同 bean name冲突

获取有序数组中第一个大于等于目标值的索引

好习惯之预习

小学生的一些好习惯

十五年小学班主任揭秘小学真相