首页  

线性回归中常见的一些统计学术语(RSE RSS TSS ESS MSE RMSE R2 Pearson's r)     所属分类 math 浏览量 445
y = ax + b 
y 因变量  dependent variable 
x 自变量  independent variable 
a 斜率    slope
b 截距    intercept



TSS: Total Sum of Squares(总离差平方和) 
因变量的方差
sum( (y-avgy)^2 )

 

RSS: Residual Sum of Squares (残差平方和) 
由误差导致的真实值和估计值之间的偏差平方和(Sum Of Squares Due To Error)

sum( (y-y')^2 )
y' 估计值

 

ESS: Explained Sum of Squares (回归平方和) 
被模型解释的方差(Sum Of Squares Due To Regression) 

sum( (y' - avgy)^2 )


TSS=RSS+ESS


R2: Coefficient of Determination(决定系数) 
因变量方差中可由自变量解释的比例,是模型解释力的指标

R2 = (TSS - RSS)/ TSS  = 1 - (RSS / TSS) 



adjusted R2: 与R2类似,不过考虑到了样本数和变量数

调整后R2 = 1 - (1-R2)(n - 1)/(n - p - 1)

n-p-1: 自由度
p: 特征数




MSE: Mean Squared Error (均方误差) 
真实值和估计值之间的偏差平方和的平均值,用来评估模型的效果

sum( (y-y')^2) / n  



RMSE: Root Mean Squared Error(均方根误差) 
MSE的根,可从单位度量上衡量模型的效果

RMSE = MSE^0.5
 

RSE: Residual Standard Error(残差的标准误差) 
描述目标和真实回归线之间的平均偏移量,用来估计残差的标准差

RSE = (RSS / (n-p-1)) ^ 0.5 

 

Correlation
Pearson's r(皮尔逊相关系数)  
用来检测自变量X和因变量Y之间的线性关系有多强


cor(x,y) = sum((x-avgx)(y-avgy)) / ( sum((x-avgx)^2) * sum((y-avgy)^2) )

上一篇     下一篇
沪深300指数和沪深300ETF 对比分析

时序数据趋势判断

沪深300 线性回归画趋势线

线性回归的R方

简单线性回归 斜率 截距 计算

统计分析关键术语