皮尔逊相关系数

皮尔逊相关系数 两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商
上式定义了总体相关系数,常用希腊小写字母 作为代表符号。估算样本的协方差和标准差,可得到皮尔逊相关系数,常用英文小写字母 代表 $ \rho{X,Y}=\frac{cov(X,Y)}{\sigma{X}\sigma{Y}}=\frac{E[(X-\mu{x})(Y - \mu{Y})]}{\sigma{X}\sigma{Y}} $ $ r = \frac{\sum{i=1}^n(X{i}-\overline X)(Y{i}-\overline Y)}{\sqrt{\sum{i=1}^n(X{i}-\overline X)^2}\sqrt{\sum{i=1}^n(Y{i}-\overline Y)^2}} $


from scipy import stats
import numpy  as np
a = np.array([0, 0, 0, 1, 1, 1, 1])
b = np.arange(7)
stats.pearsonr(a,b)
(0.8660254037844386, 0.011724811003954654)