参考
https://www.mathsisfun.com/data/standard-deviation.html
標準差的介紹與計算方法
标准差(Standard Deviation) ,数学术语,是离均差平方的算术平均数(即:方差)的算术平方根,用σ表示。标准差也被称为标准偏差,或者实验标准差,在概率统计中最常使用作为统计分布程度上的测量依据。
标准差 计算公式
标准差 标准差的性质和应用
标准差(Standard Deviation),在概率统计中最常使用作为统计分布程度(statistical dispersion)上的测量。标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。测量到分布程度的结果,原则上具有两种性质:
标准差 公式意义
标准差 离散度
标准差 极差
标准差 离均差平方和
标准差 方差
标准差 标准差意义
标准差 变异系数
标准差 标准差、标准误差
标准差表示的就是样本数据的离散程度。标准差就是样本平均数方差的开平方,标准差通常是相对于样本数据的平均值而定的,通常用M±SD来表示,表示样本某个数据观察值相距平均值有多远。从这里可以看到,标准差受到极值的影响。标准差越小,表明数据越聚集;标准差越大,表明数据越离散。标准差的大小因测验而定,如果一个测验是学术测验,标准差大,表示学生分数的离散程度大,更能够测量出学生的学业水平;如果一个测验测量的是某种心理品质,标准差小,表明所编写的题目是同质的,这时候的标准差小的更好。标准差与正态分布有密切联系:在正态分布中,1个标准差等于正态分布下曲线的68.26%的面积,1.96个标准差等于95%的面积。这在测验分数等值上有重要作用。
标准误差表示的是抽样的误差。因为从一个总体中可以抽取出无数多种样本,每一个样本的数据都是对总体的数据的估计。标准误差代表的就是当前的样本对总体数据的估计,标准误差代表的就是样本均数与总体均数的相对误差。标准误差是由样本的标准差除以样本容量的开平方来计算的。从这里可以看到,标准误差更大的是受到样本容量的影响。样本容量越大,标准误差越小,那么抽样误差就越小,就表明所抽取的样本能够较好地代表总体。
一文看不懂方差和标准差
西西弗Sisyphus 于 2020-09-11 19:41:01 发布 4371 收藏 12
以例子说明什么是均值(Mean),方差(Variance)和标准偏差((Standard Deviation)
Mean = 600 + 470 + 170 + 430 + 300 5 = 1970 5 = 394 \begin \text < Mean >&=\frac \\ &=\frac \\ &=394 \end Mean = 5 6 0 0 + 4 7 0 + 1 7 0 + 標準差的介紹與計算方法 4 3 0 + 3 0 0 = 5 1 9 7 0 = 3 9 4
平均高度是394毫米。 看绿色的线段,我们把它画在图表上。
方差(Variance)
σ 2 = 20 6 2 + 7 6 2 + ( − 224 ) 2 + 3 標準差的介紹與計算方法 6 2 + ( − 94 ) 2 5 = 42436 + 5776 + 50176 + 1296 + 8836 5 = 108520 5 = 21704 \begin \sigma^ &=\frac<206^+76^+(-224)^+36^+(-94)^> \\ &=\frac \\ &=\frac \\ &=21704 \end σ 2 = 5 2 0 6 2 + 7 6 2 + ( − 2 2 4 ) 2 + 標準差的介紹與計算方法 3 6 2 + ( − 9 4 ) 2 = 5 4 2 4 3 6 + 5 7 7 6 + 5 0 1 7 6 + 1 2 9 6 + 8 8 3 6 = 5 1 0 8 5 2 0 = 2 1 7 0 4
方差是21704
标准偏差=标准差
标准差就是方差的平方根
标准偏差(Standard Deviation)
σ = 21704 = 147.標準差的介紹與計算方法 32 … \begin \sigma &=\sqrt \\ &=147.標準差的介紹與計算方法 標準差的介紹與計算方法 32 \ldots \end σ = 2 1 7 0 4
= 1 4 7 . 3 2 …
约等于147
问题一:为什么是差的平方?
假设有这样的两组4个数
第一组是 9 、 9 、 1 、 1 9、9、1、1 9 、 標準差的介紹與計算方法 9 、 1 、 1
第二组是 12 、 6 、 − 1 、 3 12、6、-1、3 標準差的介紹與計算方法 1 2 、 6 、 − 1 、 3
计算第一组
均 值 = ( 9 + 9 + 1 + 1 ) / 4 = 5 均值 =( 9+9+1+1)/4=5 均 值 = ( 9 + 9 + 1 + 1 ) / 4 = 5
计算各个数与均值差多少
9 標準差的介紹與計算方法 − 5 = 4 9 − 5 = 4 1 − 5 = ( − 4 ) 1 − 5 = ( − 4 ) \begin 9-5=4 \\ 9-5=4 \\ 1-5=(-4) \\ 1-5=(-4) \end 9 − 5 = 4 9 − 5 = 4 1 − 5 = ( − 4 ) 1 − 5 = ( − 4 )
可视化看一下
直接加起来0
4 + 4 − 4 − 4 4 = 0 \frac=0 4 4 + 4 − 4 − 4 標準差的介紹與計算方法 = 0
用绝对值的方法算是4
∣ 4 ∣ + ∣ 4 ∣ + ∣ − 4 ∣ + ∣ − 4 ∣ 4 = 4 + 4 + 4 + 4 4 = 4 \frac<|4|+|4|+|-4|+|-4|>=\frac=4 4 ∣ 4 ∣ + ∣ 4 ∣ + ∣ − 4 ∣ + ∣ − 4 ∣ = 4 4 + 4 + 4 + 4 = 4
用平方的方法算是4
计算第二组
( 12 + 6 + ( − 1 ) + 3 ) / 4 = 5 (12+6+(-1)+3)/4=5 ( 1 2 + 6 + ( − 1 ) + 3 ) / 4 = 5
计算各个数与均值差多少
12 − 5 = 7 6 − 5 = 1 − 1 − 5 = ( − 6 ) 3 − 5 = ( − 2 ) 標準差的介紹與計算方法 \begin 12-5=7 \\ 6-5=1 \\ -1-5=(-6) 標準差的介紹與計算方法 \\ 3-5=(-2) \end 1 2 − 5 = 7 6 − 5 = 1 − 1 − 5 = ( − 6 ) 3 − 5 = ( − 2 )
直接加起来是0
用绝对值的方法算是4
∣ 7 ∣ + ∣ 1 ∣ + ∣ − 6 ∣ + ∣ − 2 ∣ 4 = 7 + 1 + 6 + 2 4 = 4 \frac<|7|+|1|+|-6|+|-2|>=\frac=4 4 ∣ 7 ∣ + ∣ 1 ∣ + ∣ − 6 ∣ + ∣ − 2 ∣ = 4 7 + 1 + 6 + 2 = 4
用平方的方法算是4.74
教科书《概率论与数理统计》浙江大学第四版的答案是
E < ∣ X − E ( X ) ∣ >E\ <|X-E(X)|\>E < ∣ X − E ( X ) ∣ >能度量随机变量与其均值 E ( X ) E(X) E ( X ) 的偏离程度。但由于上式带有绝对值,运算不方便,通常用量 E < [ X − E ( X ) ] 2 >E\left\<[X-E(X)]^<2>\right\> E < [ X − E ( X ) ] 2 >来度量随机变量 X X X 与其均值 E ( X ) E(X) E ( X ) 的偏离程度。
方差的定义
这样定义就有了
设 X X X 是一个随机变量,若 E < [ X − E ( X ) ] 2 >E\left\<[X-E(X)]^<2>\right\> E < [ X − E ( X ) ] 2 >存在,则称 E < [ X − E ( X ) ] 2 >E\left\<[X-E(X)]^<2>\right\> E < [ X − E ( X ) ] 2 >为 X X X 的方差,记为 D ( X ) D(X) D ( X ) 或Var(X)。
即 D ( X ) = Var ( X ) = E < [ X − E ( X ) ] 2 >D(X)=\operatorname(X)=E\left\<[X-E(X)]^<2>\right\> D ( X ) 標準差的介紹與計算方法 = V a r ( X ) = E < [ X − E ( X ) ] 2 >,而 σ ( X ) = D ( X ) = E < [ X − E ( X ) ] 2 >\sigma(X)=\sqrt=\sqrt
称为标准差或均方差。
他说的运算不方便是怎么回事呢?
人手工算还是计算机算,在什么情况下运算不方便?
方差这个词是怎么来的呢?
罗纳德·费雪(Ronald Fisher 1890-1962)
现代统计学与现代演化论的奠基者之一,最大似然估计就是他发明的。
第一次世界大战时期他也发表了许多与生物统计相关的论文,包括《孟德尔遗传假定下的亲戚之间的相关性》(The 標準差的介紹與計算方法 Correlation Between Relatives on the Supposition of Mendelian Inheritance)。这篇论文在1916年完成,并在1918年发表,它同时建立了以生物统计为基础的遗传学,以及著名的统计学分法变异数分析(analysis of variance,简写为ANOVA,也称方差分析)。方差一词就是从他的论文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance》 提出的。
标准差的公式有两个
总体标准差(Population Standard Deviation)和样本标准差(Sample Standard Deviation)
不一样的方差
如果这些数据只是样本呢,就是我们有20只狗,我们只测量了5只
公式就放生了变化
原来的公式叫总体标准差
现在公式要变了叫样本标准差 公式如下
看分母一个是N,一个是N-1,为什么是这样呢?
另一种证明
参考
https://www.mathsisfun.com/data/standard-deviation.html