– 26 – Ⅱ 基本概念与数据处理
4.最小二乘法线性拟合
我们知道,用作图法求出直线的斜率 a 和截据 b,可以确定这条直线所对应的经验
公式
小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载
,但用作图法拟合直线时,由于作图连线有较大的随意性,尤其在测量数据比较分
散时,对同一组测量数据,不同的人去处理,所得结果有差异,因此是一种粗略的数据
处理方法,求出的 a 和 b误差较大。用最小二乘法拟合直线处理数据时,任何人去处理同
一组数据,只要处理过程没有错误,得到的斜率 a 和截据 b 是唯一的。
最小二乘法就是将一组符合 Y=a+bX 关系的测量数据,用计算的方法求出最佳的 a
和 b。显然,关键是如何求出最佳的 a 和 b。
(1) 求回归直线
设直线方程的表达式为:
bxay += (2-6-1)
要根据测量数据求出最佳的a和b。对满足线性关系的一组等精度测量数据(xi,yi),
假定自变量xi的误差可以忽略,则在同一xi下,测量点yi和直线上的点a+bxi的偏差di如下:
111 bxayd −−=
222 bxayd −−=
M
nnn bxayd −−=
显然最好测量点都在直线上(即d1=d2=……=dn=0),求出的a和b是最理想的,但测量
点不可能都在直线上,这样只有考虑d1、d2、……、dn为最小,也就是考虑d1+d2+……+dn
为最小,但因d1、d2、……、dn有正有负,加起来可能相互抵消,因此不可取;而|d1|+
|d2|+……+ |dn|又不好解方程,因而不可行。现在采取一种等效方法:当d12+d22+……+dn2
对a和b为最小时,d1、d2、……、dn也为最小。取(d12+d22+……+dn2)为最小值,求a和b
的方法叫最小二乘法。
令 = (2-6-2) ∑
=
=
n
i
idD
1
2 2
11
2 ][ ii
n
i
n
i
i baydD −−== ∑∑
==
D 对 a 和 b 分别求一阶偏导数为:
][2
11
∑∑
==
−−−=∂
∂ n
i
i
n
i
i xbnaya
D
][2
1
2
11
∑∑∑
===
−−−=∂
∂ n
i
i
n
i
i
n
i
ii xbxayxb
D
Ⅱ 基本概念与数据处理 – 27 –
再求二阶偏导数为:
n
a
D 22
2
=∂
∂ ; ∑
=
=∂
∂ n
i
ixb
D
1
2
2
2
2
显然: 022
2
≥=∂
∂ n
a
D ; 02
1
2
2
2
≥=∂
∂ ∑
=
n
i
ixb
D
满足最小值条件,令一阶偏导数为零:
0
11
=−− ∑∑
==
n
i
i
n
i
i xbnay (2-6-3)
(2-6-4) 0
1
2
11
=−− ∑∑∑
===
n
i
i
n
i
i
n
i
ii xbxayx
引入平均值: ∑
=
=
n
i
ixn
x
1
1 ; ∑
=
=
n
i
iyn
y
1
1 ;
∑
=
=
n
i
ixn
x
1
22 1 ; ∑
=
=
n
i
ii yxn
xy
1
1
则: 0=−− xbay
02 =−− xbxaxy (2-6-5)
解得: xbya −= (2-6-6)
22 xx
yxxyb
−
−= (2-6-7)
将 a、b 值带入线性方程 bxay += ,即得到回归直线方程。
(2) y、a、b 的标准差
在最小二乘法中,假定自变量误差可以忽略不计,是为了方便推导回归方程。操作
中函数的误差大于自变量的误差即可认为满足假定。实际上两者均是变量,都有误差,
从而导致结果 y、a、b 的标准差(n≥6)如下:
– 28 – Ⅱ 基本概念与数据处理
2
)(
2
1
2
1
2
−
−−
=−=
∑∑
==
n
abxy
n
d
n
i
ii
n
i
i
yσ (2-6-8)
(根式的分母为 n-2,是因为有两个变量)
yyn
i
i
n
i
i
n
i
i
a
xxn
x
xxn
x
σσσ
)()(
22
2
2
11
2
1
2
−
=
−
=
∑∑
∑
==
= (2-6-9)
yyn
i
i
n
i
i
b
xxnxxn
n σσσ
)(
1
)(
222
11
2 −
=
−
=
∑∑
==
(2-6-10)
(3)相关系数
相关系数是衡量一组测量数据xi、yi线性相关程度的参量,其定义为:
))((
2222 yyxx
yxxyr
−−
−= (2-6-11)
r值在 0<|r|≤1 中。 |r|越接近于 1,x 、y 之间线性好;r为正,直线斜率为正,
称为正相关;r为负,直线斜率为负,称为负相关。|r|接近于 0,则测量数据点分散或
xi、yi之间为非线性。不论测量数据好坏都能求出a和b,所以我们必须有一种判断测量
数据好坏的方法,用来判断什么样的测量数据不宜拟合,判断的方法是|r|
r ,则 x 和 y 具有
线性关系,可求回归直线;否则反之。
0 0
Ⅱ 基本概念与数据处理 – 29 –
例 9:灵敏电流计的电流常数Ki和内阻Rg的测量公式为 g
i
s RU
dRK
RR −=
1
2 测得的
数据同例 7,其中间处理过程如下,试用最小二乘法求出Ki和Rg,并写出回归方程的表达
式。
解:测量公式与线性方程表达式 y=a+bx 比较:
2Ry = Ux = dRK
R
b
i
s
1
= gRa −=
数据处理如表 2-6-3:
表 2-6-3 Rs=0.100Ω R1=4350.0Ω d=40.0mm
i 1 2 3 4 5 6 7 8 平均值
R2(Ω) 400.0 350.0 300.0 250.0 200.0 150.0 100.0 50.0 225.0
U(V) 2.82 2.49 2.15 1.82 1.51 1.18 0.84 0.56 1.67125
2
2R (104Ω2) 16.00 12.25 9.000 6.250 4.000 2.250 1.000 0.250 6.375
U2(V2) 7.95 6.20 4.62 3.31 2.28 1.39 0.71 0.31 3.34625
R2U(102ΩV) 11.3 8.72 6.45 4.55 3.02 1.77 0.84 0.28 4.615625
中间过程可多取位:
x=1.67125 y =225.0 2x =3.34625 2y =6.375×104 xy=461.5625
相关系数
998.0
))((
2222
=
−−
−=
yyxx
yxxyr
查表得知,当n=8 时,r0=0.834,两者比较r>r0,
说明
关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书
x、y(即U、R2)之间线性相关,
可以求回归直线。
求回归方程的系数
22 xx
yxxyb
−
−= =154.6192304
xbya −= =-33.4
代换
aRg −= =33.4Ω
– 30 – Ⅱ 基本概念与数据处理
b
dRK
R
ii
s = =154.6192304
Ki=
dbR
R
i
s =3.7170×10-9A/mm
计算标准差为:
yσ =2.64561902; aσ =2.300545589; bσ =1.257626418
计算不确定度:
ΔRg= aσ =2Ω; K
KiΔ =
b
bσ =0.81%; ΔK =0.03×10-9A/mm
测量结果表达式
电流计内阻: Rg=(33±2)Ω
g
g
R
RΔ
=6.1%
电流常数: K =(3.72±0.03)×10-9A/mm
K
KiΔ =0.81%
回归方程: R2=155U-33
5.计算器在数据处理中的应用
在处理数据时,不同的计算器的编程方式各不相同,下面以震旦 AURORA SC180 型
计算器为例作以介绍。
(1)计算标准偏差 S
① 标准偏差 S 的计算器运行公式:
1
2
)(
1
1 1
2
11
2
1
2
−
+−
=−−=
∑∑∑∑ ===
= n
xxxx
xx
n
s
n
i
n
i
i
n
i
in
i
i
因为 ∑
=
=
n
i
ixn
x
1
1
Ⅱ 基本概念与数据处理 – 31 –
所以
1
)( 2
1
1
2
−
−
=
∑∑ =
=
n
n
x
x
s
n
i
in
i
i
(只有为xi单变量)
② 操作步骤和方法
(ⅰ) 按[MODE][0]键,计算器进入单变量统计计算状态。屏右上角显示“STAT1”
指示符。
(ⅱ) 清除内存数据:按[INV][ON/C.CE]键。
(ⅲ) 数据输入:依次先键入数值,然后按[DATA]键,每完成一次输入的同时,屏
幕均会显示数据的个数 n 值。
(ⅳ) 数据修正:按[DATA]键之前,要删除错误数据,按[ON/C.CE];按[DATA]键后
要删除错误数据,再次输入该错误值,然后按[INV][DEL]。
(ⅴ) 取
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
结果:
[INV][ x ]:平均值
[INV][ ]:数据和 ∑ x
[INV][ 2∑ x ]: 数据平方和
[INV][S]:测量列的标准偏差
[INV][n]:数据个数
例 10:一组等精度测量值为:83.1、83.3、83.3、83.7、83.9、83.6、83.4、83.4、
83.1、83.2,试求 x、∑ x、 2∑ x 、S、n 。
解:
按 键 显 示
[MODE][0] ST1 0
[INV][ON/C.CE] 0
83.1[DATA] n 1
83.3[DATA] n 2
83.3[DATA] n 3
83.7[DATA] n 4
83.9[DATA] n 5
83.6[DATA] n 6
83.4[DATA] n 7
– 32 – Ⅱ 基本概念与数据处理
83.4[DATA] n 8
83.1[DATA] n 9
83.2[DATA] n 10
[INV][ x ] 83.4
[INV][ ] ∑ x 834
[INV][ 2∑ x ] 69556.22
[INV][S] 0.262466929
[INV][n] 10
注:当 n≥6 时,认为σ =S 。
(2)最小二乘法求回归直线
① 求回归直线参量 a、b、r 的计算器运行公式
由(2-6-6)、(2-6-7)、(2-6-11)式得到以下只含xi、yi两个变量的公式:
n
xby
a
n
i
i
n
i
i ∑∑
==
−
= 11
∑∑
∑∑∑
==
===
−
−
= n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
xnx
yxnyx
b
1
22
1
111
)(
])(][)([
1
2
1
22
11
2
111
∑ ∑∑∑
∑∑∑
= ===
===
−−
−
=
n
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
yynxxn
yxyxn
r
② 操作步骤和方法:
(ⅰ) 按[MODE][.],计算器进入双变量统计计算状态。屏幕右上角显示“STAT2”
指示符。
(ⅱ) 清除内存数据:按[INV][ON/C.CE]键
(ⅲ) 双变量数据输入:先键入 x 的值、 按[a]键, 然后键入 y 的值、 按[b]键,
再按[DATA]键,完成输入。屏幕会同时显示数据的个数,即 n 值。
(ⅳ) 数据修正:同单变量数据输入。
(ⅴ) 取分析结果
[INV][a]:回归直线的截距
[INV][b]:回归直线的斜率
Ⅱ 基本概念与数据处理 – 33 –
[INV][r]:相关系数
还可以取以下值:
[INV][ x ]、[INV][ y ]、[INV][Σx]、[INV][Σx2]、[INV][Σy]、[INV][Σy2]、
[INV][Σxy], 以便计算 yσ 、 aσ 、 bσ (计算器没有该三项的计算程序)。
例 11: 灵敏电流计实验所测数据如下:
RS=0.100Ω R1=4350.0Ω d=40.0mm
R2(Ω) 400.0 350.0 300.0 250.0 200.0 150.0 100.0 50.0
U(V) 2.82 2.49 2.15 1.82 1.51 1.18 0.84 0.56
要求
对教师党员的评价套管和固井爆破片与爆破装置仓库管理基本要求三甲医院都需要复审吗
所使用计算器具有计算最小二乘法的功能,求回归直线以及电流计的电流常数
Ki和内阻Rg。
解: 测量公式 g
i
s RU
dRK
RR −=
1
2 与线性方程表达式y=a+bx比较y=R2 x=U,
则:
按 键 显 示
[MODE][.] ST2 0
[INV][ON/C.CE] 0
2.82{a}400.0[b][DATA] n 1
2.49[a]350.0[b][DATA] n 2
2.15[a]300.0[b][DATA] n 3
1.82[a]250.0[b][DATA] n 4
1.51[a]200.0[b][DATA] n 5
1.18[a]150.0[b][DATA] n 6
0.84[a]100.0[b][DATA] n 7
0.56[a]50.0[b][DATA] n 8
[INV][a] a -32.12335698
[INV][b] b 153.8509241
[INV][r] r 0.9998323336
查表知道,当n=8 时,r0=0.834, r>r0,说明U、R2之间线性相关。得到:
回归方程 R2=154U-32
电流计内阻 Rg=32Ω
电流常数 K=3.74×10-9A/mm
– 34 – Ⅱ 基本概念与数据处理
习 题
1.指出下列测量结果的有效数字:
(1) I=5010mA
(2) C=2.99792458×108m/s
2.按“四舍五入”修约法,将下列数据只保留 3 位有效数字:
(1) 1.005
(2) 979.499
(3) 980.501
(4) 6.275
(5) 3.134
3.单位变换:
(1) m=3.162±0.002kg
= g
= mg
= T
(2) θ=(59.8±0.1)°
=( )ˊ
(3) L=98.96±0.04cm
= m
= mm
= µm
4.改错并且将一般表达式改写成科学表达式:
(1) Y=(1.96×1011±5.78×109)N/m2
(2) L=(160000±100)m
5.按有效数字运算规则计算下列各式:
(1) 1000-5=
(2) 3.2×103+3.2=
(3) tg3005ˊ=
(4)
125.100325.100
125.100325.100
−
+ =
(5) R1=5.10kΩ,R2=5.10×102Ω,R3=51Ω。 求:
R=R1+R2+R3=
(6) L=1.674m-8.00cm=
Ⅱ 基本概念与数据处理 – 35 –
6.求下列公式的不确定度:
(1)
hd
m
2
4
πρ =
(2) N=
22
3yx −
(3) L=h+
3
d
(4) Z=
yx
yx
+
−
7.用分度值为 1mm 的米尺测量一物体长度 L,测得数据为:98.98cm、98.96cm、98.97cm、
98.94cm、99.00cm、98.95cm、98.97cm,试求 L、 ΔL,并写出测量结果表达式
L±ΔL。
8.测量出一个铅圆柱体的直径为 d=(2.040±0.001)cm,高度为 h=(4.120±0.001)cm,
质量为 m=(149.10±0.05)g,试计算 ρ、 ρΔ ,并表示测量结果。
9.某同学测量弹簧倔强系数的数据如下:
F(g) 2.00 4.00 6.00 8.00 10.00 12.00 14.00
y(cm) 6.90 10.00 13.05 15.95 19.00 22.05 25.10
其中F为弹簧所受的作用力,y为弹簧的长度,已知y-y0=(
k
1 )F,试用作图法求弹簧
的倔强系数k及弹簧的原来长度y0。
10.用伏安法测电阻时,测出的数据如下,试求回归直线,并求出测量结果 R 值。
I(mA) 2.00 4.00 6.00 8.00 10.00 12.00 14.00 16.00 18.00 20.00
U(V) 1.00 2.01 3.05 4.00 5.01 5.99 6.98 8.00 9.00 9.96
11. 用双臂电桥对某一电阻作多次等精度测量,测得数据如下:
R(Ω):12.06 12.10 12.12 12.15 12.16 12.17 12.19 12.21 12.22
12.25 12.26 12.35 12.42 12.83
试用 3σ 准则判断该测量列中是否有坏值,计算出检验后的算术平均值及平均值的
标准差,正确表达测量结果。
4.最小二乘法线性拟合
5.计算器在数据处理中的应用
习 题