首页 01_矩阵论_第一章

01_矩阵论_第一章

举报
开通vip

01_矩阵论_第一章null第一章 线性空间与线性变换第一章 线性空间与线性变换null本章主要内容 1. 线性空间 向量空间是几何空间的推广,线性空间是向量空间的推广。 线性空间是某类客观事物从量的方面的一个抽象,其概念是以 n 维向量的概念及运算法则加以抽象, 以公理化的形式给出的。null 2. 线性变换 线性变换是一种特殊的映射,主要讨论线性空间中元素之间的最基本联系。 3.矩阵的作用 在线性空间和线性变换的讨论中,矩阵是一个重要的工具。特别地,矩阵还是线性变换的便利...

01_矩阵论_第一章
null第一章 线性空间与线性变换第一章 线性空间与线性变换null本章主要内容 1. 线性空间 向量空间是几何空间的推广,线性空间是向量空间的推广。 线性空间是某类客观事物从量的方面的一个抽象,其概念是以 n 维向量的概念及运算法则加以抽象, 以公理化的形式给出的。null 2. 线性变换 线性变换是一种特殊的映射,主要讨论线性空间中元素之间的最基本联系。 3.矩阵的作用 在线性空间和线性变换的讨论中,矩阵是一个重要的工具。特别地,矩阵还是线性变换的便利表达方法。null§ 1.1 线性空间 一、线性空间的概念 在线性代数课程中,我们把有序数组称为向量,把 n 维向量的全体所构成的集合 Rn 称为 n 维向量空间。一般地,如果 V 为非空的 n 维向量的集合,且集合 V 对于向量加法及数乘两种运算封闭,那么就称集合 V 为向量空间。null 不难验证,2 维几何空间 R2 和 3 维几何空间 R3 分别是 2 维和 3 维向量空间;集合 V = {x = (0, x2, x3)T | x2, x3R} 是 2 维向量空间,如图 1 所示;齐次线性方程组 Ax = 0 的解集也构成向量空间。 null图 1 二维向量空间 V = {x = (0, x2, x3)T | x2, x3R}null 本质上,向量空间就是满足某些特性(比如对于向量加法及数乘两种运算封闭)的向量集合,它的一个直观模型是向量几何,2 维和 3 维几何空间中大多数有用的结论都可以扩展到向量空间。 定义向量空间的目的是讨论向量集合的一般性质。 向量空间定义的要素是:集合、运算和运算法则。null 然而,在现代数学中,“向量”的概念不仅限于“有序数组”,符合一定条件的任何数学对象都可被当作向量处理。线性空间就是向量空间的一般化,它将某类客观事物从量的方面进行抽象,并以向量及其运算法则的形式加以描述。 null 定义 1.1 设 V 是一个以 , , , …为元素的非空集合,F 是一个数域。在其中定义两种运算,一种叫加法:,V,  + V;另一种叫数量乘法:kF, V, kV,并且满足下面八条运算法则: (1) 加法交换律: +  =  + ; (2) 加法结合律:( +  ) +  =  + ( +  ); (3) V 中存在零元素:0V, V,  + 0 = , 记 0 = 0; (4) 负元素存在: V, V, 使  +  = 0, 记  =  ; null (5) 数乘结合律:(kl) = k(l); (6) 存在 1F, 1 =  ; (7) 分配律:(k + l) = k + l ; (8) 分配律:k( +  ) = k + k,则称 V 为数域 F 上的线性空间。V 中元素称为向量。F 为实(复)数域时,称 V 是实(复)线性空间。 通常我们称满足定义 1.1 中八条运算法则的加法及数乘运算为线性运算;凡定义了线性运算的集合,都构成线性空间。null 例 1 对给定的数域 F,集合 F n = {(x1, x2, …, xn)T | xiF},对通常的向量的加法和数乘运算,F n 为域 F 上的线性空间,当 F 为实数域 R 和复数域 C 时,Rn 和 Cn 是它的两种具体形式。 例 2 V = F mn = {A = (aij)mn | aijF},它在矩阵的加法与数乘运算下构成数域 F 上的线性空间,称为矩阵空间,其中 Rmn 为由一切 mn实矩阵构成的实矩阵空间。null 例 3 实数域 R 上次数不超过 n  1 次的关于文字 x 的一切多项式和零多项式所构成的集合 在通常多项式加法和数乘多项式运算下构成线性空间 Pn[x]。 值得指出的是次数等于 n  1 的多项式集合不是线性空间。null 例 4 V = C[a, b] = {f (x) | f (x)是区间[a, b]上实连续函数},对于函数的加法与数乘运算构成实数域上的线性空间。 从上述线性空间例子中可以看到,许多常见的研究对象都可以在线性空间中作为向量来研究。另外应理解加法和数乘分别是 V 中的一个二元运算和数域 F 和 V 中元素间的运算,要求运算满足定义 1.1 中的八条性质,它们已不再局限在数的加法、乘法的概念中。 null 一个数学例子 取集合为正实数集合 R+,F 为实数域 R,加法“”和数乘“”如下定义 :a, bR+,ab = ab,  :kR(i.e. F ),aR+,k  a = ak。 在此运算下,R+ 是 R 上的一个线性空间,其中加法零元素是 R+ 中的数 1,R+ 中元素 a 的负元素是 a1。 null 定理 1.1 线性空间 V 有如下性质: (1) V 中的零元素惟一; (2) V 中任一元素的负元素惟一; (3) 设 0 为数零,0 为 V 中零向量,则 (i) 0 = 0. (ii) k0 = 0, kF. (iii) 若 k = 0,则一定有 k = 0 或  = 0. (iv) (1) = 。null 注记 1 有些教材中,向量空间与线性空间表示的是同一个概念,但我们通常用向量空间来表示某一数域上的以该数域中的 n 元有序数组为元素构成的线性空间。 此外,从上述线性空间的例子中可以看到,许多常见的研究对象都可以在线性空间中作为向量来研究,只不过它们此时未必是有序数组了。null 注记 2 定义 1.1 中的加法和数乘运算分别是V 中的一个二元运算以及数域 F 和 V 中元素间的运算,它们已不再局限于数的加法、乘法或者数值向量的加法、数乘概念。如上述的几个例题。 注记 3 线性空间的本质是线性运算。同一个集合,若定义两种不同的线性运算,就构成不同的线性空间;若定义的运算不是线性运算,就不能构成线性空间。如前述的数学例子。null 注记 4 抽象的线性空间的作用在于,由它得出的一切结论对诸如上述各例中具体的线性空间均适用,在很大程度上可以代替这些具体线性空间的研究。 注记 5 线性空间是我们在大学中遇到的第一个抽象的空间。通俗地讲,“给定一个集合,在这个集合上定义某些运算,使之满足某些性质”,就可以称这个集合为“空间”。null 线性空间其实还是比较初级的空间,如果线性空间中定义了范数,就成了赋范线性空间;如果赋范线性空间满足完备性,就成了巴那赫空间;如果赋范线性空间中定义了角度,就有了内积空间;如果内积空间再满足完备性,就得到希尔伯特空间。null 二、线性空间的基与维数 向量空间中的基与维数是依赖于向量的线性相关与线性无关的概念来定义的。 线性空间 V 作为一个向量集合,其中向量的线性相关、线性无关、极大无关组、等价等一系列概念,在形式上与向量空间 Rn 中的定义完全类似。 与上述概念相关的性质与结果也可平移到线性空间中。 null 定义 1.2 设 V 是线性空间,若存在一组线性无关的向量 1, 2, …, n,使空间中任一向量可由它们线性表示,则称向量组 {1, 2, …, n}为 V 的一组基。基所含向量个数为 V 的维数,记为 dimV = n, n <  或者 n = 。 例 5 向量组 {e1 = (1, 0, 0, …, 0)T, e2 = (0, 1, 0, …, 0)T, …, en = (0, 0, …, 0, 1)T} 是 F n 的一组基,则 dimF n = n。null 例 6 求矩阵空间 R22 的维数与一组基。 解 任取矩阵 A,其中 则有null因此 R22 中任何一个向量都可写成向量组 的线性组合。又任取数 ki,由 得 ki = 0, i = 1, 2, 3, 4,故 E11, E12, E21, E22 线性无关。由定义 2 知 {E11, E12, E21, E22} 是 R22 的一组基,dimR22 = 4。null 类似地,{Eij, i = 1, 2, …, m; j = 1, 2, …, n} 是矩阵空间 Rmn 的一组基,dimRmn = mn。 例 7 向量组 {1, x, x2, …, xn 1} 是 Pn[x] 的一组基,dimPn[x] = n。null 以上例子中,空间维数 dimV 都为有限数,这样的空间称为有限维线性空间。若 dimV 不是有限数,则称 V 为无限维线性空间。由于有限维空间与无限维空间在研究方法上的较大差异,这里我们只讨论有限维空间。约定记号 Vn(F) 表示 V 是数域 F 上的 n 维线性空间。 由于基就是向量集合 V 的极大线性无关组,从而线性空间的基也不是惟一的。 定理 1.2 n 维线性空间中任意 n 个线性无关的向量构成的向量组都是空间的基。 null 三、坐标 在线性空间 Vn(F) 中,设 {1, 2, …, n} 是一组基,则 {1, 2, …, n} 线性无关,Vn(F), {1, 2, …, n,  } 线性相关,故  可由 1, 2, …, n 惟一地线性表示。 也就是说,只要选定一组基,任意的向量都总是有唯一的一组数与之对应。 于是,我们有如下的定义。null 定义 1.3 设 1, 2, …, n 是线性空间 Vn(F)的一组基,V, (1.1) 则称数 x1, x2, …, xn 是  在基 {1, 2, …, n} 下的坐标,(1.1) 式中向量 (x1, x2, …, xn)T 为  的坐标向量,也简称为坐标。 null (1.1) 式中第二个等式是借助于矩阵的运算来表示的,显然 (1, 2, …, n) 在一般的向量意义下不一定为矩阵,这种表示会给今后矩阵处理带来很多便利。 例 8 求 R22 中向量 在基 {E11, E12, E21, E22}下的坐标。 解null故该向量在所给基下坐标为 (3, 1, 4, 5)T。 一般地 R22 中向量 在所给基 {Eij}下坐标为 (a11, a12, a21, a22)T。null 例 9 已知 {1, x, x2, x3} 和 {1, (x1), (x1)2, (x1)3} 是线性空间 P4[x] 的两组基,求 P4[x] 中向量 f(x) = a0 + a1x + a2x2 + a3x3 在这两组基下的坐标。 解 因为 因为 所以 f(x) 在基 {1, x, x2, x3} 下的坐标为 (a0, a1, a2, a3)T。null 又由 Taylor 公式有 故 f(x) 在基 {1, (x1), (x1)2, (x1)3} 下的坐标为null 从以上例子和 (1.1) 式可以看到,不论 Vn(F)为何种具体的线性空间,当在 Vn(F) 中取定一组基时,Vn(F) 中向量在该基下的坐标都是线性空间 F n 中的向量。正是这一特点,奠定了可以用数量矩阵和 Rn 中向量来研究一般的线性空间的有关问题的基础。一般同一个向量在不同基下的坐标也是不同的。null 注记 6 由例题 9 可知,线性空间的基一般是不唯一的,线性空间的任一元素在不同的基下所对应的坐标一般不同。但是,一个元素在一组基下对应的坐标是唯一的,即选定一组基后,线性空间中的向量与其在这组基下的坐标一一对应。null 事实上,如果 1, 2, …, n 是线性空间 Vn(R) 的一组基,V, 在基 {1, 2, …, n} 下有两组坐标 x1, x2, …, xn 和 y1, y2, …, yn,则  = x11 + x22 + … + xnn = y11 + y22 + … + ynn 于是 (x1  y1)1 + (x2  y2)2 + … + (xn  yn)n = 0 根据 1, 2, …, n 的线性无关性,可知 xi = yi,i = 1, 2, ..., n。null 注记 7 通常我们可以将线性空间的基理解成 2 维或 3 维几何空间中的坐标系。注意是坐标系,不是坐标值。这样一来,“选定一组基”就是说在线性空间里选定一个坐标系。null 在线性空间 Vn(F) 中取定一组基 {1, 2, …, n}, Vn(F),取坐标作为对应关系, 惟一地对应于 F n 中一个向量 X ( 的坐标)。反之,XF n,(1, 2, …, n)X 就是 X 所对应的 Vn(F)中的向量。因此,坐标关系建立了线性空间Vn(F)和 F n 的一一对应关系 ,显然  满足:  ( +  ) =  () +  ( )  (k) = k () 在对应关系  下,数域F上任何一个 n 维线性空间 Vn(F) 都和 n 维线性空间 F n 同构。 null 设 Vn(F) 中向量 i 的坐标为 Xi, i = 1, 2, …, m, 则 i 的线性组合 的坐标是 ,又零向量坐标为 0,所以 该结果可叙述为下述定理。null 定理 1.3 设 {1, 2, …, n} 是 n 维线性空间Vn(F) 的一组基,Vn(F) 中向量 i 在该基下坐标为Xi, i = 1, 2, …, m,则 Vn(F) 中向量组 {1, 2, … , n} 线性相关的充分必要条件是其坐标向量组 {X1, X2, … , Xm} 是 F n 中的线性相关组。 定理 1.3 说明由坐标建立的 Vn(F) 和 F n 之间的一一对应关系保持线性关系不变。若不计较向量的具体形式,仅就线性关系而言,Vn(F)中有关问题都可归结为我们所熟悉的线性空间 F n 中的相应问题,可应用熟悉的方法和已建立的理论来解决。 null 例 10 讨论 P4[x] 中向量:f1 = 1 + 2x + 4x3,f2 = x + x2 + 4x3,f3 = 1 + x  3x2,f4 = 2x2 + x3 的线性相关性。 解 在 P4[x]中取基 {1, x, x2, x3},则向量组对应的坐标 X1 = (1, 2, 0, 4)T,X2 = (0, 1, 1, 4)T,X3 = (1, 1, 3, 0)T,X4 = (0, 0, 2, 1)T。而容易计算,数值矩阵 A = (X1, X2, X3, X4) 的秩为 4,故数值向量 X1, X2, X3, X4 线性无关,于是函数向量(多项式向量)f1, f2, f3, f4 也线性无关。null 注记 8 数域 R 上任意两个 n 维线性空间都同构;同构的线性空间之间具有反身性、对称性与传递性;同构的线性空间必同维数。 注记 9 在线性空间的抽象讨论中,无论构成线性空间的元素是什么,其中的运算是如何定义的,我们所关心的只是这些运算的代数性质。从这个意义上可以说,同构的线性空间是可以不加区别的,而有限维线性空间唯一本质的特征就是它的维数。null 四、基变换与坐标变换 从定理 1.2 可以知道,线性空间 Vn(F) 的基不是惟一的,同一向量在不同基下的坐标一般也不相同,因此讨论 Vn(F) 中不同基之间的关系和同一向量在不同基下坐标的关系是十分必要的。 设 {1, 2, …, n} 和 {1, 2, … , n} 是Vn(F) 中的两组基,则由基的定义,对 i = 1, 2, … , n 有 null (1.2) 由矩阵分块运算,(1.2) 式中 n 个式子可表示为 (1, 2, … , n) = (1, 2, …, n)C, (1.3) 其中 C = (C1 C2 … Cn)F nn。null 定义 1.4 设 {1, 2, …, n},{1, 2, … , n}是 n 维线性空间 Vn(F) 的两组基,若有矩阵 C F nn,使 (1, 2, … , n) = (1, 2, …, n)C, 则称矩阵 C 是从基 {1, 2, …, n} 到基 {1, 2, … , n} 的过渡矩阵(基变换矩阵)。 C 作为过渡矩阵,它一定是可逆矩阵,它的逆 C1 是从 {1, 2, … , n} 到 {1, 2, …, n} 的过渡矩阵。从 (1.2) 式可知,在构成上,矩阵 C 的第 i 列是 i 在基 {1, 2, …, n}下的坐标 Ci。null 设向量 Vn(F), 在两组基下坐标分别为X 和 Y,则有  = (1, 2, …, n) X, (1.4)  = (1, 2, … , n) Y, (1.5) 因此  = (1, 2, … , n)Y = (1, 2, …, n)CY (1.6) 比较 (1.4) 式与 (1.6) 式,有 X = CYnull 定理 1.4 设线性空间 Vn(F) 的一组基 {1, 2, …, n} 到另一组基 {1, 2, … , n} 的过渡矩阵为 C,Vn(F) 中向量  在两组基下坐标分别为X,Y,则有 X = CY (1.7) null 通常我们称 (1.3) 式为两组基的基变换公式,(1.7) 式为两组基下坐标的坐标变换公式。 定理 1.4 的逆命题也成立,即若线性空间中任一向量的两种坐标满足坐标变换公式 (1.7),则相应的两组基满足基变换公式 (1.3)。 注记 10 这里的基变换和坐标变换,实际上就是我们非常熟悉的解析几何中坐标系变换和坐标变换的推广。null 例如 设 e1 = (1, 0)T,e2 = (0, 1)T 为 2 维几何空间 R2 的一组自然基,1、2 为 e1、e2 逆时针旋转  角后得到的另一组基,如图 2 所示,则 1 = cos e1 + sin e2 = (e1, e2) 2 = sin e1 + cos e2 = (e1, e2)null即 于是,从基 {e1, e2} 到基 {1, 2} 的过渡矩阵为C,其中null 对于 R2,如果其在基 {e1, e2} 下的坐标为 x1、x2,在基 {1, 2} 下的坐标为 y1、y2,则由 (7) 式有: x1 = y1cos  y2sin,x2 = y1sin + y2cos y1 = x1cos + x2sin,y2 = x1sin + xcosnull图 2 基变换与坐标变换 null 例 11 设 R3 的两组基为 1 = (1, 0, 1 )T, 2 = (2, 1, 1)T, 3 = (1, 1, 1)T 和 1 = (0, 1, 1)T, 2 = (1, 1, 0)T, 3 = (1, 2, 1)T。 (1) 求从基 {1, 2, 3} 到基 {1, 2, 3} 的过渡矩阵 C; (2)求向量  = 1 + 22  33 在基 1, 2, 3下的坐标。 解 (1) 由定义 1.4,过渡矩阵 C 是使等式:(1, 2, 3) = (1, 2, 3)C 成立的矩阵,对线性空间 R3 而言,这是矩阵等式: null从中可求得 null (2) 由  = 1 + 22  33,得  在基 1, 2, 3 下坐标 X = (1, 2, 3)T,由 X = CY,得 例 12 从例 10 可知 f1 = 1 + 2x + 4x3,f2 = x + x2 + 4x3,f3 = 1 + x  3x2,f4 = 2x2 + x3 也是线性空间 P4[x] 的一组基,求空间的基 {1, x, x2, x3}到基 {f1, f2, f3, f4} 的过渡矩阵 C,并求向量f = 1 + x + x2 +x3 在基 {f1, f2, f3, f4} 下的坐标 Y。null 解 因为易求得 fi 在基 {1, x, x2, x3} 下的坐标Ci,从而易得从基 {1, x, x2, x3} 到基 {f1, f2, f3, f4}的过渡矩阵 C, null于是可求得null而所以null 五、子空间 在 3 维几何空间 R3 中,过原点的一条直线或一个平面上的所有向量,对于向量加法和数乘运算,分别形成一个 1 维和 2 维的线性空间。这就是说,它们一方面都是 3 维几何空间的一个部分,同时它们自身对于原来的运算也都构成一个线性空间。null 推广到一般情形,线性空间 Vn(R) 中 V 作为集合,它的子集以及子集的交与并还能否构成一个线性空间?其结构与线性空间 Vn(R) 的结构有些什么关系?我们都可以通过有关线性子空间的相关讨论来了解。 定义 1.5 设 Vn(F) 为线性空间,W 是 V 的非空子集合。若 W 的元素关于 V 中加法与数乘向量法运算也构成线性空间,则称 W 是 V 的一个线性子空间(简称子空间)。null 例 13 任何线性空间有两个平凡子空间:一个是它自身 VV,另一个是 W = {0},称为零元素空间。 子集的包含关系使得 Vn(F) 的一个子集合是否为子空间的判别比较方便。 定理 1.5 设 W 是线性空间 Vn(F) 的非空子集和,则 W 是 Vn(F) 的子空间的充分必要条件是 (1) 若 , W,则  + W; (2) 若 W, kF, 则 kW。null 证明 必要性是显然的,只证充分性。 设 W 满足 (1) 与 (2),则只需验证定义 1.1 中八条运算法则也满足。 因为 kW,取 k = 0,则 0 = 0W。又取k = 1, = (1)W,即 W 中存在零元素和负元素。又因为WV,对 V 中加法与数乘,定义 1.1 其余 6 条法则对 W 中元素进行运算时必须满足,故由定义 1.1,W 是线性空间,从而是Vn(F) 的子空间。 null 例 14 在线性空间 Rnn 中取集合 W1 = {A | ARnn, AT = A}, W2 = {B | BRnn, |B|  0}, 讨论 W1 与 W2 是否为 Rnn 的子空间。 解 由于A1, A2W1,有 (A1 + A2)T = A1T + A2T = A1 + A2, (kA1)T = kA1T = kA1, 因此 A1 + A2, kA1W1,由定理 1.5,W1 是 Rnn 的子空间。 因为 0W2,所以 W2 不是 Rnn 的子空间。null 例 15 设 V(F) 是线性空间 1, 2, … , m 是V 中一组向量,则由它们一切线性组合构成的集合: L{1, 2, … , m} = { | , kiF} 是 V 的一个子空间,称为由1, 2, … , m 生成的线性子空间。 证明 , L{1, 2, … , m},即null则  +  = L{1, 2, … , m}, k = L{1, 2, … , m}, 故 L{1, 2, … , m} 为 V 的子空间。 值得指出的是,任何一个线性空间 Vn(F),若 1, 2, … , n 是它的一组基,则 Vn(F) 可表示为 Vn(F) = L{1, 2, … , n}。null 例 16 对一个矩阵 AFmn,可得到两个与 A 相关的子空间: N(A) = {X | AX = 0}F n R(A) = L{A1, A2, … , An}F m (1.8) 其中 Ai,i = 1, 2, … , n 是矩阵 A 的 n 个列向量。子空间 N(A) 称为矩阵 A 的零空间;R(A) 称为矩阵 A 的列空间。null 矩阵的零空间和列空间是两个重要的线性子空间,特别是在线性变换的讨论中尤为突出。由定义不难看出,一个矩阵 A 的零空间 N(A) 就是线性方程组 Ax = 0 的解空间,而列空间 R(A) 的一组基则可由 A 的列向量组的一个极大无关组构成,同时由线性方程组解的结构还可推出: dimN(A) + dimR(A) = n(A 的列数)。null 在讨论线性空间时,我们感兴趣的通常只是子空间而不是任意子集,因此子空间作为子集,其交集与并集是否仍是线性空间就是我们接下来关注的问题。 子空间作为子集,有子集的交:W1W2,并:W1W2 等运算,对它们有如下定理。null 定理 1.6 设 W1, W2 是线性空间 V 的子空间,则有 (1) W1 与 W2 的交集 W1W2 = { | W1 且W2} 是 V 的子空间,称为 W1 与 W2 的交空间。 (2) W1 与 W2 的和 W1 + W2 = { |  = 1 + 2, 1W1, 2W2} (1.9) 是 V 的子空间,称为 W1 与 W2 的和空间。null 证明 容易检验 (1),在此只证明 (2)。由定义 W1 + W2 V,而且非空。, W1 + W2,则有 i, iWi, i = 1, 2。由  = 1 + 2,  = 1 + 2  +  = 1 + 2 + 1 + 2= (1 + 1) + (2 + 2) k = k1 + k2 因 Wi 为子空间,则 1 + 1W1,2 + 2W2,k1W1,k2W2,所以  + ,kW1 + W2,即 W1 + W2 为 V 的子空间。null 例 17 设有 R3 的子空间 W1 = L{e1}, W2 = L{e2}, 求 W1 + W2。其中 e1 = (2, 1, 0)T,e2 = (0, 1, 0)T。 解 取 W1 + W2,则存在 iWi,i = 1, 2,  = 1 + 2, 又 1W1,2W2,故 1 = k1e1,2 = k2e2,因此  = 1 + 2 = k1e1 + k2e2,即 W1 + W2  L{e1, e2}。null 又容易证明 L{e1, e2}W1 + W2,故有 W1 + W2 = L{e1, e2}。 从几何直观上看,W1 是 R3 中向量 e1 所在的直线,W2 是 R3 中的 OZ 轴,W1 + W2 是 R3 中由 e1 和 e2 所确定的平面 ,如图 3。null图 3 子空间的和 null 注记 11 由例题 17 可以看出,两个子空间 W1 与 W2 的并与和有关系:W1W2W1 + W2,但 W1W2 通常不是子空间。比如,W1W2 = {e1, e2},但是 e1 + e2 = (2, 1, 1)TW1W2,即子集 W1W2 对向量的加法运算不封闭,不能构成线性空间。null 从集合论我们知道,给定一个集合的两个子集,包含它们的最小子集是其并集,子空间的和就类似于集合论中子集的并:给定线性空间的两个子空间,包含它们的最小子空间是它们的和空间,即 W1 + W2 是由 W1W2 生成的子空间,也是包含 W1W2 的最小的子空间。null 重要结论:一般的,若 W1 = L{1, 2, …, s},W2 = L{1, 2, …, r},则有 W1 + W2 = L{1, 2, …, s, 1, 2, …, r} (1.10) 对 V 的子空间 W1, W2, W1W2, W1 + W2,成立的包含关系是 (1.11) 它们的维数成立如下关系。null 定理 1.7 设 W1 和 W2 是线性空间 V 的子空间,则有如下维数公式: dimW1 + dimW2 = dim(W1 + W2) + dim(W1W2) (1.12) 证明略。null 从 (1.12) 式知,若 W1W2  {0},则有 dim(W1 + W2) < dimW1 + dimW2, 这时 W1 + W2, = x1 + x2,xiWi,i = 1, 2, 其表达式中 x1 与 x2 不是惟一的。 例如null则有 (2, 1, 0)TW1W2,即 W1W2  {0}。这时0W1 + W2 可有两种表达式 0 = 0 + 0 和 0 = (2, 1, 0)T  (2, 1, 0)T。 定义 1.6 设 W1 和 W2 是线性空间 V 的子空间,W = W1 + W2,如果 W1W2 = {0},则称 W 是 W1 与 W2 的直和子空间。记为 W = W1  W2。null 注记 12 因为任何线性空间都必包含 0,故两个子空间的交为零元素子空间 {0} 就类似于两个子集不相交,而子空间的直和则类似于子集的不交并。 对直和子空间,易证有如下等价条件。null 定理 1.8 设 W1 与 W2 是 V 的子空间,W = W1 + W2,则成立以下等价条件 (1) W = W1  W2; (2) XW,X 有惟一的表示式,X = X1 + X2,其中 X1W1,X2W2; (3) W 中零向量表达式是惟一的,即只要 0 = X1 + X2,XiWi,就有 X1 = 0,X2 = 0; (4) 维数公式 dimW = dimW1 + dimW2。null 注记 13 定理 1.8 的三个条件刻画的是“子空间的直和是无冗余和”的特性。比如,例题 17 中 W1 + W2 是直和,因此和空间 W1 + W2 中的任意  到子空间 W1 和 W2 中的分解是唯一的,并且和空间的维数也恰好是两个子空间维数之和。null 而如果令 e1 = (2, 1, 0)T,e2 = (0, 0, 1)T,e3 = (2, 1, 4/3)T,W1 = L{e1}, W3 = L{e2, e3},则W1W3 = L{e1} = W1  {0},故 W1 + W3 不是直和。如图 4,W3 为平面 ,W1 + W3 也为平面 ,显然和空间的维数小于两个子空间维数之和,并且对于取定的  = (7/2, 7/4, 4/3),有  = 1 + 2 = 3 + e3 其中 1 = (7/4)e1W1,2 = (4/3)e2W3,3 = (3/2, 3/4, 0)T = (3/4)e1W1,e3W3,即  到子空间 W1 和 W3 中分解是不唯一的。null图 4 不构成直和的示意图 null 例 18 设 Ir 表示 r 阶单位矩阵,对 n 阶方阵 如果它们的列空间为 R(A)、R(B),证明: Rn = R(A)  R(B)。 证明 x = (a1, a2, … , an)TRn, 有 x = (a1, a2, … , ar, 0, … , 0)T + (0, … , 0, ar+1, … , an)T,由于null(a1, a2, … , ar, 0, … , 0)T R(A), (0, … , 0, ar+1, … , an)TR(B), 所以 RnR(A) + R(B)。又显然 RnR(A) + R(B),从而 Rn = R(A) + R(B)。又 dimR(A) + dimR(B) = r + (n  r) = n = dimRn 由定理 1.8:Rn = R(A)  R(B)。null 对 n 维空间 V 的任何子空间 W,设 1, … , r 为 W 的基,r < n,把它们扩充为 V 的基 {1, 2, …, r, r+1, …, n}, 设 U = L{r+1, …, n},则成立 V = W U。 我们称 U 是 W 的直和补子空间。对 V 的任何子空间 W,dimW = r < n, 都存在直和补子空间 U  {0}。null 上述定义的子空间的交、和、直和等概念可推广到 k 个子空间的情形 null§ 1.2 内积空间 在线性空间中,向量的基本运算仅是线性运算。但是若以解析几何中讨论过的通常三维向量空间 R3 作为线性空间的一个模型,就会发现在 R3 中诸如向量的长度、二向量的夹角等度量概念,在线性空间的理论中还未得到反映。这些度量性质在很多实际问题(包括几何问题)中有着特殊的地位。因而有必要将它们引入线性空间。null 在解析几何中,通常 R3 中的向量长度、夹角等度量性质,都是通过向量的数量积来表达的。可见,数量积的概念蕴含着长度和夹角的概念。因此,为了给线性空间引进长度、夹角等度量概念,首先引入与数量积相类似的概念——内积。 定义了内积的线性空间就是内积空间。两个特殊的内积空间是欧几里德空间 (Euclid Space) 空间和酉空间 (Unitary Space)。null 一、欧氏空间与酉空间 1. 内积与内积空间 定义 1.7 设 Vn(F) 是数域 F 上的 n 维线性空间,定义一个从 Vn(F) 中向量到数域 F 的二元运算,记为 (, ),即 (, ):Vn(F) Vn(F)F, 如果满足 (1) 对称性: ; (2) 线性性:(k, ) = k(, ), (1+2, ) = (1, ) + (2, );null (3) 正定性:(, )  0,并且 (, ) = 0   = 0, 则称 (, ) 是 Vn(F) 的一个内积,并称其中定义了内积的线性空间 [Vn(F); (, )] 为内积空间。 如果 Vn(F) 是实数域 R 上的线性空间,则(, )R 为实内积,对称性相应为 (, ) = (, ),称 [Vn(F); (, )] 为欧氏空间。 同理,Vn(F) 是复数域 C 上的线性空间时,(, )C 为复内积,称 [Vn(F); (, )] 为酉空间。null 例 19 下列线性空间对所定义的内积为欧氏空间(常见的欧氏空间): (1) [Rn; (, ) = T],其中  = (x1, x2, …, xn)T,  = (y1, y2, …, yn)T, 。 (2) [Rnn; (A, B) = tr(ABT)]。 验证正定性:A  0,AAT 是正定阵或半正定阵,故 tr(AAT)  0,且 tr(AAT) = 0  A = 0。 (3) null 值得注意的是,在同一个线性空间上,可以定义不同的内积。例如,对 Rn,取一个给定的 n 阶正定阵 A,可以定义内积 (, ) = TA。这是一个双线性型,其中 (, ) = TA 就是我们熟悉的二次型。 显然,[Rn; (, ) = T] 与 [Rn; (, ) = TA] 是两个不同的欧氏空间。null 例 20 常见的酉空间: (1) [Cn; (, ) =  H],其中  = (x1, x2, …, xn)T,  = (y1, y2, …, yn)T, 。 (2) [Cnn; (A, B) = tr(BHA)],其中 A = (aij)nn,B = (bij)nn, (A, B) = tr(BHA) null 2. 向量的长度 在内积空间 [Vn(F); (, )] 中,可类似于几何空间引入向量长度的概念。 定义 1.8 设 [Vn(F); (, )] 为内积空间,称 (1.14) 为向量  的长度,若 || = 1,则  称为单位向量。null 定理 1.9 (Cauchy 定理)设 [Vn(F); (, )] 是内积空间,, Vn(F),都有 |(, )|  || || (1.15) 证明 只证实数域的情形。若  = 0,且  = 0,结论显然成立。设   0,对任意常数 k,取向量   k,都有 (  k,   k)  0,即 (, ) + |k2|(, )  2k(, )  0 由   0,可取到数 k = (, )/(, ),代入上式,即得 (, )2  (, )(, ),从而有 |(, )|  || ||null 通常称不等式 |(, )|  || || 为 Cauchy 不等式。其特例有: (1) 在欧氏空间 Rn 中,有 (2) 在平方可积的函数空间中,有null (3) 对任意随机变量  和  都有 Caychy 不等式的几何意义 例 21 证明内积空间 [Vn(F); (, )] 中,, Vn(F),成立三角不等式 | + |  || + || 证明 由 Cauchy 不等式,有 null | +  |2 = ( + ,  + ) = (, ) + (, ) + (, ) + (, )  ||2 + ||2 + 2|| || = (|| + ||)2 于是,有 | + |  || + ||。 由此,可得出向量长度的一些简单性质: (1) |k| = |k|||; (2) | + |  || + ||; (3)   0, 0 = /||,则 0 是单位向量。 通常,取0 = /|| 的过程称为向量  的标准化过程。null 3. 向量的夹角 在内积空间 [Vn(F); (, )] 中,还可类似于几何空间引入向量夹角的概念。 定义 1.9 欧氏空间中,非零向量  与  的夹角定义为 若 (, ) = 0,则称  与  是正交的。null 如果  是非零向量  与  的夹角,显然有(, ) = ||||cos,这与空间解析几何中向量内积(数量积)的定义是一致的。 注记 15 设 0 = /||,则 (0,  ) = ||cos,如图 5。令  =   (0,  )0,不难验证:(0,  ) = 0,于是我们称 (0,  )0 为  在0(或  )上的正交投影向量。 null图 5 内积的几何解释 null 因此,从几何的角度,向量内积可解释为:向量  与单位向量 0 的内积为  在 0 上的正交投影长度。 进一步地,Caychy 不等式可以解释为:向量  在向量  上的投影量小于向量  的长度。null 内积也有其物理背景。比如,如果一个物体在力向量 F 的作用下产生的位移向量为 S,那么力 F 所做的功为 W = |F||S|cos = (F, S),如下面图 6 所示。 图 6 内积的物理解释 null 于是,又容易看出: (1) 内积本质上表达的是一个向量向另一个向量的投影; (2) Caychy 不等式可以解释为:向量  在 向量  上的投影小于向量  的长度。 null 对于内积空间中的一个向量组 {1, 2, …, m},若 (i, j) = 0,i  j,则称向量组 {1, 2, …, m} 为正交向量组。进一步,若还满足 则称向量组 {1, 2, …, m} 为标准正交向量组。null 定理 1.10 不含零向量的正交向量组是线性无关的。 证明 设 {1, 2, …, m} 是内积空间 Vn(F) 中的正交向量组,i  0,i = 1, 2, …, m。设有数ki, i = 1, 2, …, m,使得 k11 + k22 + … + kmm = 0 取 j,则有null 因为 (j, j)  0,故必有 kj = 0,j = 1, 2, …, m,即 {1, 2, …, m} 线性无关。 定理 1.10 说明,Vn(F) 中不含零向量的正交向量组至多含 n 个向量,而且由 n 个非零向量构成的正交向量组就是 Vn(F) 的基。null 二、标准正交基 1. 标准正交基 在内积空间 Vn(F) 中,取一组基 {1, 2, …, n},则 , Vn(F),分别有坐标 X,YF n:null于是 (1.16) 设矩阵 A = ((i, j))nn,即矩阵 A 的元素aij = (i, j),则 (1.16) 式可用矩阵运算表示为 (, ) = YHAX (1.17) 因此,给定 A,Vn(F) 中向量的内积就可以转化为矩阵的运算。null 关于 (1.17) 式中的矩阵 A,由 A 中元素的构成可知,AH = A,即 A 为 Hermite 矩阵;又  0 时,其坐标 X  0,于是有 (, ) = XHAX > 0,即 A 是正定的 Hermite 矩阵。 一般地,我们称上述的矩阵 A 为内积空间[Vn(F); (, )] 的度量矩阵(或 Grame 矩阵)。特别地,如果 A = I,则 (, ) = YHX。而 A = I 则相当于null 定义 1.10 在内积空间 [Vn(F); (, )] 中,若一组基 {1, 2, …, n} 满足条件 则称 {1, 2, …, n} 为 Vn(F) 的标准正交基。null 注记 16 标准正交基是内积空间中十分方便的基。比如,向量  和  在标准正交基 1, 2, …, n 下的坐标为 X = (x1, x2, …, xn)T 和 Y = (y1, y2, …, yn)T,则向量的坐标可以通过内积简单地表示出来,即 xi = (, i),i = 1, 2, …, n 或者  = (, 1)1 + (, 2)2 + … + (, n)nnull 另一方面,在标准正交基下内积也有特别简单的表达式: (,  ) = x1y1 + x2y2 + … + xnyn = YTX 这个表达式正是解析几何中向量的内积在直角坐标系中坐标表达式的推广。而且,上述的内积的表达式对于任一组标准正交基都是一样的,这说明所有的标准正交基在欧氏空间中有相同的地位。 下面的定理给出了构造标准正交基的原理。null 定理 1.11 (Gram-Schmidt 正交化方法)设{1, 2, …, m} 是内积空间 [Vn(F); (, )] 中线性无关的向量组,则有如下方法: (1.18) 所得向量组 {1, 2, …, m} 是正交向量组。 证明 对向量组的个数进行归纳证明。null n = 2 时,由 (1.18) 式有: 即 1 与 2 正交。null 设 n = m  1 时,由 (1.18) 式所得向量组 {1, 2, …, m1} 已经正交。则当 n = m 时, 于是 j, j < m,有 而由归纳假设知:(i, j) = 0,i  j,i, j < m,于是由上式可得null所以,由归纳法,{1, 2, …, m} 是正交向量组。 用上述定理的 (1.18) 式求正交向量组的过程也称之为 Schmidt 正交化过程。并且可知 L{1, 2, …, m} = L{1, 2, …, m} (1.19) 于是,从中我们可以知道: 当 {1, 2, …, n} 是 Vn(F) 的一组基时null (1) 利用 Schmidt 正交化过程可得到正交的基 {1, 2, …, n}; (2) 再利用下式可对 n 标准化 从而得到 Vn(F) 的标准正交基 {1, 2, …, n}。null 把正交化方法和标准化方法结合在一起,可得从一组基 {1, 2, …, n} 得到标准正交基的方法:null 用矩阵运算可表示为:null 注记 17 从欧氏空间的一组基出发得到一组标准正交基的过程,实质上就是空间解析几何中由仿射坐标系变换成直角坐标系的过程。如图 7 所示,取
本文档为【01_矩阵论_第一章】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_239819
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:0
分类:理学
上传时间:2012-09-09
浏览量:40