Friedberg线代笔记第二章

第二章总的目的是要建立在向量空间中的一种变换,变换前后不改变向量空间的“结构”。这话有点抽象,事实上读到这里我也不懂得它是什么意思。我们至多可以说,第一章构筑了实体,现在,实体运动起来了。

线性变换

一个映射是线性变换,首先它的定义域和陪域都必须是线性空间,其次满足以下两个性质(二者其实可以统一为$T(ax+by)=aT(x)+bT(y)$):

  1. $T(x+y) = T(x)+T(y)$,也就是所谓的叠加性。哲学点来说,定义域上每个部分对陪域上总体的贡献是可以摘出来的,不存在说两两之间互相影响这回事。
  2. $T(cx)=cT(x)$,即是所谓的均匀性。定义域上的部分如何变化对培域上整体的贡献变化有什么影响?这也是可以摘出来的。可以看成是上一条的变形。(回顾线性空间八性,注意“+”和“×”是可以随意定义的,这两者之间不一定要有R上的“+”“×”的那些性质)哲学地说,这是在特定的变换下保持某种不变性或者规律性,物理上叫做对称性。

线性的概念可以说是博大精深。试举几例:旋转、翻转、投影、矩阵乘法、求导、积分,都是线性的。若读者看到此处请细加体会线性的意义。

零空间和像

零空间即是经线性变换后映射成零元的那些元素构成的集合;像,类同于映射里的值域,就是定义域上诸元素在陪域上对应元素的集合。
教材里拿到这两个定义后干了什么?首先是说零空间和象是线性空间,然后说你能借定义域的一组基找出象域的一个张成集,进而删出象域的一组基。接着推进,构造了零空间和象这两个线性空间的维数为nullity和rank。
重头戏是:

$nullity(T)+rank(T)=dim(V)$

这个定理说出三个子空间维数间的恒等关系。或许我们可以说,这是本书主线上的节点。因为我们谈的向量空间的维数,证明这个定理时使用的“象域的一个张成集是定义域上基映射到陪域上的诸向量之集合”,恰好囊括了之前讨论的两个定理。所以,这个定理解释之前做过的一切努力。那么这个定理揭示了什么?我们知道了零空间维数加秩等于定义域维数,这好像是说定义域就等于零空间和象域两个零空间加起来。但是象域是在陪域的一个子集,怎么会跟定义域和零空间扯上关系呢?这里引出了第二个重点,定义域和陪域之间的神秘联系,所谓联系,在数学里呈现出来就是映射。

于是,第二个重点是:T为单射,等价于零空间只含零元。这个结论是和线性映射的“线性”紧密联系在一起,如果不存在线性,这个结论也不复存在。此外,想想单射的定义是什么:$\forall$$x,y\in V$,$x\neq y$$\Rightarrow T(x)\neq T(y)$。这个定理一下子把“所有”化约到了证明零空间只含唯一元素。
想到了单射,我们可能就会考虑一下满射,兼有满射和单射的不就是双射吗?一俟得到双射的结论,我们就能在两个线性空间中建立一个反映射。这种美好的愿景吸引人继续研究。幸运的是,只要两个线性空间维数相等,满射就等价于单射。这就是说得到任何一种特殊的线性映射,你都能推出该映射是双射。

  • 另外,存在唯一的一个映射,使$V$上的一组n元基映射为$W$上的n个向量。(不一定有线性无关,或者张成整个线性空间等等性质)唯一这个说法,表面了若有另一个映射起到同样作用,它们必然是同一映射。
    线性映射是双射的好处就在于 定义域上一集合线性无关等价于陪域上它的映射集线性无关。好像线性无关被传导到了陪域上去。这种传导是线性双射的普遍的规律吗?

矩阵和线性映射

矩阵的好处就在于能够把线性映射更具体地表达出来。“表达”,实际是断言矩阵和线性映射是同义的。在数学上我们得先利用上一节的知识建立一个矩阵和线性映射间的双射
当我们做线性映射的时候我们在做什么?一个向量变成了另一个向量。既然说是变,具体是向量的什么东西变化了呢。要这么说,首先得表达一个向量是什么东西。向量可以唯一的表示为一组基的数乘和,同时,同属于一个线性空间的其它向量也可以被这组基唯一的表达出来。看来是一个相当本质性的概念。在一组基下谈不同的向量,唯一不同的就是各个数乘。把数乘扣出来,单独成为一个向量,便抓住了原向量本质性的东西。

$x=\sum_{i=1}^na_iu_i$

被表示为

$$
[x]_\beta=
\begin{pmatrix}
a_1\\a_2\\.\\.\\.\\a_n
\end{pmatrix}
$$

线性映射涉及到了两个线性空间,起码两组基。把定义域中某向量用陪域中的基表达出来,这“表达”具现化出来就是矩阵。通常的写法是把每一组新基排成一列,把它们排在第几列则表明它是定义域中向量哪一元的变换。


  • 神奇的是线性映射是线性空间到线性空间的映射,而你定义一下线性映射的加法与数乘,你会发现一类线性映射本身也能够变成一个线性空间。自然你可能想一线性映射到一线性映射之间也能建立一种映射,这个映射或许又是一个线性空间。这好像金字塔一级一级搭起来,每一级和上一级间都保持类似。金字塔是法老王的坟头,数学结构的这种堆叠是什么?或者问个小一点的问题,线性映射自成线性空间,这种程度的抽象本身有什么用?
  • 有了加法和数乘,定义一下矩阵乘积也是很自然的。矩阵就是线性映射,那矩阵乘积无非就是线性映射的复合。很有意思的是线性映射复合而成的映射保持 线性

持这种观点看矩阵的乘积$AB$,很自然地会说$AB$的某一列是$B$的某一列向量乘以$A$的某一行向量而成。中心思想就是这个,不过为了构造一个包含我们习以为常的矩阵操作的理论,在廓清定义,阐明运算定理方面,还有一堆细碎的证明要干。

  • 又,本节包含一个特别有意思的矩阵引用实例——incidence matrix。$A_{ij}=1$表示$i$到$j$存在某种关系,$A_{ij}=0$表示$i$到$j$不存在某种关系。这一个矩阵起码可以表达信息传递、clique、上下级关系三种范畴。好像是incidence matrix这种抽象抓住了一些具体事件中的本质——或者说incidence matrix做出了一种抽象,做出了一种阐释,合于我们应用的需求。

可逆性与同构

Fortunately, many of the intrinsic properties of functions are shared by their
inverses. For example, in calculus we learn that the properties of being con-
tinuous or differentiable are generally retained by the inverse functions.

摘录的这一段话很有意思。首先这既然是线代课本,谈到可逆性,重点也是在矩阵,线性变换上。至于说为什么要研究反函数?映射就是两个集合之间的关系,定义域上的某元素依着某种关系,和陪域上的某元素确定下来。关系是双向的,联系着这一头和哪一头,不过冒然想从陪域某元素反推回定义域,往往会找到多个元素。当然,你可以构造一种“反函数”定义,其中每个元素对应多个元素,恰好可以描述这种现象。但数学的一个取向是确定,我们希望研究确定的东西,所以有了惯常的逆映射定义。矩阵的逆保持了矩阵的很多性质,这个现象,同反函数保持连续性和可微性一道,被统一在线性映射的逆映射常常保持原映射的性质这一命题中。
线性映射是不是可逆的?除了用定义来证,还可以借助另一定理。

Let $T: V → W$ be a linear transformation, where $V$ and $W$ are finite-
dimensional spaces of equal dimension. Then $T$ is invertible if and only
if $rank(T) = dim(V)$.

很显然,因为零空间为$\{0\}$,又因线性,线性映射是单射。$W$的维数若和$V$一样,还能建立一个双射,产生线性映射的逆,线性映射的逆也是保持线性的。此外,只要在两组基下的线性映射是可逆的等价于线性映射本身也是可逆的。线性映射可逆推出两组基下的线性映射可逆,显然。两组基下的线性映射可逆(其实就是矩阵可逆)如何推出线性映射可逆呢?关键一点,在于运用定理——必然 存在唯一一个线性映射,使得定义域上的一组基,能被映射到陪域上数量与定义域维数相同的一向量集。映射出来的是向量,而向量经过运算还是向量,你完全可以把矩阵各列的向量当成此向量集。之前干的事情是把线性映射改写成矩阵,现在,我们运用此定理把矩阵改写为线性映射。

同构

可逆的概念针对的是某个具体的映射。不过,这个具体的映射本身就给人一种暗示,好像两个线性空间之间有神秘的相似性。这所谓的相似,依前文所述则是维数相等,我们用同构来刻画这种相似性。

  • 维数为$n$和$m$的线性空间$V$、$W$,以它们为定义域和陪域的所有线性映射的集合,和所有$m\times n$规格的矩阵的集合是同构的(不过为了表述一个具体的矩阵,建立一个具体的映射,你还是得先给定两组基)。线性映射的矩阵表述是具有线性的,所以只需要证明单射和满射。
    书里给出的证明,包含一个小技巧:双射即等于陪域中每一元素都对应唯一的定义域元素。于是又从矩阵的各分量中构造出唯一的一线性映射。
  • 定义道,$n$维向量空间$V$在$\beta$下的 标准表达 是函数$\phi_\beta(x)=[x]_\beta$。$V$的标准表达函数,听起来很怪。不过这函数本身是一个双射,提供了线性空间$V$到向量空间$F^n$的一个isomorphism。这么说来线性空间$V$到向量空间$F^n$便是一个同构。

坐标变换矩阵

$$x=\frac{2}{\sqrt{5}}x'-\frac{1}{\sqrt{5}}y'$$
$$y=\frac{1}{\sqrt{5}}x'+\frac{2}{\sqrt{5}}y'$$
如此的一个变量代换,可以把等式$2x^2-4xy+5y^2=1$变成等式$(x')^2+6(y')^2=1$,很容易看出新的等式就是一个椭圆的等式。不过,在标准坐标轴下,它是斜着的。这样岂不是很麻烦,如果是人徒手在纸上作一个椭圆,我们会试着建立一个新的坐标系,把这个椭圆放在中间。可是假如你有两个椭圆,它们相对于彼此都成一定的角度。确实你也可以直接画两个坐标系,可是你逼不得已得知道两个坐标系之间是怎样互相换算的。这就是这一节要讲的。以上面的椭圆举例,若椭圆上某点在原基下为$[P]\_\beta=(x,y)^T$,在新的基下,其旋转过后则是$[P]_\beta'=(x',y')^T$。表达这种坐标轴旋转,或者说,表述不同度量下某向量的形式的,是矩阵$Q=[I_v]_{\beta'}^{\beta}$。该矩阵的第$j$行是$[x_j']_\beta$。如果看不懂这个结论的话,结合前面所定义的线性映射的矩阵表述细细想一下,这十分显然,而又十分有意思。
我们讨论的是向量,但我们也可以讨论一下线性映射。线性映射是由矩阵表达出来的,但是为了用出矩阵,你必须设定两组基。好像在具体的矩阵背后,还有一个显隐不定的线性映射飘忽着,这么想,你也许会说另一个具体的矩阵也能表达同样的线性映射,那么,它们两个矩阵之间有什么关系呢?我们先从简单的矩阵开始,此矩阵表达的线性映射,其定义域与陪域同一。

$$[T]_{\beta'}=Q^{-1}[T]_\beta Q$$

其实这就是中文线代课本里的相似矩形,$A=Q^{-1}BQ$则B与A为相似矩形。两边的矩形起着类似“翻译”的作用。

  • 本书给出了一个例子,如何求解二维空间中某点关于某线对称的对应点。中学里传统的做法是作线给出解析方程联立计算等等,每次还只能处理一个点,或者说处理完两个点后得到一条线,十分繁杂。要看出reflection其实是一种线性映射,运用坐标变换矩阵可以很容易地做出来。以对称轴为$y$轴,其过原点的法线为$x$轴,以此为基,即是$Q$,轻易得到的对称的线性变换是$[T]_{\beta'}$,在将此新基下得到的结果翻译回原基,$Q^{-1}$,它们一同表达了$[T]_{\beta'}$。
  • 接上文,如果某点关于某条不过原点的线对称似乎是不行的。因为这时似乎不存在线性。
  • 再接上文,问题不是在没有线性上。能确切表达一个不在原点上的直线的空间不是二维空间。也就是说二维空间中无法处理这个问题。能处理的东西似乎叫仿射空间?

回到本节开题所写的问题,如果我们想找$[T]_{\alpha'}^{\alpha}$,$[T]_{\beta'}^{\beta}$的关系,易得:
$$[T]_{\alpha'}^{\alpha}=[I]_\beta^\alpha[T]_{\beta'}^{\beta}[I]_{\alpha'}^{\beta'}$$

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注