Loading [MathJax]/jax/output/HTML-CSS/jax.js
Home 线性代数的本质4:点积与对偶性
Post
Cancel

线性代数的本质4:点积与对偶性

向量的点积又称数量积、内积。点积有两种定义方式:代数方式和几何方式。
向量的点积既可以由向量坐标的代数运算得出,也可以引入向量的长度和夹角的几何概念来求解。
二维向量的点积 ab=x1x2+y1y2=|a||b|cosθ
无论根据哪一种定义都容易证明点积运算满足交换律和分配律 (不满足结合律)
下面证明两个定义的等价性。

从几何定义推导坐标公式

a=(x1,y1), b=(x2,y2), ˆi, ˆj为单位基向量,
由点积的几何定义 ˆi·ˆi=|ˆi||ˆi|cos0=1,ˆj·ˆj=|ˆj||ˆj|cos0=1
ˆi·ˆj=|ˆi||ˆj|cosπ2=0
由向量坐标的定义,a=x1ˆi+y1ˆj,b=x2ˆi+y2ˆj ,
点积满足分配率
ab=(x1ˆi+y1ˆj)(x2ˆi+y2ˆj)=x1x2(ˆiˆi)+x1y2(ˆiˆj)+x2y1(ˆiˆj)+y1y2(ˆjˆj)=x1x2+y1y2

从坐标定义推导几何公式 (推广到n维)

n维向量夹角的定义

ab为两个任意非零n维向量,以abab 三向量的模长为边可构成三角形。
(利用三角不等式|x+y||x|+|y|证明任意两边之和大于等于第三边,即可证能构成三角形)
向量ab的夹角定义为这个三角形中长为|a||b|的两邻边夹角θ
由余弦定理,|ab|2=|a|2+|b|22|a||b|cosθ
由点积的坐标定义,
|ab|2=(ab)(ab)=aaabba+(b)(b)()=|a|22(ab)+|b|2(1)=|a|2+|b|22|a||b|cosθ(2)
等式(1)(2)两边消去得:ab=|a||b|cosθ

补充1:n维向量正交的概念

基于n维向量夹角的定义,定义n维向量垂直的概念:
若两非零向量ab夹角为90度则称ab互相垂直。
由点积的几何公式有ab=0 即 两向量垂直 两向量点积为0
零向量与任何向量正交。

补充2:余弦定理的证明

如图,由勾股定理:
c2=(asinθ)2+(bacosθ)2=a2sin2θ+b22abcosθ+a2cos2θ=a2(sin2θ+cos2θ)+b22abcosθ=a2+b22abcosθ

补充3: Cauchy-Schwarz不等式

不等式|xy||x||y| 非零向量x,yR都成立,
当且仅当x=cy时,即x,y共线时等号成立。
证明: 根据点积的性质 (向量自身的点积等于模长的平方),
注意到tR 都有 (x+ty)(x+ty)=|x+ty|20
(x+ty)(x+ty)=xx+xty+tyx+tyty
=|x|2+2t(xy)+t2|y|20
t为自变量变形为二次不等式:p(t)=|y|2t2+2(xy)t+|x|20
a=|y|2,b=2(xy),c=|x|2
y是非零向量 a=|y|2>0 p(t)开口向上
p(t)0 一元二次方程根的判别式Δ=b24ac0
代入得:[2(xy)]24|y|2|x|20
4(xy)24|x|2|y|20|xy||x||y| 恒成立。
(根据点积的几何定义也可证明)

补充4:三角不等式

三角不等式: |v+w||v|+|w| 等号成立当且仅当其中一向量 为另一向量的非负倍数。 证明:|v+w|2=(v+w)(v+w)=|v|2+2vw_+|w|2|v|2+|w|2+2|vw||v|2+|w|2+2|v||w|(Cachy-Schwarz)=(|v|+|w|)2 |v+w||v|+|w| 等号成立当且仅当vw=|v||w|,
这等价于v,w其中一向量是另一向量的非负倍数。

注:基于Cauchy-Schwarz不等式可证明三角不等式,基于三角不等式
可定义n维向量夹角,从而推出向量点积的几何公式。

向量点积的几何直观

向量长度和另一向量投影长度之积

投影方向与被投影向量相反时,即两向量夹角大于90度时,点积为负值

当两向量互相垂直时,投影为零向量,点积为0

用投影解释向量点积的几何公式显得很”不对称”,因为a投影到b还是b投影到a都不影响计算结果。
为什么点积的结果与投影的方式无关呢?
先来看两向量等长的情况,沿着夹角平分线作对称轴,分别画出两向量之间的投影,
根据三角形全等的条件(两角一边),发现两种投影方式互为镜像,这种情况显然不影响结果。

现在把其中一个向量缩放若干倍。如下图,把短的向量投影到长的向量上,
此时(kv)w=k(vw),因为缩放一个向量k倍并不会改变另一个向量的投影长度,
相当于把原来对称情况下的点积乘以k倍。

反过来把长向量投影到短向量上,根据相似三角形,vw上的投影被放大了2倍,
对短向量长度仍不变,相比镜像对称的情况,效果仍然是把原来的点积放大了2倍。
因此,无论哪种投影方式,缩放向量(破坏对称)对点积结果的影响都一样,
也就是说即使向量不等长,投影方式不同也不影响点积的结果。

直观理解坐标公式与几何投影的联系

假设我们不知道点积的几何定义,仅知道点积的坐标公式。
为什么将对应坐标相乘再将结果相加的计算过程,与投影有联系?
最令人满意的答案来自对偶性(duality)。
这种点积与投影(线性变换)的关系在于将其中一向量倾倒,
就得到对另一向量作投影变换的1×n矩阵。

首先来看多维空间到一维空间(数轴)的线性变换。
不少函数都能接收2维向量并输出一个数,但线性变换的要求更加严格,
需满足性质L(v+w)=L(v)+L(w)L(cv)=cL(v)
本篇仅考虑与之等价的直观特性,即“保持原点不变且网格线平行等距分布”,二维到一维的
变换情况就是任意二维向量所在直线上等距分布的点,经过线性变换后也等距分布于数轴上。
变换后的基向量落在数轴上变成一个数,用一个1×2矩阵描述。

R2R的线性变换用1×2矩阵与向量的乘法描述,其运算方法(列的线性组合)
看起来就和点积的坐标公式一样。1×2矩阵看起来正像一个倾倒的向量。

通过以上观察发现,点积的坐标公式与R2R变换的1×2矩阵向量乘法运算具有相同的形式。
下面我们从几何直观上验证一下2D投影矩阵左乘2D向量其实就是2D投影矩阵的行向量与
这个向量的对应坐标相乘再相加,从而确定点积的几何解释就是投影长度与向量模长之积。

假定你还不知道点积与投影有关,考虑0在原点斜放的数轴上一个单位向量(模长为1的向量)ˆu

如果我们把二维向量投影到这条数轴上,就定义了一个从二维向量到数字的变换,
通过视觉上的检验,发现这个投影变换是线性的。(直线上等距分布的点投影到数轴上仍保持等距)
注意u帽是输入空间中一个二维向量,只是刚好让它落在输出空间数轴上。
下面我们来找出这个投影变换对应的投影矩阵。

考虑变换后单位基向量i帽和j帽的位置,它们将分别变成矩阵的两列(两个数)。

因为ˆiˆu都是单位向量,它们之间的互相投影存在之前提到过的镜像对称关系,
ˆiˆu上的投影长度其实就是ˆu的横坐标ux,同理,ˆjˆu上的投影长度等于ˆu的纵坐标uy

因此投影变换矩阵就是[uxuy],所以任意二维向量与单位向量的点积,
都可解释为将向量投影到单位向量所在直线上所得到的投影长度(可正可负)

如果是与“非单位向量”的点积,对偶的变换是[kuxkuy],即基向量的投影长度分别是uxuyk倍。

因为变换是线性的,即[kuxkuy]=k[uxuy], 这个变换等价于先将二维向量投影到单位向量,
再把投影长度乘上k倍。单位向量的缩放倍数k即“非单位向量”的模长,所以任意两个向量点积的
几何解释就是投影长度与向量长度的乘积,从而得到点积的几何公式|a||b|cosθ

对点积的直观几何解释用到了对偶性的思想。
对偶性是两个数学事物之间存在的自然而又出乎意料的对应关系。
两个向量的点积,利用向量与线性变换的对偶关系,相当于把其中一个向量看作是投影变换矩阵。
于是,我们可以进一步地理解向量的本质是“线性变换的物质载体”。
(as the physical embodiment of a linear transformation”)
向量就像一个特定变换的概念性记号,例如本节中转置成1×2矩阵的二维向量就是投影变换的记号。
一个2d-to-1d的线性变换,必存在一个唯一的向量,
输入向量与这个对偶向量点积与应用变换的效果是一样的。

duality 这个概念在数学和物理的许多地方都有分布,而没有一个统一的定义。我熟悉的 duality 大部分都是
把两个显然相对应的东西联系起来,有时这两个东西在某种程度上甚至是等价的(比如在同构意义上)。
因为一旦有了对偶性,每证明一个定理都能通过对偶的操作自动免费得到另一个(可以理解为镜像)。
数学的布尔代数和集合论中的对偶概念可能是最平易近人的。
物理中常翻译为二象性,例如波粒二象性 (Wave–particle duality)。

This post is licensed under CC BY 4.0 by the author.

线性代数的本质3:逆矩阵、列空间、秩和零空间

线性代数的本质5:叉积