向量的点积又称数量积、内积。点积有两种定义方式:代数方式和几何方式。
向量的点积既可以由向量坐标的代数运算得出,也可以引入向量的长度和夹角的几何概念来求解。
二维向量的点积 a⋅b=x1x2+y1y2=|a||b|cosθ
无论根据哪一种定义都容易证明点积运算满足交换律和分配律 (不满足结合律)。
下面证明两个定义的等价性。
从几何定义推导坐标公式
设a=(x1,y1), b=(x2,y2), ˆi, ˆj为单位基向量,
由点积的几何定义 ˆi·ˆi=|ˆi||ˆi|cos0=1,ˆj·ˆj=|ˆj||ˆj|cos0=1,
ˆi·ˆj=|ˆi||ˆj|cosπ2=0,
由向量坐标的定义,a=x1ˆi+y1ˆj,b=x2ˆi+y2ˆj ,
∵ 点积满足分配率
∴a⋅b=(x1ˆi+y1ˆj)⋅(x2ˆi+y2ˆj)=x1x2(ˆi⋅ˆi)+x1y2(ˆi⋅ˆj)+x2y1(ˆi⋅ˆj)+y1y2(ˆj⋅ˆj)=x1x2+y1y2
从坐标定义推导几何公式 (推广到n维)
n维向量夹角的定义
设a和b为两个任意非零n维向量,以a,b,a−b 三向量的模长为边可构成三角形。
(利用三角不等式|x+y|≤|x|+|y|证明任意两边之和大于等于第三边,即可证能构成三角形)
向量a和b的夹角定义为这个三角形中长为|a|和|b|的两邻边夹角θ。
由余弦定理,|a−b|2=|a|2+|b|2−2|a||b|cosθ
由点积的坐标定义,
|a−b|2=(a−b)⋅(a−b)=a⋅a−a⋅b−b⋅a+(−b)⋅(−b)(点积满足乘法分配律)=|a|2−2(a⋅b)+|b|2(1)=|a|2+|b|2−2|a||b|cosθ(2)
等式(1)(2)两边消去得:a⋅b=|a||b|cosθ
补充1:n维向量正交的概念
基于n维向量夹角的定义,定义n维向量垂直的概念:
若两非零向量a和b夹角为90度则称a和b互相垂直。
由点积的几何公式有a⋅b=0 即 两向量垂直 ⟺ 两向量点积为0
零向量与任何向量正交。
补充2:余弦定理的证明
如图,由勾股定理:
c2=(asinθ)2+(b−acosθ)2=a2sin2θ+b2−2abcosθ+a2cos2θ=a2(sin2θ+cos2θ)+b2−2abcosθ=a2+b2−2abcosθ
补充3: Cauchy-Schwarz不等式
不等式|x⋅y|≤|x||y| 对∀ 非零向量x,y∈R都成立,
当且仅当x=cy时,即x,y共线时等号成立。
证明: 根据点积的性质 (向量自身的点积等于模长的平方),
注意到∀t∈R 都有 (x+ty)⋅(x+ty)=|x+ty|2≥0
(x+ty)⋅(x+ty)=x⋅x+x⋅ty+ty⋅x+ty⋅ty
=|x|2+2t(x⋅y)+t2|y|2≥0
以t为自变量变形为二次不等式:p(t)=|y|2t2+2(x⋅y)t+|x|2≥0
令a=|y|2,b=2(x⋅y),c=|x|2
∵y是非零向量 ∴a=|y|2>0 p(t)开口向上
∵p(t)≥0 ∴ 一元二次方程根的判别式Δ=b2−4ac≤0
代入得:[2(x⋅y)]2−4|y|2|x|2≤0
4(x⋅y)2−4|x|2|y|2≤0 即 |x⋅y|≤|x||y| 恒成立。
(根据点积的几何定义也可证明)
补充4:三角不等式
三角不等式: |→v+→w|≤|→v|+|→w| 等号成立当且仅当其中一向量 为另一向量的非负倍数。 证明:|→v+→w|2=(→v+→w)⋅(→v+→w)=|→v|2+2→v⋅→w_+|→w|2≤|→v|2+|→w|2+2|→v⋅→w|≤|→v|2+|→w|2+2|→v||→w|(Cachy-Schwarz不等式)=(|→v|+|→w|)2 ∴|→v+→w|≤|→v|+|→w| 等号成立当且仅当→v⋅→w=|→v||→w|,
这等价于→v,→w其中一向量是另一向量的非负倍数。
注:基于Cauchy-Schwarz不等式可证明三角不等式,基于三角不等式
可定义n维向量夹角,从而推出向量点积的几何公式。
向量点积的几何直观
投影方向与被投影向量相反时,即两向量夹角大于90度时,点积为负值
用投影解释向量点积的几何公式显得很”不对称”,因为a投影到b还是b投影到a都不影响计算结果。
为什么点积的结果与投影的方式无关呢?
先来看两向量等长的情况,沿着夹角平分线作对称轴,分别画出两向量之间的投影,
根据三角形全等的条件(两角一边),发现两种投影方式互为镜像,这种情况显然不影响结果。
现在把其中一个向量缩放若干倍。如下图,把短的向量投影到长的向量上,
此时(k→v)⋅→w=k(→v⋅→w),因为缩放一个向量k倍并不会改变另一个向量的投影长度,
相当于把原来对称情况下的点积乘以k倍。
反过来把长向量投影到短向量上,根据相似三角形,→v 在 →w上的投影被放大了2倍,
对短向量长度仍不变,相比镜像对称的情况,效果仍然是把原来的点积放大了2倍。
因此,无论哪种投影方式,缩放向量(破坏对称)对点积结果的影响都一样,
也就是说即使向量不等长,投影方式不同也不影响点积的结果。
直观理解坐标公式与几何投影的联系
假设我们不知道点积的几何定义,仅知道点积的坐标公式。
为什么将对应坐标相乘再将结果相加的计算过程,与投影有联系?
最令人满意的答案来自对偶性(duality)。
这种点积与投影(线性变换)的关系在于将其中一向量倾倒,
就得到对另一向量作投影变换的1×n矩阵。
首先来看多维空间到一维空间(数轴)的线性变换。
不少函数都能接收2维向量并输出一个数,但线性变换的要求更加严格,
需满足性质L(→v+→w)=L(→v)+L(→w)和L(c→v)=cL(→v)
本篇仅考虑与之等价的直观特性,即“保持原点不变且网格线平行等距分布”,二维到一维的
变换情况就是任意二维向量所在直线上等距分布的点,经过线性变换后也等距分布于数轴上。
变换后的基向量落在数轴上变成一个数,用一个1×2矩阵描述。
R2→R的线性变换用1×2矩阵与向量的乘法描述,其运算方法(列的线性组合)
看起来就和点积的坐标公式一样。1×2矩阵看起来正像一个倾倒的向量。
通过以上观察发现,点积的坐标公式与R2→R变换的1×2矩阵向量乘法运算具有相同的形式。
下面我们从几何直观上验证一下2D投影矩阵左乘2D向量其实就是2D投影矩阵的行向量与
这个向量的对应坐标相乘再相加,从而确定点积的几何解释就是投影长度与向量模长之积。
假定你还不知道点积与投影有关,考虑0在原点斜放的数轴上一个单位向量(模长为1的向量)ˆu
如果我们把二维向量投影到这条数轴上,就定义了一个从二维向量到数字的变换,
通过视觉上的检验,发现这个投影变换是线性的。(直线上等距分布的点投影到数轴上仍保持等距)
注意u帽是输入空间中一个二维向量,只是刚好让它落在输出空间数轴上。
下面我们来找出这个投影变换对应的投影矩阵。
考虑变换后单位基向量i帽和j帽的位置,它们将分别变成矩阵的两列(两个数)。
因为ˆi 和 ˆu都是单位向量,它们之间的互相投影存在之前提到过的镜像对称关系,
ˆi在ˆu上的投影长度其实就是ˆu的横坐标ux,同理,ˆj 在ˆu上的投影长度等于ˆu的纵坐标uy
因此投影变换矩阵就是[uxuy],所以任意二维向量与单位向量的点积,
都可解释为将向量投影到单位向量所在直线上所得到的投影长度(可正可负)
如果是与“非单位向量”的点积,对偶的变换是[kuxkuy],即基向量的投影长度分别是ux和uy的k倍。
因为变换是线性的,即[kuxkuy]=k[uxuy], 这个变换等价于先将二维向量投影到单位向量,
再把投影长度乘上k倍。单位向量的缩放倍数k即“非单位向量”的模长,所以任意两个向量点积的
几何解释就是投影长度与向量长度的乘积,从而得到点积的几何公式|a||b|cosθ
对点积的直观几何解释用到了对偶性的思想。
对偶性是两个数学事物之间存在的自然而又出乎意料的对应关系。
两个向量的点积,利用向量与线性变换的对偶关系,相当于把其中一个向量看作是投影变换矩阵。
于是,我们可以进一步地理解向量的本质是“线性变换的物质载体”。
(as the physical embodiment of a linear transformation”)
向量就像一个特定变换的概念性记号,例如本节中转置成1×2矩阵的二维向量就是投影变换的记号。
一个2d-to-1d的线性变换,必存在一个唯一的向量,
输入向量与这个对偶向量点积与应用变换的效果是一样的。
duality 这个概念在数学和物理的许多地方都有分布,而没有一个统一的定义。我熟悉的 duality 大部分都是
把两个显然相对应的东西联系起来,有时这两个东西在某种程度上甚至是等价的(比如在同构意义上)。
因为一旦有了对偶性,每证明一个定理都能通过对偶的操作自动免费得到另一个(可以理解为镜像)。
数学的布尔代数和集合论中的对偶概念可能是最平易近人的。
物理中常翻译为二象性,例如波粒二象性 (Wave–particle duality)。