张量之对偶空间,对偶到底是个啥?

机器学习与数学

共 2816字,需浏览 6分钟

 · 2021-08-15

这个动图什么意思?答案见文末。

本篇主要来看一下线性空间的对偶空间这个概念。引入这个概念以后,就可以比较完美地定义和理解张量了。

换句话说,如果不用对偶空间,其实也可以定义张量,比如很多物理书本里就是另一种方式,有关这点我们后面再谈。

废话不多说,单刀直入吧。

对偶空间

的一个对偶向量是指定义在 上的线性函数。对于 以及 ,均有

成立。

  • 首先是个函数,这问题不大,但函数可以将 中向量和实数建立对应关系,这个关系可以很复杂,例如连续不连续,光滑不光滑等情况。所以光是函数的话还是太复杂了。

  • 简化一下,是线性函数。考虑问题不用拐弯抹角了,你向量拉长几倍,我出来的值也变大几倍。而且等号左边向量的加法可以拆成等号右边两个函数值的加法,这就是说向量的线性组合关系和函数的线性组合关系是一样的。

有限维线性空间上的线性函数有个非常好的性质:只要给定函数在基上的取值,这个函数在整个空间上的取值也就知道了。

定义 上所有对偶向量的集合称为 的对偶空间,记为

对偶基

假设 的一组基为 , 而 中的元素 (都是线性函数)是对偶空间 的基,也称为 刚才那组基 的对偶基。

其中 定义如下,

这么简单的函数能构成 的基吗?我们来看一下。

对于 中的任意一个元素 ,以及一个给定的 ,有

对于 中的一个元素 ,有

是任意的,所以有

这说明啊, 中的任意一个元素确实可以用 线性表示。于是,只需要说明 是线性无关的就可以了。这个作为作业练练手吧。

我们回顾一下上一篇中的例子,即 的情况。

3对偶之对偶

有了对偶向量和对偶空间的概念,我们再来看看线性空间 的对偶向量及对偶空间。

的一个对偶向量是指定义在 上的线性函数,对于 以及 ,均有线性函数 使得下式

成立。

这个函数 吃进 中的一个向量 (也就是定义在 上的一个线性函数),吐出一个实数

看上去有点复杂的样子,但转念一想,这个情况跟刚才 不是一样吗,只是角色位置稍微有点变化。

上的线性函数长啥样?

我们先来定义上的一个 上线性函数试试,比如给你一个 中的 ,让它去看整个 中的任意一点 ,得到一个数。那我们就按下面这个样子来定义,

这似乎让人感觉有点怪怪的?这个 一会儿是函数名,一会儿又变成自变量了。这要是搁 C 语言里可是不合法的呀,难道数学比起编程来反而不严谨?

其实这里函数名只是映射的名字而已,关键点是背后元素之间是怎么对应的。这里用 表示的这个映射,一端是一个 中的点 ,另一端是一个实数 ,它就是一个十足的函数嘛。

如果实在看着不舒服,可以下面这样定义,

固定 ,吃进 ,吐出来相应的数字。

虽然这家伙是函数没错了,但它是线性函数嘛?就是看看下面的式子对于 以及 是不是都成立

我们来代入算一下,

第一个等号是定义,而第二、三个等号是因为 都属于线性空间

好了,这样定义的函数还真是 上的线性函数。

对偶两个字其实不大好解释,因为有很多解读方式,但这里暂时不想牵扯太多,就看下面的这个形式,

我中有你(我吃你),你中有我(你吃我)

这不仅仅是对称,更是

我定义在你所在的空间上,你定义在我所在的空间上。

另外,这个函数是不是还有下面这层意思呢?

你看好我,那么我认为你的眼光好、三观正。说明 的值与 的值相互契合。

1、 的坐标对应它的品质。

你看好我,就是 值大,以 的三观来看认为 的品质好。

2、 的坐标对应它的三观、眼光。

是以 的三观来打量 ,以 的三观(坐标,也就是它自身品质)来考量 的眼光。

我认为你的眼光好、三观正,就是 的品质与 的三观契合。

所谓男女登对,不过如此吧。

定义在 上的所有线性函数构成了

我们给 输入一个 ,得

而我们知道,

的样子 和 的样子咋这么像呢?

任给一个 上的线性函数 ,我们令 ,于是就得到,

这不就是上面定义的 吗?因此, 上的线性函数的集合与 中所有元素一一对应,这里其实是存在所谓的自然同构,可以简单地认为它们等同,即

因此有如下的关系,

上的所有线性函数构成了 ,反过来 上的所有线性函数构成了

对偶向量的对偶是双对偶(double dual)。双对偶形成的向量空间 与向量空间 同构,在同构意义下,我们可以认为

中的每个点(躺平向量,本质是 上的一个线性函数)都是张量, 而 中的每个点(上进向量)也都是张量。

协变

上一篇中,我们说上进向量的坐标变换与 的基变换互逆,称为逆变;而躺平向量属于 的对偶空间,坐标变换跟 的基变换一致,称为协变。

我们已经知道上进向量确实作了逆变,但是并不清楚躺平向量为啥是协变?

最后,我们来看一下为什么对偶空间里的向量坐标是跟着 的基的变换作协变。

下面来研究对偶空间中的向量随基底变化的变换规律。已知一个线性空间 的两组基 (统一看成列向量),我们可以用一个矩阵来表示它们之间的转换关系,

这里,变换矩阵左乘或者右乘都是可以的,顶多差一个转置,可以凭个人的喜好选择。

把基向量单独拿出来看,就是

对于 ,它关于两组基 的坐标分别为 。我们把新基代进去算一算,得

将其写成矩阵形式,

坐标变换就是基变换,不用求逆,所以遵守协变规律。

小结

  • 1、给定一个线性空间 ,可以在它上面定义线性函数,所有的线性函数构成了另一个线性空间,即所谓的 的对偶空间

  • 2、 也是一个线性空间,那么由 1 可知它也有对偶空间,即

  • 3、发现 中的元素一一对应,自然同构。简单地说,可以认为两者等同

  • 4、 中向量的坐标变换与它的基变换互逆,称为逆变;而 的对偶空间的对偶向量的坐标变换跟 的基变换一致,称为协变。

最后看一个动图,

最左边的齿轮表示 的基 变换,中间齿轮表示 中向量的坐标 变换,右边齿轮表示 中向量的坐标 变换。

不妨回想一下,

由这个公式可知,中间的 其实对应了 的基,因此第二个与第三个是逆变。逆逆得顺,第三个与第一个又成协变了。


相关阅读


什么是张量?你躺平一下就知道了

矩阵和线性代数原来是这么来的

矩阵特征值的故事 - 缘起琴弦

二次型和矩阵合同原来是这么一回事

矩阵特征值是这么来的,以及有趣的盖尔圆

万能的 SVD 分解是哪位牛人提出来的?

度量、范数和内积原来是这么个关系

线性映射: 从凯莱引入矩阵乘法说起

矩阵之芯 SVD: 奇异值分解及其几何解释

矩阵之芯 SVD: 基本应用以及与其他分解的关系

矩阵之芯 SVD: 从奇异值分解看四个基本子空间

矩阵之芯 SVD: 从奇异值分解 SVD 看 PCA 



浏览 248
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报