不提对偶空间也能讲好张量故事

机器学习与数学

共 3007字,需浏览 7分钟

 · 2021-09-18

前面几篇中我们通过引入对偶空间来定义张量。实际上,如果不用对偶空间,也可以引入张量,而且可能对工科同学更加友好。

如果没时间细看本文,可以拉到最后看小结

向量空间 和它的对偶空间 毕竟是不同的两个空间。其实,我们也可以摆脱对偶空间,在同一个向量空间 中讲故事。通过引入类似的概念,那就是 reciprocal basis,这个可以叫逆变基或者互逆基之类的。

1内积空间

首先,假设 的基。但注意,这里基不一定指标准正交基,可以长短不一甚至互不正交,也就是所谓的斜坐标系。

我们知道,笛卡尔在当年引入坐标系的思想可点击时,并没有指定直角坐标系,因此,他脑海里如果有坐标系的话,大概也是指一般情况,即斜坐标系。

那问题来了,既然有了好好的直角坐标系,为什么不用呢?偏偏要去用斜角?比如有时候斜角坐标系更方便于表示实际的物理问题。

话不多说,让我们来看一个 2D 斜坐标系的例子,

在斜坐标系下,每一点的坐标不是拉垂线来确定了,而是按平行四边形法则来确定。

中的一个向量 ,在一组基向量 下的表示为,

也就是说,向量 的坐标记为 。注意,这里的上标不是幂次。这主要是为了区分协变分量和逆变分量。另外,为了公式的含义更加明确,我们这里不使用爱因斯坦求和约定,而是把求和符合及下标都写出来。

好了,现在有两个向量 ,他们能一起搞啥事情呢?除了加加减减之类的好像也搞不了啥大事情啊。为了带来更多活动,我们可以给向量空间引入一些结构,也就是两两一起运算的规则。

虽然没有平面或者三维空间中那么直观,但我们也可以给高维或者抽象的向量空间引入类似概念,比如向量长度,两个向量间的夹角、垂直等。

例如,只要引入内积,就可以实现这些。根据内积的运算规则,我们有

我们得到一个二次型,由内积的定义可知,最后那行里的 构成一个对称矩阵 。由于内积是非退化的,因此它是一个可逆矩阵。另外,由于这些基向量未必正交或者单位长度,这个矩阵往往不是单位矩阵。 其实是一个张量的分量,就是所谓的度量张量,而物理书里一般喜欢叫成度规张量。

有了这个度量张量,就可以定义向量的长度以及向量的夹角之类的。

  • 定义向量的长度,
  • 定义两个非零向量的夹角 的余弦,

这里先把这个张量放一放,继续来看式(2)中的求和项。

逆变基

如果 的维度是 的话,上面的求和总共有 项了。原因在于这里的基向量并不一定两两正交。那么有没有办法缩减求和项的个数呢,比如让它只剩 项。

我们先引入另外一组基,,注意现在是上标了。此时,其中一个向量用这组基表示,即 。注意,此时的坐标 反而用了下标,这都是记法,大家只要按照这个规则即可。然后,再把它代入内积公式,得

这好像换汤不换药嘛,貌似仍然是 项。但是,这里是两组基,两两之间我们可以来搞一点特殊嘛。怎么个特殊法呢?目标上面已经说了,那就是希望最后只有 项。

思路就是选择一组特殊的 使得上面的表达式被简化为

怎么做到呢,其实也简单,那就是在给定第一组基的前提下,选第二组基时让它满足如下条件,

有些地方把这个要求称为对偶关系、对偶准则或者对偶原理之类的。

那么小明可能又要提问题了:给定一组基向量 的情况下,满足上面对偶关系的第二组基向量 一定存在吗?

是的,简单点说,第一个基构成了一个非奇异矩阵,那么它一定存在唯一的逆矩阵,而第二个基就来自这个逆矩阵。

下面用一个平面例子来直观地展示几何关系。因为我们只需要  以及 因此,给定 (黑色箭头),我们可以如下构造 两个向量(红色箭头)

如上图所示,绘制一条垂直于 的红线。由于 必须沿着这条线。现在调整 的长度直到 。然后,用类似方式构建 。注意,这里原始的基向量 不一定是单位向量,因此跟它们作内积并不是直接投影。

有了逆变基,我们还可以得到一个向量 的协变分量,即

一个向量与原始的基向量内积得到的不是原始基下的坐标,而是它在逆变基下的坐标分量。通过下图我们可以进一步理解上式的几何意义。

但是请注意,为了更好解释几何意义,这里的原始基向量都是单位向量。

同样地,一个向量与逆变基向量的内积得到的不是逆变基下的坐标,而是它在原始基下的坐标分量。

可以看个动画,

左边是协变分量,右边是逆变分量。感受一下当其中一个原始基向量变动时,向量的不同类型坐标分量是如何跟着变化的。

度量张量的妙用

再回到上面提到的那个度量张量,至于它为什么是一个张量等后面的张量定义吧,我们先承认这点即可。

逆变基向量 在原始基 上的分解记为,

长得这么相似,是不是有什么关系呢?

将上式代入式 (3),得

首先, 构成一个 矩阵。再仔细一看上面式子,它还是度量矩阵 的逆矩阵。

这说明什么?说明可以由 求得逆矩阵 ,再根据 求得逆变基

下面我们来看看两个逆变基向量的内积,

其实,如果在上式中只代入一项 ,推导将变得更加简单,

下面再看度量矩阵及其逆矩阵与基向量的运算,会发现一些有趣且实用的规律。

再连加,可得

这就是说通过度量矩阵及其逆矩阵实现 之间的相互转换。这很容易记,我们不妨把它们再放一起看看。

这样,我们得到了内积空间的几个基本量 ,以及它们之间的关系。这里上下标变来变去貌似有点繁杂,其实有很明显的规律。

小结

我们来理一理思路,揭示一下背后隐藏着的真相。其实我们所考虑的内积空间是由度量张量在背后操控着的。为了以矩阵的形式展示这个张量,我们需要先选定一组基,然后就有了后续。具体展示如下,

  • 给定一组基

  • 设定度量张量在这组基下的协变分量,即

  • 的逆矩阵

  • 由  求逆变基,即

但是,要注意的是, 这两个矩阵不是谁决定谁,而是互逆关系。因此,也可以先给出矩阵 。而 是同一个度量张量不同类型的分量,就像 也是同一向量 的不同类型的分量那样,即逆变分量协变分量

最后,再看一下向量分量的变换规律。我们把 代入 ,得

另一个也同理,放在一起方便观摩,

看到了吧,这个度量张量的不同类型的分量可以起到升降分量指标的作用,这在张量计算中是常用的招术。

+放一起欣赏

最后,小明又要提问了,说逆变基与以前说过的对偶基是什么关系呢?

其实呢,有些书也把逆变基称为对偶基,这是叫法问题。但对偶基是在 的对偶空间里的,逆变基毕竟还是在同一个向量空间 之内的,因此这两者还是要区分的,具体关系我们后续再议。

相关阅读


什么是张量?你躺平一下就知道了

张量之对偶空间,对偶到底是个啥?

张量前传 - 通过向量的并矢积认识张量

矩阵和线性代数原来是这么来的

矩阵特征值的故事 - 缘起琴弦

二次型和矩阵合同原来是这么一回事

矩阵特征值是这么来的,以及有趣的盖尔圆

万能的 SVD 分解是哪位牛人提出来的?

度量、范数和内积原来是这么个关系

线性映射: 从凯莱引入矩阵乘法说起

矩阵之芯 SVD: 奇异值分解及其几何解释

矩阵之芯 SVD: 基本应用以及与其他分解的关系

矩阵之芯 SVD: 从奇异值分解看四个基本子空间

矩阵之芯 SVD: 从奇异值分解 SVD 看 PCA 



浏览 123
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报