独家 | 线性代数:每个数据科学家的必知概念(下)

共 5442字,需浏览 11分钟

 ·

2024-07-26 17:00

   

作者:Benedict Neo

翻译:陈之炎

校对:ZRX

本文约2900字,建议阅读8分钟

本文将探讨上述线性代数概念、视觉解释和代码示例。



本文(上篇)目录


向量
  • 单位向量
向量操作
  • 向量相加
  • 标量相乘
  • 点积
向量空间
  • 零空间(核)
  • 张成空间
  • 线性独立


本文(下篇)目录

矩阵
  • 矩阵作为函数
  • 线性变换
  • 逆矩阵
  • 奇异矩阵
  • 单位矩阵
  • 对角矩阵 
  • 正交矩阵
  • 矩阵乘法
  • 决定值 
  • 特征向量和特征值


矩阵

矩阵是按行和列组织输入和操作方式。

图片由作者提供

这是一个2行2列的矩阵,矩阵是一种数学工具,可以以结构化的方式解决实际问题。

矩阵作为函数

可以将矩阵视为函数,Python函数接收输入矩阵,经过处理之后返回输出矩阵, 矩阵变换通过线性变换将输入向量转换为输出向量。

图片由作者提供

线性变换


线性变换是在两个向量空间V和W之间的映射,它保留了向量加法和标量乘法的操作。将矩阵A应用于向量x以得到另一个向量y(通过操作Ax = y)是一种线性变换。这种变换在数据科学中得到大量使用:

  • 降维:PCA使用线性变换将高维数据映射到低维空间 
  • 数据转换:归一化或标准化数据集是一种线性变换
  • 特征工程:通过组合现有特征来创建新特征。

以下是一些特殊形式的矩阵:

逆矩阵

当矩阵与其逆矩阵相乘时,结果为单位矩阵。

奇异矩阵

奇异矩阵是没有一个逆矩阵的方阵,即矩阵的决定值为零或其秩小于其大小。

单位矩阵

单位矩阵是一个方阵,其对角线上的元素值为1,其余位置元素值为零,它在矩阵乘法中作为乘法恒等元素, 就像数字1一样,不改变矩阵中任何元素的值。


对角矩阵

对角矩阵是一个方阵,其中主对角线外的所有元素均为零,。它用于求解特征值, 并用于决定值计算。


正交矩阵

如果一个方阵的转置等于它的逆阵,那么认为它是正交的。

正式地说,如果矩阵A满足 AᵀA=AAᵀ = I,其中I是单位矩阵,那么A就是正交的。

从几何意义上讲,如果一个矩阵的列和行是正交单位向量,即它们是相互垂直的并且大小为1, 那么该矩阵就是正交的。回想一下,如果两个向量互相垂直(90度),并且它们之间的点积为0,则它们就是正交的。

矩阵乘法

如何使用矩阵来执行矩阵乘法? 这里有一个很好的可视化图,摘自《线性代数直观指南》


想象你正在对每个输入数据实施不同的操作。

举个操作的例子。


经过操作后,得到以下结果。

输入是一个[3 x 2] 矩阵,对输入实施操作的矩阵是 [2 x 3];结果是 [2 x 3] [3 x 2] = [2 x 2]。输入的大小必须与操作的大小相匹配。

矩阵的迹是其所有对角线元素的和,它在基变换下是不变的, 提供了关于矩阵的值信息,即,迹是矩阵的特征值之和。

决定值

决定值是输出变换的大小, 如果输入是单位向量(面积或体积为1),那么决定值就是变换后的面积或体积的大小。 以下述矩阵为例,如果A的面积放大了6倍,那么变换的决定值就是6。 


负决定值意味着整个空间被翻转了,这种变换就像是把一堆纸翻转到另一边。


注意红色轴和绿色轴的方向是如何反转的,决定值为0意味着矩阵是“破坏性的”,并且无法逆转。类似于乘以零,信息丢失了。 决定值可以告诉我们矩阵是否可逆,如果det(A)是0,那么逆矩阵不存在;矩阵是奇异的。

矩阵中线性独立列/行向量的最大数量,它表示由其行或列张成的向量空间的维度,由此得出线性变换后的输出维度数量。当变换的输出是单一向量(它是一维的),说明变换的秩是1。如果所有向量都落在某个二维平面上,则说变换的秩是2。对于2x2矩阵来说,秩为2是它所能达到的最好情况,称之为满秩,它意味着基向量可以张成整个2D空间,并且决定值非零。 对于3x3矩阵来说,秩为2意味着它已经坍塌了,但还没有秩为1那么严重。

特征向量和特征值 

特征向量和特征值表示变换的“轴”。特征向量是在线性变换后方向不变的输入,即便方向没变,但是大小可能会变。 这个大小则是特征向量放大或缩小的程度,即特征值。 想象一下当旋转一个地球仪,每个位置都面向一个新的方向,但极点除外,极点的方向始终没有改变。

特征向量

对于矩阵A和向量v,如果Av = λv,那么λ是特征值,v是A的特征向量。还有一种说法是,方阵A的特征向量是满足矩阵乘法 = 标量乘法的向量。

感谢拨冗阅读!

资源

Hackers 通道 
  • 程序员必学计算线性代数
  • 应用机器学习的线性代数入门
可视化
  • 图形线性代数-一种新的LA方法
  • 线性代数的本质3BluelBrown-惊人的动画,可视化的概念
  • 矢量化
  • 洞察数学
论文/课程/教科书
  • 深度学习所需的矩阵演算
  • 数据分析、信号处理和机器中的矩阵方法  |麻省理工学院开放式课程
  • 线性代数全答对
  • 4页线性代数.Pdf

保持联络!

务必关注 bitgrit 数据科学出版物以保持更新!想和其他数据科学家讨论数据科学和人工智能的最新发展吗?加入我们的discord服务器!关注 Bitgrit 以获取有关研讨会和即将到来的比赛的更新!

作者简介:

本博由 Benedict Neo 撰写 ,bitgrit 数据科学出版物的编辑,40K 关注, Python ∩ 数据科学 ∩ AI 

原文标题:
Linear Algebra Concepts Every Data Scientist Should Know
原文链接:
https://medium.com/bitgrit-data-science-publication/linear-algebra-concepts-every-data-scientist-should-know-18b00bd453dd


编辑:黄继彦




译者简介





陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。业余时间喜爱翻译创作,翻译作品主要有:IEC-ISO 7816、伊拉克石油工程项目、新财税主义宣言等等,其中中译英作品“新财税主义宣言”在GLOBAL TIMES正式发表。能够利用业余时间加入到THU 数据派平台的翻译志愿者小组,希望能和大家一起交流分享,共同进步

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。


点击文末“阅读原文”加入数据派团队~



转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。



点击“阅读原文”拥抱组织



浏览 91
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报