独家 | 线性代数:每个数据科学家的必知概念(上)
共 5318字,需浏览 11分钟
·
2024-07-25 17:00
作者:Benedict Neo
翻译:陈之炎
校对:ZRX
本文约2500字,建议阅读8分钟
本文将探讨上述线性代数概念、视觉解释和代码示例。
你对线性代数有足够的了解吗?
xkcd
线性代数可用于:
6. 其他!
本文将探讨上述线性代数概念、视觉解释和代码示例。 让我们立即开始!
代码→ Deepnote 笔记本
本文(上篇)目录
-
单位向量
-
向量相加 -
标量相乘 -
点积
-
零空间(核) -
张成空间 -
基 -
线性独立
-
矩阵作为函数 -
线性变换 -
逆矩阵 -
奇异矩阵 -
单位矩阵 -
对角矩阵 -
正交矩阵 -
矩阵乘法 -
迹 -
决定值 -
秩 -
特征向量和特征值
向量
图片由作者提供
这是线性代数的基本构建块。通常有三种方式来考量向量。
第一种是物理学视角:向量是指向空间中的箭头, 由长度和方向定义。平面上的向量是二维的,生活空间中的向量是三维的。
第二种是计算机科学视角:向量是有序的数字列表,列表的长度决定了维度。
第三种是数学家的视角:向量可以是任何东西,只要两个向量可以相加并且可以被数字乘(即标量乘法)。
Deepnote 截图
单位向量
单位向量是幅度为1的向量,通常用它来表示一个向量的方向,而无需考虑其大小。
向量操作
向量相加
两个向量的加法构成一个新的向量,逐分量相加。
标量相乘
标量相乘是一个向量乘以一个标量(一个数字), 结果是一个方向与原向量相同(如果标量是负数则相反)的向量, 其大小由标量的绝对值进行缩放。
点积
它是两个向量的欧几里得大小的乘积和它们之间夹角的余弦, 反映了向量的长度和它们的方向关系。
点积公式
直观地说,可以将点积公式想象成将一个向量的定向增长应用到另一个向量上, 或者“一个向量给另一个向量提供了多少动量/能量?”。结果是使得原向量变得更强(正向,负向或0)
如果两个向量的点积为0,则说明这两个向量是正交的。
可以用一个有趣的类比做进一步解释:
假设红色向量是速度,蓝色向量是助推垫的方向,点积是获得的助推量,助推力数值越大,意味着能获得更强的动力。
使用方程式来表示,|a| 是来速,|b| 是最大助推,获得的助推百分比是 cos(θ), 总体助推为 |a| |b| cos(θ)。
进一步解释
向量空间
向量(或线性)空间是任何可以相互做加法和乘法(称为标量)的向量集合。
满足一系列公理的向量V 称为向量空间。
零空间(核)
零空间是一组向量的集合,当它们与矩阵相乘时,结果为零向量。
将它表示为方程 Ax = 0 的解,其中 A 是给定的矩阵。
假设一个二维空间中有两个向量,可以将矩阵的零空间可视化为一个子空间, 当与矩阵相乘时,向量将折叠到原点(零向量)。
张成空间
给定一对向量v 和 w 的线性组合av + bw构成的所有可能向量的集合,其中 a 和 b 是实数。大多数向量对经过线性组合之后,可以到达二维向量平面上的任意点。
3blue1brown 关于张成空间的视频
当两个向量恰好排成一行时,它被限制在通过原点的单条线上。
张成空间的概念是基的概念的基础。
基
基是一组线性独立的向量,它们组成整个向量空间,向量空间中的每个向量都可以表示为基向量的线性组合。 将它们想象为空间中所有其他向量的构建块。 将单个向量想象为箭头,对于一组向量集,将其想象为点,基向量对可以张成整个二维平面。
线性独立
如果集合中的向量不能用其他向量的线性组合表示(例如,x 和 y 的线性组合将是任何形式的 ax + by,其中 a 和 b 是常数),则一组向量是线性独立的。
资源
-
程序员必学计算线性代数 -
应用机器学习的线性代数入门
-
图形线性代数-一种新的LA方法 -
线性代数的本质3BluelBrown-惊人的动画,可视化的概念 -
矢量化 -
洞察数学
-
深度学习所需的矩阵演算 -
数据分析、信号处理和机器中的矩阵方法 |麻省理工学院开放式课程 -
线性代数全答对 -
4页线性代数.Pdf
保持联络!
务必关注 bitgrit 数据科学出版物以保持更新!想和其他数据科学家讨论数据科学和人工智能的最新发展吗?加入我们的discord服务器!关注 Bitgrit 以获取有关研讨会和即将到来的比赛的更新!
作者简介:
本博由 Benedict Neo 撰写 ,bitgrit 数据科学出版物的编辑,40K 关注, Python ∩ 数据科学 ∩ AI
译者简介
陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。业余时间喜爱翻译创作,翻译作品主要有:IEC-ISO 7816、伊拉克石油工程项目、新财税主义宣言等等,其中中译英作品“新财税主义宣言”在GLOBAL TIMES正式发表。能够利用业余时间加入到THU 数据派平台的翻译志愿者小组,希望能和大家一起交流分享,共同进步
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。
点击“阅读原文”拥抱组织