瞎扯数学分析——微积分（大白话版）-技术圈

↑↑↑点击上方蓝字，回复资料，10个G的惊喜

公理体系的例子，想说明人类抽象的另外一个方向：语言抽象（结构抽象已经在介绍伽罗华群论时介绍过）。

为了让非数学专业的人能够看下去，采用了大量描述性语言，所以严谨是谈不上的，只能算瞎扯。

现代数学基础有三大分支：分析，代数和几何。这篇帖子以尽量通俗的白话介绍数学分析。数学分析是现代数学的第一座高峰。

最后为了说明在数学中，证明解的存在性比如何计算解本身要重要得多，用了两个理论经济学中著名的存在性定理（阿罗的一般均衡存在性定理和阿罗的公平不可能存在定理）为例子来说明数学家认识世界和理解问题的思维方式，以及存在性的重要性：阿罗的一般均衡存在性，奠定了整个微观经济学的逻辑基础--微观经济学因此成为科学而不是幻想或民科；阿罗的公平不可能存在定理，摧毁了西方经济学界上百年努力发展，并是整个应用经济学三大支柱之一的福利经济学的逻辑基础，使其一切理论成果和政策结论成为泡影。

一、微积分

数学分析是微积分基础上发展起来的，所以先说说微积分。

微积分的基本思想是以直为曲，也即用直线来逼近曲线，在中国古代，刘徽，祖冲之计算圆周率用的割圆术就是典型的微积分方法，三国时期的刘徽在他的割圆术中提到的“割之弥细，所失弥小，割之又割，以至于不可割，则与圆周和体而无所失矣。”魏晋南北朝时期的祖冲之说的更简单：以曲为直逼近。在古代巴比伦，希腊都用这种方法来处理曲线计算问题，有史可查的记录是公元前三世纪，古希腊的阿基米德计算抛物弓形的面积、球和球冠面积、螺线下面积和旋转双曲体的体积时，就用了直线逼近。

所以在牛顿（Newton）和莱布尼茨（Leibniz）发明微积分之前，很多实际上的微积分的工具已经开始运用在科学和工程之中。例如法国的费尔玛、笛卡尔、罗伯瓦、笛沙格；英国的巴罗、瓦里士；德国的开普勒；意大利的卡瓦列利等人都用这种以直为曲的逼近方法计算工程问题。

但是微积分为什么说是十七世纪牛顿和莱布尼茨发明的呢，我觉得主要是两点：第一点是引入了函数概念来描绘变量；第二点是发明了一套符号体系，可以计算各种初等函数微分（初等函数简单说就是多项式函数、幂函数、指数函数、对数函数、三角函数、反三角函数，以及由这些函数经过有限次四则运算或函数的复合而得的所有函数）。

牛顿和莱布尼茨发明的最原始的微积分可以解决以下问题：

求即时速度的问题；求曲线的切线；求函数的最大值和最小值；求曲线长、曲线围成的面积、曲面围成的体积、物体的重心、一个体积相当大的物体作用于另一物体上的引力等等。

牛顿和莱布尼兹最本质的贡献是把求切线问题（微分学的中心问题）和求积问题（积分学的中心问题）变成一个问题。这就是著名的牛顿--莱布尼兹公式。

牛顿和莱布尼茨建立微积分的基本思想是以曲为直，逐步逼近，其中创造是引入了无穷小量Δ，因此微积分也称为无穷小分析。

不过他们两个有区别，牛顿从运动角度入手，莱布尼茨从几何角度路入手。

牛顿在1671年写了《流数法和无穷级数》，这本书直到1736年才出版，它在这本书里指出，变量是由点、线、面的连续运动产生的，否定了以前自己认为的变量是无穷小元素的静止集合。他把连续变量叫做流动量，把这些流动量的导数叫做流数。牛顿在流数术中所提出的中心问题是：已知连续运动的路径，求给定时刻的速度（微分法）；已知运动的速度求给定时间内经过的路程（积分法）。

莱布尼茨1684年发表世界上最早的微积分文章：《一种求极大极小和切线的新方法，它也适用于分式和无理量，以及这种新方法的奇妙类型的计算》，创立了现代的微分符号和基本微分法则（远远优于牛顿的符号，现在使用的微积分通用符号就是当时莱布尼茨创造的），1686年，莱布尼茨发表了人类第一篇积分学的文章。

微积分的创立，极大地推动了数学的发展，过去很多初等数学束手无策的问题，运用微积分，往往迎刃而解。例如牛顿应用微积分及微分方程从万有引力定律推导出了开普勒行星运动三定律。

微积分也极大的推动天文学、力学、物理学、化学、生物学、工程学等的发展。

由于争抢微积分发明权，欧洲大陆的数学家和英国数学家的长期对立，英国数学陷入牛顿的“流数术”中停步不前，英国数学后来比欧洲整整落后了一百年。

虽然原始微积分是一种强大计算工具，但是从逻辑上讲，牛顿和莱布尼茨的工作都是很不完善的，他们为了计算微分，引入的在无穷和无穷小量概念，其实没有说清楚是个什么东西，例如牛顿的无穷小量，有时候是零，有时候不是零而是有限的小量；莱布尼茨干脆回避解释。无穷小的逻辑基础存在的问题导致了第二次数学危机的产生（这个在介绍现代数学基础的帖子里已经介绍了，不重复）。

19世纪初，法国的柯西对微积分的理论进行了认真研究，建立了极限理论，后来德国的魏尔斯特拉斯进一步的严格化，使极限理论成为了微积分的坚定基础。才使微积分在逻辑上站住脚，而不仅仅是一种计算工具。

微积分的基础概念是函数和极限。前者是微积分的工作对象，后者是微积分的基本工作技巧。

1、函数

函数概念是人类一个很伟大的发现，价值不下于对于数的发现，也是高度抽象的产物。

不过函数的思想却很早，至少在公元前就有了：因果关系，也即有因必有果，一个因对应一个或多个果，或者一个果对应多个因。

这在中国《易经》中已经有成熟的体现（其实《易经》就是64变量的函数论），正因为有了这种因果关系概念，中国远古时代我们先人就有了成熟精妙的辩证法（比黑格尔的辩证法高级多了，精细多了）。西方辩证法也是在有了成熟的函数概念后才成熟的。恩格斯就说过：“数学中的转折点是笛卡儿的变数，有了变数，运动进入了数学；有了变数，辩证法进入了数学”。

不过近代函数概念直接来源于代数方程中对不定方程的求解。

笛卡儿在1637年出版的《几何学》中，引入了现代函数的思想。英国人格雷果里在1667年论文《论圆和双曲线的求积》给出了函数的定义：从一些其他量经过一系列代数运算或任何其他可以想象的运算而得到的一个量。这里的运算指的是加减乘除开方五种代数运算以及求极限运算。

不过现在我们看到的函数定义来自于德国人莱布尼兹，他在1673年论文中，把任何一个随着曲线上的点变动而变动的几何量，如切线、法线、点的纵坐标都称为函数；并且强调这条曲线是由一个方程式给出的。直接定义了：函数表示依赖于一个变量的量。

紧接着函数概念被不断改进，第一个重要改进是瑞士人约翰.伯努利于1698年给出的：由变量和常量用任何方式构成的量都可以叫做的函数。这里的任何方式包括了代数式和超越式。

第二个重要改进是1748年欧拉在《无穷小分析引论》中给出的函数定义：变量的函数是一个解析表达式，它是由这个变量和一些常量以任何方式组成的。现代函数的符号就是欧拉发明的。欧拉还区分了显函数和隐函数、单值函数和多值函数、一元函数和多元函数等。

1775年，欧拉在《微分学》一书中，给出了函数的另一定义：如果某些变量，以这样一种方式依赖于另一些变量，即当后者变化时，前者也随之变化，则称前面的变量为后面变量的函数。这个定义，为辩证法数学化打开了大门。

第三次重要改进是从函数的几何特性开始的，是1746年达朗贝尔给出的，把曲线称为函数（因为解析表达式在几何上表示为曲线）。但是后来欧拉发现有些曲线不一定是由单个解析式给出的，因此提出了一个新的定义：平面上随手画出来的曲线所表示的x与y的关系。即把函数定义为由单个解析式表达出的连续函数，也包括由若干个解析式表达出的不连续函数（不连续函数的名称是由欧拉提出的）。

在整个十八世纪，函数定义本质就是一个解析表达式（有限或无限）。

第四次最重要的改进是1821年柯西在《解析教程》中，给出了如下函数定义：在某些变量间存在着一定的关系，当一经给定其中某一变量的值，其他变量的值也随之确定，则将最初的变量称为自变量，其他各个变量称为函数。这个定义把函数概念与曲线、连续、解析式等纠缠不清的关系给予了澄清，也避免了数学意义欠严格的变化一词。函数是用一个式子或多个式子表示，甚至是否通过式子表示都无关要紧。

不过函数精确定义是德国人狄利克里于1837年给出的：若对x（a≤x≤b）的每一个值，y总有完全确定的值与之对应，不管建立起这种对应的法则的方式如何，都称y是x的函数。这一定义彻底地抛弃了前面一些定义中解析式的束缚，强调和突出函数概念的本质，即对应思想。

对应思想是人类伟大的发现，后来的映射，同构，同态等等概念来源于此，这是这个概念最伟大的地方。

当然我们知道狄利克里伟大，主要不是他给出函数的科学定义，而是他给出了著名的狄利克里函数，这个函数是难以用简单的包含自变量x的解析式表达的，但按照上述定义的确是一个函数。

为使函数概念适用范围更加广泛，人们对函数定义作了如下补充：“函数y=f（x）的自变量，可以不必取[a，b]中的一切值，而可以仅取其任一部分”，换句话说就是x的取值可以是任意数集，这个集合中可以有有限个数、也可以有无限多个数，可以是连续的、也可以是离散的。这样就使函数成了一个非常广泛的概念。但是，自变量及函数仍然仅限于数的范围，而且也没有意识到“函数”应当指对应法则本身。

最后，我们要说说现代数学理解的函数（来自于美国人维布伦）：设集合X、Y，如果X中每一个元素x都有Y中唯一确定的元素y与之对应，那么我们就把此对应叫做从集合X到集合Y的映射，记作f：X-->Y，y=f（x）。

不过从布尔巴基以后，基于数学结构的函数概念更进一步抽象，从函数、映射进化到关系：

1939年布尔巴基用集合之间的关系定义了函数：设E和F是两个集合，E中的每一个元素x和F中的每一个元素y之间的一个关系f称为函数，如果对每一个x∈E，都存在唯一的y∈F，它们满足给定的关系。记作f：E→F。在布尔巴基的定义中，E和F不一定是数的集合，函数是集合之间的一个关系。也即设集合E和F，定义E与F的积集E*F如下：E*F＝{（x，y）|x∈ E，y∈ Y}。积集E*F中的一个子集f称为E与F的一个关系，若（x，y）∈ f，则称x与y有关系f，记为xfy,若（x，y）不属于f，则称x与y无关系f。设f是x与y的关系，即f∈X*Y，如果（x，y）∈f,（x，z）∈f ，必有y=z，那么称f为X到Y的映射或函数。

这个定义回避了对应这种模糊不清的描述语言，而且把函数从单纯的数的概念推广到一切对象，例如结构，图像，集合等等。

不过微积分要处理的函数概念还是原始的，甚至只能处理初等函数。特点就是函数自变量的变化范围是数域，也即函数定义域与因变量的变化范围值域都是数域。这就是微积分的工作对象。这个对象可以描述一部分基于初等函数规律描述的变量跟结果的因果关系，通过对这种因果关系的分析和计算，人类就能预测或控制符合相应初等函数规律描述的事件或事物的因果关系，例如各种工程设备，武器系统等等，就能建立工业文明。

2、极限

极限是微积分的主要工作技巧。整个数学分析就是建立在极限概念上（包括级数）来处理初等函数因果关系的一门学科。

极限技巧一般是：对无法把握的连续变量，用可以计算的序列（例如数列，时间序列，多项式序列等等）逐步逼近变量，并能够证明这些序列可以无限逼近所求的未知量，然后计算这个序列的极限就可得到变量。

极限思想是微积分的基本思想，函数的连续性，导数以及定积分等等都是借助于极限来定义的。

所以可以说：数学分析就是用极限思想来研究函数的一门学科。

极限的思想在刘徽割圆术就有了，但是仅仅是一种计算方法，而不是一个思维方式。真正的现代极限思想来自于16世纪荷兰人斯泰文计算三角形重心过程中，用逐步逼近方式逼近重心。

牛顿和莱布尼茨最早并不是用极限思想来建立微积分的，他们的概念基础是无穷小，但是由于无穷小是个逻辑上有瑕疵的概念，导致微积分的逻辑基础无法自洽。例如牛顿用路程的改变量ΔＳ与时间的改变量Δｔ之比ΔＳ／Δｔ表示运动物体的平均速度，让Δｔ无穷小，得到物体的瞬时速度，并由此引出导数概念和微分，他并没有极限概念，他说：“两个量和量之比，如果在有限时间内不断趋于相等，且在这一时间终止前互相靠近，使得其差小于任意给定的差，则最终就成为相等”。这是一种几何直观而不是逻辑，就像小孩在纸上顺便划一下圆，就说是太阳。所以牛顿说不清楚他理解的无穷小到底是是什么。其实牛顿的说法如果用极限概念，很容易在逻辑上说清楚：如果当变量（例如时间t)无限增大或变量的差无限接近0时（Δｔ-->0)，则ΔＳ／Δｔ无限地接近于常数Ａ，那么就说ΔＳ／Δｔ以Ａ为极限，这个极限就是s（路径函数）在t0时的导数。

不过上述无限的概念仍然是几何直观的，并没有用逻辑描述出无限这个过程是什么，也没有定量地给出ΔＳ和Δｔ两个无限过程之间的数量联系，所以在逻辑上仍然有漏洞。

所以牛顿和莱布尼兹的微积分不断收到怀疑和攻击，例如最常见的质疑是贝克莱大主教的：在瞬时速度概念中，究竟Δｔ是否等于零？如果说是零，怎么能用它去作除法呢？如果它不是零，又怎么能把包含着它的那些项去掉呢？这就是数学史上所说的无穷小悖论。

牛顿由于没有极限概念，无法回答这种质疑，只能混战。主要原因是微积分起源于人类计算需要从常量扩展到变量，但是牛顿采用处理常量的传统思想来处理变量。

18世纪，罗宾斯、达朗贝尔与罗依里埃等人明确表示极限是微积分严格化的基础。其中最接近现代定义的是达朗贝尔的极限定义：一个量是另一个量的极限，假如第二个量比任意给定的值更为接近第一个量。但是这些定义都无法摆脱对几何直观的依赖。例如什么叫“接近”，逻辑上的含义是什么，其实还是几何直观。

现代极限概念来自于柯西，19世纪，柯西出版的《分析教程》定义：当一个变量逐次所取的值无限趋于一个定值，最终使变量的值和该定值之差要多小就多小，这个定值就叫做所有其他值的极限值，特别地，当一个变量的数值（绝对值）无限地减小使之收敛到极限0，就说这个变量成为无穷小。

柯西把无穷小视为以0为极限的变量，也即无穷小不是似零非零，无穷小非零，只是其极限为零。

魏尔斯特拉斯把柯西的语言翻译成ε--δ语言，给微积分提供了严格的理论基础。所谓
limaｎ(n-->∞)＝Ａ，是指：如果对任何ε＞0，总存在自然数Ｎ，使得当ｎ＞Ｎ时，不等式｜ａｎ－Ａ｜＜ε恒成立。

这个定义，借助不等式而不是几何直观，通过ε和Ｎ之间的关系，定量刻划了两个无限过程之间的联系。这个定义中，涉及到的仅仅是数及其大小关系，此外只是给定、存在、任取等词语，已经摆脱了“趋近”一词，不再求助于运动的直观。

这个定义，本质揭示了无限与有限有本质的不同：无限个数的和不是一般的代数和，它是部分和的极限，是动态过程，而非静态计算结果。举例来讲，用任何静态计算，都无法计算出变速直线运动的瞬时速度，因为速度是变量。这其实就是量变和质变的一个例子：量变能引起质变。例如对任何一个圆内接正多边形来说，当它边数加倍后，得到的还是内接正多边形，是量变而不是质变；但是，不断地让边数加倍，经过无限过程之后，多边形就变成圆，多边形面积便转化为圆面积，这就是量变到质变，这就是极限概念的本质。极限是区分初等数学和高等数学的分界线，初等数学处理静态问题，高等数学可以处理非静态问题了，例如求瞬时速度、曲线弧长、曲边形面积、曲面体体积等问题。

极限概念中，最重要的定理，非魏尔斯特拉斯的多项式逼近连续函数定理莫属，这个定理的简单表述是：闭区间上的连续函数可由多项式一致逼近。

这个定理意味着任何连续函数，都能构造一个多项式函数来逼近它，而多项式函数的导数，微分，积分的计算，简单易行，也即这个定理解决了连续函数的近似计算的逻辑基础问题：存在性。

这个定理最著名的证明是苏联数学家伯恩斯坦构造的著名的伯恩斯坦多项式，这个方法开启了函数构造法这一研究领域（当然对周期性的函数，还可以用三角级数，也即傅利叶级数逼近）。用多项式函数或三角级数逼近连续函数，是现代工程解决问题的主要方法，例如通信领域，如果不懂傅利叶级数，基本寸步难行，在流体力学、结构力学和弹性力学领域，不用多项式函数逼近，也基本无法计算海量的变量函数。函数构造方法其实是计算数学算法的基础（伯恩斯坦多项式符号太多，无法介绍，有兴趣可以上网搜索：伯恩斯坦多项式即可，有魏尔斯特拉斯定理用伯恩斯坦多项式证明的全过程）。

魏尔斯特拉斯本人最初的证明，是使用的核函数（正态核），并将核函数展开成一致收敛的幂级数，截取前面有限部分就构造出了逼近多项式。现在教材上选取的核函数是Landau核，这个核函数本身就是多项式，因此相比原证明减少了一步，但本质没有改变。魏尔斯特拉斯本人最初的证明不如伯恩斯坦的证明那么直截了当，那么优美（可以翻教科书参考，如果想详细了解过程，可以看菲赫金哥尔茨的《微积分学教程》，这是经典微积分教材）。当然这个定理最直观的证明是勒贝格的折线逼近法：闭区间上的连续函数可以用折线逼近（可以查书）。

极限是微积分的核心概念，微积分处理初等函数变化，一般都涉及无穷概念，无穷概念只有从极限角度理解，才能正确描述和把握，其实描述极限的语言体系是ε--δ语言是一个相当于公理体系的定义，ε--δ意义下的极限是一种公理定义下的逼近，这种逼近不是几何描述的，所以没有逻辑悖论的可能。

逼近的常见技巧是放缩和夹逼，也即不等式是极限的主要技巧。

微积分中讨论的连续函数、导数、定积分、级数的敛散性、多元函数的偏导数，广义积分的敛散性、重积分和曲线积分与曲面积分等等概念都是基于极限的思想方法给出。

3、连续

前面说过，微积分主要对象是初等函数，初等函数的本质性质就是连续，就像一元n次方程的根的本直性质的是对称一样，这是很本质的核心问题，当然微积分必须抓住。

所以换句话说，微积分主要工作对象就是连续函数。其实人类在直到牛顿莱布尼兹时代，并不知道还有非连续的函数概念。预先假定都是连续的，而且他们对连续函数理解仅仅是几何直观，把能一笔画成的曲线所对应的函数叫做连续函数。例如伽利略所研究的落体运动，开普勒所研究的绕日运转的行星所扫描的扇形面积，牛顿所研究的流等都是连续变化的量。

所谓连续，直观解释就是运动变化的过程连绵不断，连续函数就是刻画变量连续变化的数学模型。

微积分是以直为曲的，所以对连续函数也要进行这种处理，例如柯西和魏尔斯特拉斯就用离散的多项式来逼近连续函数，这就是极限理论的由来，有了极限，才开始真的能够把握连续函数的性质。

最早人类理解连续函数，就是当x逐渐改变时，函数f(x)的相应变动也是逐渐的，不会有任何突增或突减的跳跃式振荡。但这种理解毫无用处，因为既不能计算，也不能控制。

函数连续的精确表述：设函数f(x)在点x0的某一去心邻域内有定义，任给ε大于零，存在δ大于零，当｜x-x0｜<δ时，有｜f(x)-f(x0)｜<ε,则称函数f(x)在x0点连续。 < span="">

这就是数学分析的基本语言：ε--δ语言，不熟悉这套语言体系，无法学会数学分析。

用ε--δ语言定义的连续函数，就能计算其极限问题，这是微积分的重要内容，因为微分本质就是计算极限。

而连续函数求极限这种复杂问题本质是可以转化为求函数值的问题的，这就可以大大简化求极限难度。

我们知道，函数的连续性是一个局部性质，对区间也不例外。但如果是闭区间上的连续函数，却能把局部性质转化为整体性质，象闭区间上连续函数的有界性、最大最小值性、介值性、根的存在性、一致连续性等。

用ε--δ语言，我们就能把握连续函数的性质：

连续函数的局部性质：若函数f在点x0连续，则f在点x0有极限，且极限值等于函数值f(x0)。根据这个性质，可以容易证明下述定理：

局部有界性定理：若函数f在点x0连续，则f在x0的某邻域U(x0)内有界。

局部保号定理：若函数f在点x0连续，且f（x0）>0（或<0），则对任何正数r

四则运算定理：若函数f和g在点x0连续，则f±g，f*g，f/g（这里g(x0)≠0)也都在点x0连续。

复合函数定理：若函数f在点x0连续，g在点uo连续，u0=f(x0),则
limg(f(x))(x-->x0)=g(limf(x))(x-->x0)=g(f(x0))

海涅（Heine)定理：limf(x)(x-->x0)存在的充分必要条件是对任给的序列{xn}，若满足limxn(n-->∞)=x0(xn≠x0)，则有limf(xn)(n-->∞)存在。

最大、最小值定理：若函数f在闭区间[a,b]上连续，则f在[a,b]上有最大值与最小值；或称函数f在[a,b]上达到最大值。

推论（有界性定理）：若函数f在闭区间[a,b]上连续，则f在[a,b]上有界。

介值性定理：设函数f在闭区间[a,b]上连续，且f(a）≠f(b）。若μ为介于f(a）与f(b）之间的任何实数（f(a）<μμ>f(b）），则至少存在一点x0∈(a,b)使得f（x0）=μ。

根的存在定理：若函数f在闭区间[a,b]上连续，且f(a）与f(b）异号，则至少存在一点x0∈(a,b)使得f（x0）=0。即方程f(x)=0在(a,b)内至少有一个根。

反函数连续定理：若函数f在[a,b]上严格单调并连续，则反函数f^-1在其定义域[f(a),f（b）]或[f（b）,f(a)]上连续。

初等函数的连续定理：任何初等函数在它的定义域上都连续。

4、导数

导数最初定义是1823年柯西在《无穷小分析概论》中定义的：如果函数y=f(x)在变量x的两个给定的界限之间保持连续，并且我们为这样的变量指定一个包含在这两个不同界限之间的值，那么是使变量得到一个无穷小增量。

现在导数定义是19世纪60年代魏尔斯特拉斯用ε--δ语言定义的：设函数y=f(x)在点x0的某个邻域内有定义，当自变量x在x0处有增量Δx，(x0+Δx)也在该邻域内时，相应地函数增量Δy=f(x0+Δx)-f(x0),如果任意给ε>0,存在常数a和δ>0,当│Δx│<δ时,使│δy δx-a│<ε，则称函数y="f(x)在点x0处可导，并称这个极限为函数y=f(x)在点x0处的导数,记为f'(x0)，也记作y'│x=x0或dy/dx│x=x0。

导数的几何直观就是函数形成的曲线在一点的切线的斜率。

最早导数主要用于求变速运动的瞬时速度（计算弹头的穿透能力或动能必须知道弹头接触目标的瞬时速度）和求曲线上一点的切线。牛顿从第一个问题出发，莱布尼兹从第二个问题出发，分别给出了导数的概念。

牛顿的想法很直观，如一辆汽车在10小时内走了600公里，它的平均速度是60公里/小时。但在实际行驶过程中，是有快慢变化的，不都是60公里/小时。设汽车所在位置s与时间t的关系为：s=f（t）,那么汽车在由时刻t0变到t1这段时间内的平均速度是：

(f(t1)-f(t0))/(t1-t0)，当 t1与t0无限趋近于零时，汽车行驶的快慢变化就不会很大，瞬时速度就近似等于平均速度。

自然就把当 t1-->t0时的极限 lim(f(t1)-f(t0))/(t1-t0)作为汽车在时刻t0的瞬时速度，这显然就是导数。

显然根据上述定义，导数是通过极限对函数进行局部的线性逼近，所以导数是函数的局部性质。一个函数在某一点的导数描述了这个函数在这一点附近的变化率。

显然不是所有的函数都有导数（例如产生突变点，奇点的函数就没有导数），一个函数也不一定在所有的点上都有导数。

若某函数在某一点导数存在，则称其在这一点可导，否则称为不可导。显然很容易证明：可导的函数一定连续；不连续的函数一定不可导。

如果函数y=f(x)在开区间内每一点都可导，就称函数f(x)在区间内可导。这时函数y=f(x)对于区间内的每一个确定的x值，都对应着一个确定的导数，这就构成一个新的函数，这个函数为原来函数y=f(x)的导函数，记作y'、f'(x)、dy/dx或df(x)/dx，简称导数。

显然，导数运算满足一下性质：

(u+-v)’=u’+-v’；（uv）’=u’*v+u*v’；（u/v)’=(u’*v-u*v’)/v^2。

根据上导数定义和性质，很容易计算出一些常见函数的导数：

y=x^n，y'=n*x^(n-1)；
y=a^bx，y'=b*a^bx*lna；
y=a^u，y'=u’*a^u*lna；
y=e^bx，y’=b*e^bx；
y=e^u，y’=u’&e^u；
y=loga^x，y’=1/(xlna)；
y=lnx，y’=1/x；
y=sinx，y’=cosx；
y=cosx，y’=-sinx；
y=tanx，y’=sec^2(x)；
y=cotx，y’=-csc^2(x)；
y=secx，y’=secx*tanx；
y=cscx，y’=-cscx*cotx；
y=arcsinx，y’=1/(1-x^2)^1/2；
y=arccosx，y’=-1/(1-x^2)^1/2；
y=arctanx，y’=1/(1+x^2)；
y=arccotx，y’=-1/(1+x^2)；
y=shx，y’=chx。

在实际上应用中，大部分常见的函数都上述函数的和、差、积、商或相互复合的结果。所以一般情况下，函数的导函数计算是简单容易的。

导数的几个用途：

判别单调性：若导数大于零，则单调递增；若导数小于零，则单调递减；导数等于零为函数驻点，不一定为极值点。

求极值：如果存在一点，使得导数在之前区间上都大于等于零，而在之后区间上都小于等于零，那么是一个极大值点，反之则为极小值点。

自然推论：若已知函数为递增函数，则导数大于等于零；若已知函数为递减函数，则导数小于等于零。

判断函数凹凸性：如果函数的导函数在某个区间上单调递增，那么这个区间上函数是向下凹的，反之则是向上凸的。如果二阶导函数存在，如果在某个区间上二阶导数恒大于零，则这个区间上函数是向下凹的，反之这个区间上函数是向上凸的。曲线的凹凸分界点称为曲线的拐点。

导数的最著名应用是中值定理和洛必达法则。

中值定理应包括罗尔中值定理、拉格朗日中值定理、柯西中值定理、泰勒中值定理。

罗尔中值定理：如果函数f(x)满足：在闭区间[a,b]上连续；在开区间(a,b)内可导；在区间端点处的函数值相等，即f(a)=f(b)，那么在(a,b)内至少有一点ξ(a<ξ
几何上，罗尔定理含义是一条连续的曲线弧，如果除端点外处处有不垂直于x轴的切线，且两端点的纵坐标相等，则弧上至少有一点的切线是水平的。

拉格朗日定理：如果函数 f(x) 满足：在闭区间[a,b]上连续；在开区间(a,b)内可导，那么在(a,b)内至少有一点ξ(a<ξ

柯西定理：如果函数f(x)及F(x)满足：在闭区间[a,b]上连续；在开区间(a,b)内可导；对任一x∈(a,b)，F'(x)≠0，那么在(a,b) 内至少有一点ξ，使等式[f(b)-f(a)]/[F(b)-F(a)]=f'(ξ)/F'(ξ)成立。

泰勒公式：若函数f(x)在开区间（a，b）有直到n+1阶的导数，则当函数在此区间内时，可以展开为一个关于（x-x0)多项式和一个余项的和：

f(x)=f(x0)+f'(x0)(x-x0)+f''(x0)/2!*(x-x0)^2,+f'''(x0)/3!*(x-x0)^3+……+f^(n)(x0)/n!*(x-x0)^n+Rn
其中Rn=f^(n+1)(ξ)/(n+1)!*(x-x0)^(n+1)，这里ξ在x和x,0之间，该余项称为拉格朗日型的余项。
（f^(n)(x0)是f(x0)的n阶导数，不是f(n)与x0的相乘）

推论：麦克劳林公式：

若函数f(x)在开区间（a，b）有直到n+1阶的导数，则当函数在此区间内时，可以展开为一个关于x多项式和一个余项的和：
f(x)=f(0)+f'(0)x+f''(0)/2!*x^2,+f'''(0)/3!*x^3+……+f^(n)(0)/n!*x^n+Rn
其中Rn=f^(n+1)(θx)/(n+1)!*x^(n+1),这里0<θ<1。 < span="">

达布定理：若函数f(x)在[a,b]上可导,则f′(x)在[a,b]上可取f′(a)和f′(b)之间任何值。

推广：若f(x),g(x)均在[a,b]上可导,并且在[a,b]上,g′(x)≠0,则f′(x)/g′(x)可以取f′(a)/g′(a)与f′(b)/g′(b)之间任何值。

洛必达法则：设当x→a时，函数f(x)及F(x)都趋于零；在点a的去心邻域内，f'(x)及F'(x)都存在且F'(x)≠0；当x→a时limf'(x)/F'(x)存在(或为无穷大)，那么x→a时 limf(x)/F(x)=lim f'(x)/F'(x)。

又设当x→∞时，函数f(x)及F(x)都趋于零；当|x|>N时f'(x)及F'(x)都存在，且F'(x)≠0；当x→∞时limf'(x)/F'(x)存在(或为无穷大)，那么x→∞时 limf(x)/F(x)=lim f'(x)/F'(x)。

中值定理经常用于证明方程根的存在性，证明恒等式，证明不等式，研究函数的单调性，求函数极限（用罗必达法则求0/0，∞/∞函数极限是常用手段），求函数的极值与最值，讨论函数的凸凹性，求函数的拐点，求函数的渐近线，描绘函数的图象等等。具体例子可以查教科书。


也可以加一下老胡的微信
围观朋友圈~~~

推荐阅读

（点击标题可跳转阅读）

我爱线代，线代使我快乐

麻省理工学院计算机课程【中文版】

【清华大学王东老师】现代机器学习技术导论.pdf

机器学习中令你事半功倍的pipeline处理机制

机器学习避坑指南：训练集/测试集分布一致性检查

机器学习深度研究：特征选择中几个重要的统计学概念

老铁，三连支持一下，好吗？↓↓↓