这里是Z哥的个人公众号
每周五11:45 按时送达
当然了,也会时不时加个餐~
我的第「226」篇原创敬上
吴军老师的大名相信在互联网行业里的大多数人都知道,他也是我在得到学习时最喜欢的老师之一。《数学之美》这本书买来在书架上放了很长时间了,一直没看。虽然在很多地方看到有人推荐它,但是我认为这本书毕竟还是属于工具类的,对于我之前来说用处不大,所以没有动力马上看。最近正好在研究大数据处理方面的事情,所以从书架上找出来翻了翻,看看有哪些知识是可以立马用起来的。总的来说,对这本书的评价算是符合预期吧,但没有高出太多。不过这本书的确写得非常深入浅出,阅读起来还是比较轻松的,这也体现了吴军老师的知识深度和写作功底。下面我来分享一些其中的精华,如果你没有看过这本书的话,相信能给你开拓一下思路。我一直认为,大道至简,至简的知识往往也是通用的,在很多地方都可以运用。文中的不少例子也进一步证实了这点,比如:不管是中文还是英文还是大多数的其他语言,你会发现常用的那些字和词都比较短,而冷门的往往都比较长,这背后的道理其实和信息论中的最短编码原理是相同的。
另外「聚类」也是如此。用大白话来说,聚类就是归类。有很多大数据应用中用到了这个原理。而这个原理最早被使用的时候,可以追溯到古埃及的象形文字中,读音相同的词会用同一个符号来表示。「人工智能」不是真的是模拟人脑运作的智能,而是基于大数据,运用「统计」的方式所形成的“智能”。但是我相信任何一个人第一眼看到「人工智能」这个词,想到的肯定是认为计算机可以模拟人脑运作,最早的一批人工智能科学家们也是以这个思路展开工作的,所以直到他们年事已高,退出舞台之后,基于统计模式的人工智能才真正迎来了快速发展,直到如今覆盖了我们生活的很多方面。如果你作为一位有经验的人给一位新人建议时,多说说不要做什么,比说要做什么更有价值。因为避免去做那些不要做的事情,可以避免浪费时间,但是做一件事的最优方式,可能会随着时间的变化而变化。科学上的很多发展也印证了这个道理,不少后人推翻了前人的研究结论。但是曾经排除的错误方向,总是长期有效的。用「信息熵」来度量。一段文字所包含的信息就是它的信息熵,也就是文字编码后的最短长度。用大白话来说:前面提到的「聚类」可以简化信息的记录,但同时也带来了歧义的问题,而解决歧义的方法则是利用上下文。基于上下文这个概念衍生出了很多定理、概念和假设,比如人工智能中特别著名的「马尔可夫假设」。「马尔可夫假设」其实就是假设一个节点在某个时刻的状态只与它的上一个状态相关。基于马尔可夫假设,又有几个衍生的概念,贝叶斯网络、条件随机场和神经网络。他们三者之间的区别是:- 神经网络是一个分层的有向图,牺牲了贝叶斯网络的灵活性换来了效率和标准化。
1. 知道了怎么看罗马数字,小数出现在大数左侧为减,右侧为加。比如,IV表示 5 - 1 = 4,VII 表示 5 + 2 = 7。这下看手表的时候再也不用在脑子里自动转换成阿拉伯数字的钟表了。2. 地址的识别是一个从左往右的有序过程,所以可以用一个有限状态机来实现。比如,XX 省后面可以出现 XX 市,但是 XX 市后面不能出现 XX 省。3. 美国人总是倾向于用机器代替人工来做事情。虽然短期内需要做一些额外的事情,但是从长期来看可以节省很多时间和成本。这也是 Z 哥之前一直提倡大家需要具备的「工具化思维」。4. 好方法往往是简单的,比如在工业界实现一个功能,先帮助用户解决 80 %的问题,再慢慢解决剩下的 20 %是一个非常有效的原则。5. 在没有数据之前不要给出任何结论,因为结论很多时候与直觉是相反的。最后是一个 Z 哥自己的领悟。在人工智能领域,算法是“术”,在没有新的“道”出现,来进入一个新的时代之前,剩下比拼的是数据。这其实和一个人生哲学类似:在一个方法大家都知道的情况下,比拼的就是谁实战用得多。
推荐阅读:
原创不易,如果你觉得这篇文章还不错,就「点赞」或者「在看」一下吧,鼓励我的创作 :)
也可以分享我的公众号名片给有需要的朋友们。
如果你有关于软件架构、分布式系统、产品、运营的困惑
可以试试点击「阅读原文」