开源千亿美元财富,谁能分享?
“以开发人员为中心的软件是技术领域下一个万亿美元机遇,而开源为实现这一愿景提供了路线图。”
专家的断言,让我们对开源软件的发展充满憧憬。开源软件是免费提供的,其源代码可供所有人查看、调试甚至可以分叉。但是,免费提供的开源软件,并不意味着不能产生收入。
实际上,开放源代码公司不断成功IPO,目前上市开源软件公司的估值高达上千亿美元,以12月3日为时间点,看看几大开源软件公司的市值或者估值,MongoDB(163亿美元),Elastic(116亿美元),Confluent(45亿美元),HashiCorp(53亿美元),Databricks (62亿美元)等。更别说2018年被IBM以340亿美元收购的开源公司的鼻祖Red Hat了。
这些公司如何从免费项目发展成为价值数十亿美元的呢?毫无疑问,它们实施了成功的商业模式,从而熟练地在保持开发人员满意与向公司客户收取优质产品服务费之间走了一条成功的商业路线。
一般情况下,企业家为盈利公司的开源项目创建一个可靠的治理模型,培养一个开发人员社区,以帮助其传播技术,奠定了其成长的基础。同时开放核心技术和云服务,发展商业服务内容,建立正确的业务模型,也是必不可少的。
中国软件网选择了几家不同领域成功的商业化的开源公司,揭秘其财富增长的秘密。
01
MongoDB首席客户官Richard Kreuter接受记者在线采访时表示:“MongoDB数据库设计的初衷,是为开发者及其构建的应用释放软件和数据的潜能,让开发者在构建现代化应用时更快、更便捷。”
以开发者为中心,是MongoDB作为一款开源数据库取得成功的核心。
NoSQL数据库排名第一
总部设在纽约的MongoDB 成立于2007,2017年10 月 20 日,MongoDB 在纳斯达克上市。2020年12月3日市值达到163亿美元。
几经探索,几个创始人开发了一款文档式的数据库——MongoDB,此后也成为了公司的名称和标志性产品。MongoDB的数据库产品长期位列NoSQL数据库第一,在包括全球主要的商业数据库在内,MongoDB也位列全球十大数据库之列。
MongoDB是一个文档型数据库,使用的是二进制JSON的BSON文件格式。
作为一种新的开源数据库,MongoDB有三大核心技术优势:
首先,目前,在数据库市场,除了关系型数据库以外,还出现了如键值数据库、文档数据库等十几种专属数据库类型,并且发展迅速。
MongoDB的优势是全球首创了文档模型数据库。文档模型使数据处理变得容易,因为具有灵活性,适用于广泛的用例,并很好地映射了开发人员在现代的、面向对象的编程语言中的工作方式。
与关系型SQL商业数据库最大的不同是,MongoDB数据库源于NoSQL,处理非结构化数据,Forrester Wave认为“MongoDB正在从支持简单的无模式应用,转变成为财富1000 强客户处理关键任务的数据平台。在全世界,有半数的数据和分析技术决策者都已经或正在实施 NoSQL平台。”
其次,MongoDB属于分布式系统,能够满足用户快速扩展的需求。水平扩展、冗余和工作负载隔离是现代数据库的基本要求,因此分布式架构成为一种必然选择。
相反,传统的关系数据库既缺乏灵活性,又缺乏可扩展性,这对寻求构建具有性能和规模双重优势的现代应用的企业来说,是不可回避的主要障碍。MongoDB面向文档的数据库解决了这些问题。
再次,MongoDB可以在任何地方运行。基于MongoDB,可以在笔记本电脑上进行开发,在公司数据中心中运行它,或者在公共云中对其进行管理。
管理应用程序和基础架构的复杂性呈指数增长。由于微服务、容器和其他相关技术的缘故,应用越来越细分为更小的分布式组件。
MongoDB的Atlas云数据库,一项全面托管的服务,可帮助客户避免自行处理分布式数据库的麻烦。
应对竞争,修改许可协议
虽然MongoDB作为开源文档型NoSQL 数据库,在各方面表现都还不错,但一度苦于一个问题——包括 AWS、IBM Cloud、Scalegrid 和ObjectRocket 等云计算厂商都借开源版本为客户提供服务而赚得盆满钵满,但 MongoDB 却远未能实现同等程度的收益。
面对利益侵占失衡,MongoDB最终选择修改了开源协议。2018年,MongoDB选择将其开源许可证从 GNU AGPLv3 切换到 Server Side Public License (SSPL),即服务器端公共许可证,它将适用于其 MongoDB 社区服务器的所有新版本,以及先前的所有补丁修复版本。
许可证更改并不影响使用社区服务器的常规用户。根据MongoDB之前的GNU AGPLv3 协议,想要将 MongoDB 作为公共服务运行的公司必须将他们的软件开源,或需要从 MongoDB 获得商业许可。
尽管 SSPL 与 GNU GPLv3 没有什么不同,但SSPL明确要求托管 MongoDB 实例的云计算公司要么从 MongoDB 获取商业许可证,要么向社区开源其服务代码。
修改许可协议后,MongoDB迎来了发展的春天,发展明显加快。与云服务商的合作反而更顺畅了。
向云发展
目前云计算公司,不管是国外的AWS、微软Azure,还是阿里云、腾讯云、华为云、青云等都大力度推出云数据库服务产品。
数据库上云成为了云计算公司的共识。MongoDB于2016推出了MongoDB的云版本——Atlas。Atlas的产品可以跨多个云平台,给客户带来了更多的便利和好处,提供了更多的选择。
优势之一就是MongoDB Atlas通过支持多云集群,能够更好地满足如高可用性、备份和专业分析等目标工作负载。借助MongoDB Atlas,企业首次可以同时横跨AWS、Google Cloud和Microsoft Azure,在不同的云提供商上部署完全托管的分布式数据库,而无需增加管理数据复制和跨云迁移的操作复杂性。
目前Atlas已经落户AWS、微软Azure、谷歌GCP,用户可以在喜欢的全球云服务提供商的任何云中使用MongoDB的解决方案,并成为MongoDB的主要收入来源,在2021财年第一季度营收中占比42%。
在今年MongoDB.Live 2020上,MongoDB不仅发布了新的品牌——MongoDB Cloud,还有众多重要发布,包括Atlas众多新的功能,如Atlas Search、Atlas Data Lake、Atlas Online Archive,以及MongoDB Realm、MongoDB Charts、MongoDB Shell等。
使用MongoDB Cloud,开发人员不需要在多种技术、查询语言和数据模型之间来回切换,进而大幅度降低开发人员的学习负担。
02
在DB-Engines搜索平台排行榜上,Elastic的开源项目Elasticsearch总是位列首位,成为目前选用数量比较多的大数据搜索平台。
开源+大数据+搜索
在企业领域,搜索与云计算、大数据、物联网等技术,以及开源商业模式的结合,诞生了Elastic。
在荷兰诞生在美国成长的Elastic,就是一手抓住搜索,一手抓住开源,利用创新的搜索引擎技术和开源软件,被全球被数以百万计的开发人员和成千上万的客户所信赖,成为大数据搜索和数据实时处理领域的头部企业。
2018年10月,公司成功在纽约证券交易所上市。2020年12月3日,Elastic的市值116亿美元。
“独特”产品
除了开源的Elasticsearch外,Elastic还推出了Kibana、Logstash、Beats、Elastic Stack等商业产品,广泛运用在大数据实时分析领域,包括日志分析、指标监控、信息安全等多个领域。
这些产品可以帮助用户探索海量结构化、非结构化数据,按需创建可视化报表,对监控数据设置报警阈值,甚至通过使用机器学习技术,自动识别异常状况。
Elastic一个独特的地方是满足了市场上大数据业务刚需场景,即时消费、即时应用时最大的需求是对大数据进行快速搜索,实时进行处理,对数据异常进行监控、预警、提醒,对数据的关联性进行分析。
Elastic相对业界的搜索和大数据处理两个领域,具有无法替代的三个优势:
一是能进行数据相关性分析。目前用户应用的数据来源多样化,有可能来自传感器、物联网、车联网、空间数据、地理信息、时间信息等;
数据形式和种类多样化,非结构化数据占据大部分,数据获取、转化工具不够实时;
数据包括时间、空间、地理等多个维度,大数据的分析复杂、多变。
目前所用的数据库软件很难对多种数据类型进行统一管理、处理和预警。Elastic却能对所有这些数据类型进行管理和实时处理,进行关联分析,并进行预警和深度挖掘。
二是速度快。目前的大数据应用,数据处理与分析的速度相对比较慢,一个数据分析的操作快的要一二十分钟,慢点的则达几个小时。Elastic的数据搜索和分析处理却是实时的,是毫秒级的速度。
三是可扩展性。传统的大数据应用采用集中式管理,当数据量增加时,会不断增加数据库服务器,成本增加,管理和处理难度增加,还难以满足用户的需求。
Elastic则采用了分布式结构,支持不同规模的应用,并可以根据应用弹性扩展,可以迅速将规模扩展到不通规模的服务器。
“独特”的商业模式
Elastic横跨开源和闭源两种软件商业模式。其中,核心产品是开源的,用户可以自由下载或者使用。而闭源的是商业化的产品,包括核心商业插件、高附加值产品等。
作为一家搜索公司,Elastic提供开源的Elastic Stack,包括Elasticsearch、Kibana、Beats、Logstash(ELKB),同时提供商业功能,包含商业插件和原厂支持的商业订阅,以及SaaS产品Elastic Cloud,包括托管Elasticsearch服务、应用程序搜索服务、网站搜索服务等。
Elastic的主营业务收入包括总订阅收入(许可证收入License+订阅收入Subscription)与服务支持收入(Professional Service);专业服务收入主要来自于咨询服务、培训业务等。
Elastic选择开源技术,未来也会坚持开源。超过10万开发者的社区、超过3.5亿的产品下载和7000多家客户,为Elastic贡献了代码和大量的应用场景。
同时,基于开源的特性,Elastic形成一种自下而上的销售策略,潜在客户即为经常使用Elastic的技术人员,通过一系列销售和营销手段逐步渗透,为核心客户群提供更有效的企业级服务支撑,稳固其商业模式。
03
为对抗操作系统领域的商业软件——微软Windows系统,Linux操作系统诞生了,并开创了开源软件新模式。
借助开源软件,国外的红帽Red Hat、Suse等茁壮成长,而国内则出现麒麟、红旗等基于开源Linux的国产操作系统。
从Linux向云服务完美转身
Red Hat早期的业务重点是Linux操作系统发行版,虽然历经坎坷,但它坚持下来了,销售收入一度超过10亿美元。
作为最成功的开源技术公司,红帽的旗舰产品包括Red Hat Enterprise Linux、Red Hat OpenShift,以及Red Hat Advanced Cluster Manager(ACM)等。在开源基础上发展自己的产品,是红帽最成功的商业模式。
到2018年,红帽公司已成为一家庞大的公司,并以340亿美元的高价被IBM收购。这是蓝色巨人107年来最大的一笔收购。
340亿美元的价值不菲,几乎是Red Hat在2017年收入的12倍。
然而此举并没有让业界感到惊讶。一方面,IBM在20多年前就已经接受了开源;另一方面,红帽有这个实力,特别是在云服务领域。红帽比任何人都知道如何更好地从开源中获取收入。
收购红帽的Openshift让IBM成为了混合云的头号供应商,而测算的混合云的市场规模高达万亿美元。
同样在Linux操作系统非常成功的Suse,也被多次转卖,2018年以 25.35 亿美元的价格将 Suse Linux 的业务出售给 EQT。
混合云与开源协同效应融合
IBM和Red Hat两家公司都从不同角度发展混合云。RedHat通过OpenShift提供了一个中间件环境,而IBM在其云产品中为企业客户提供整体解决方案。
两家公司在创建和贡献开源软件OSS项目方面都有很长的记录,特别是Red Hat是有史以来最成功的Linux驱动的开源公司。
收购使两家公司在混合云和软件开发方面都能发挥各自更大的作用。
正像微软收购GitHub以促进Azure上的开源活动一样,IBM一直努力与公有云市场中的AWS、Microsoft和Google保持同步。
在Forrester对仅适用于公有云开发的平台和企业容器平台的评估中,IBM和Red Hat的表现都很好。通过收购RedHat,IBM将拥有领先的Kubernetes和基于容器的云原生开发平台,以及比任何一家公司都广泛的开源中间件和开发人员工具产品组合。IBM将有效地在云开发平台市场中获制高点。
IBM公司正在使用开源软件在云上构建未来。与任何其他软件公司一样,从OSS获得收入是IBM的一项关键生存技能。
通过将DNA注入云、战略和销售组织中,RedHat为IBM提供了急需的推动力。
IBM分拆,红帽成为新公司的核心
当今年10月IBM决定将公司分拆为两家公司时,从IBM咨询业务中分离出来的新IBM可以围绕Red Hat展开故事。Red Hat是Linux操作系统及其OpenShift云管理软件的领导者。除了VMware之外,红帽在其混合云解决方案的广度方面几乎没有竞争对手。
克里希纳推出一系列具体行动,包括加强对IBM两大战略——混合云和人工智能,由IBM和红帽把Linux、容器和Kubernetes建立为新的标准,让Red Hat OpenShift成为混合云的默认选择。
借助红帽提供的云原生工具,客户可以快速开发各种应用,并能提供满足具体业务场景的服务。
04
大数据几乎是每个企业推动变革的动力。它不仅创造了新业态,而且还革新了现有产业。大数据使像滴滴出行或Airbnb这样的公司成为可能,并使诸如Google、Facebook和Amazon之类的现有公司使用数据来创建数百亿美元的业务。
发展Spark大数据应用基础平台
总部位于美国旧金山的大数据与数据分析初创公司Databricks由Ghodsi及其同事于2013年在加州大学伯克利分校创立的。自那时以来,公司已经筹集了近9亿美元,使公司的估值翻了一倍多,达到62亿美元。
2018年,Databricks从尼尔森、Overstock和壳牌等客户的收入超过1亿美元。它计划在亚洲、欧洲、中东、非洲和拉丁美洲等寻求海外发展。
Spark是2009年在伯克利开始一个开源项目,是大数据应用重要的开源项目。
Databricks提供了一个基于Spark的云托管平台,该平台使客户可以在一个环境中实施其整个大数据管道——从数据提取、数据转换、交互式处理到数据产品。它使用机器学习、图形处理以及构建和运行数据产品来提供交互式可视化,能够释放其数据的价值。
Databricks Cloud先进的群集管理功能使企业能够在几秒钟内启动,并调整大小和拆除群集。最重要的是,它丰富的工具集使企业可以交互式查询和可视化数据并构建交互式仪表板。
“我们成立该公司的目的是继续加速Spark的改进,增加程序的功能、稳定性和对开源社区的贡献。另一方面是将其放在易于使用的软件包中,那就是Databricks云服务。”
Databricks首席执行官Ali Ghodsi
迅速进入机器学习
Databricks致力于将Apache Spark商业化,并迅速进入机器学习领域,开发了MLflow,这是一种开放源代码工具包,用于数据科学家管理机器学习模型的生命周期。
与传统软件开发不同,机器学习依赖大量工具。对于构建模型所涉及的每个阶段,数据科学家至少使用六个工具。在确定合适的工具箱和框架之前,每个阶段都需要进行广泛的试验。工具的分散性以及快速迭代的需要使机器学习变得极为复杂。
Databricks的MLflow旨在通过与各种工具和框架进行对话的抽象层来降低复杂性。个人数据科学家,甚至参与构建机器学习模型的大型团队,都可以有效地使用该工具包。
MLflow解决了构建和管理ML模型的三个基本挑战:
1)洞察每个参数和超参数对模型的影响方式;
2)在演化模型时进行实验的一致方式;
3)在多个环境中进行推理模型的简化。
与云服务商合作
目前一些商业开源公司正在尝试与云服务商合作的方法:如果您无法击败云服务商,那就加入他们。这几家开源商业公司没有试图与云服务商对抗,而是找到了创建互惠互利的业务模型的方法。
这种策略的一个很好的例子就是Databricks与Microsoft Azure合作。Databricks用户可以直接通过其Azure帐户购买其产品。本质上,Azure已成为Databricks产品的分销商,以增加双方的收入。
Azure还获得了通过每个新的Azure上Databricks群集出售更多计算基础结构和存储的好处。当然,此模型的挑战是要有足够的杠杆作用来协商公平的收益分享协议。
因为Databricks是一家非常成功的开源公司,拥有庞大且忠诚的开发人员社区,因此它具有与Microsoft进行谈判的足够的市场份额与影响力。
幸福的家庭都是相似的,不幸的家庭各有各的不幸。这样的规律,在开源软件领域也得到了验证,成功的开源商业软件公司是相似的,独特的产品与服务,共赢的商业模式,健硕的开发社区等等都是其成功的基础。