深度:中国机器学习行业市场分析
机器学习指专门研究计算机怎样模拟或实现人类的学习行为以获取新的知识或技能的学科,使计算机重新组织已有的知识结构并不断改善自身的性能。机器学习以数据为基础,通过研究样本数据寻找规律,并根据所得规律对未来数据进行预测。机器学习是人工智能的核心,广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别等人工智能领域。
(1)按学习模式的不同,机器学习可分为监督学习、无监督学习、强化学习:
①监督学习的训练数据具有分类标签,分类标签精确度越高,学习模型准确度越高。监督学习根据给定的训练数据建立函数模型,可实现对新数据的标记映射。监督学习的算法包括回归和分类,应用领域包括自然语言处理、信息检索、文本挖掘、手写体辨识、垃圾邮件侦测等。
②无监督学习利用无标记的有限数据描述隐藏于数据中的结构或规律,其典型算法为聚类。无监督学习无需以人工标注数据为训练样本,可避免正、负样本偏移引起的分类错误问题。无监督学习的应用领域包括经济预测、异常检测、数据挖掘、图像处理、模式识别等。
③强化学习指智能体在与环境的交互过程中达成回报最大化的学习模式。强化学习以外部环境对智能体评价达到最优为目标。强化学习广泛应用于机器人控制、无人驾驶、工业控制等领域。
(2)按算法网络深度的不同,机器学习可分为浅层学习和深度学习:
①浅层学习算法网络的隐藏层数量少,算法框架简单,无需提取多层次抽象特征。典型的浅层学习包括支持向量机、逻辑回归等。
②深度学习是一种基于多层神经网络并以海量数据为输入规则的自学习方法,依靠提供给它的大量实际行为数据,即训练数据集,进行规则中的参数和规则调整。深度学习算法网络的隐藏层数量多,算法复杂,相比浅层学习,深度学习更注重特征学习的重要性。
典型的深度学习算法包括卷积神经网络、循环神经网络等。
机器学习产业链包括上游的人工智能芯片供应商、云计算平台服务商、大数据服务商,中游的机器学习技术服务商以及下游的机器学习应用服务商。机器学习产业链上游为支持基础层,上游的人工智能芯片供应商主要负责提供GPU、ASIC、FPGA等人工智能专用芯片,大数据服务商提供的服务包括数据采集、数据处理、数据存储、数据交易等,云计算平台服务商提供的服务包括IaaS、PaaS、SaaS等。
产业链中游为技术层,中游的机器学习技术服务商为下游的机器学习应用服务商提供机器学习基础开源框架、机器学习技术开放平台等机器学习技术服务。
产业链下游为应用层,下游的应用服务商为最终用户提供基于机器学习的垂直领域应用服务,机器学习的垂直应用领域包括金融、教育、医疗、零售、工业等。
(1)人工智能芯片供应商
人工智能芯片是机器学习产业链的核心底层硬件,为机器学习应用提供算力基础。按技术架构的不同,人工智能芯片可分为GPU、ASIC、FPGA。
GPU具有软件生态齐全、并行计算能力强的特点,是现阶段深度学习训练的首选芯片。
GPU是一种具有大规模并行计算架构,专为同时处理多重任务而设计的芯片,其发展时间长,产品成熟,支持 CUDA统一架构、OpenCL架构等编程环境,编程语言成熟易用,便于开发者开发应用。此外,GPU的峰值计算能力强,处理速度可达CPU的10 至100倍,适用于并行计算大规模数据,可显著加快深度学习计算速度。
ASIC是全定制化的人工智能芯片,具有体积小、功耗低、通信效率高、计算速度快等特点。ASIC是为符合特定用户需求而定制的专用人工智能芯片,其计算能力和通信效率均可通过算法进行定制,专用化、定制化的设计将数据传输时间和数据等待时间压制到最低,显著提升芯片性能与运行速率。ASIC的主要类型包括TPU、BPU和NPU,其中,TPU为谷歌于2016年研发的专用于机器学习的ASIC芯片。
FPGA可灵活编译,处理效率高,适用于深度学习预测。FPGA指现场可编程门阵列,是在可编程器件的基础上进一步发展的半定制电路,其处理重复计算指令能力强,相比GPU,“CPU+FPGA”混合异构的功耗更低,运用于深度学习预测的效率更高,性能优势更突出。
现阶段,人工智能芯片市场由海外厂商主导,中国厂商的发展步伐逐步加快,但和海外头部厂商相比仍有明显差距。
海外头部厂商包括英伟达、英特尔、IBM、谷歌、微软、高通等,英伟达于2018年推出新一代GPU产品NVIDIATeslaV100,英特尔通过收购Altera、Nervana、eASIC、NetSpeedSystems等芯片组厂商布局人工智能芯片产品线,谷歌于2018年发布其第三代人工智能专用处理器TPU3.0,苹果于2018年发布的新款iphone手机均搭载了A12仿生芯片,IBM的人工智能团队于2018年利用大规模模拟存储器阵列训练深度神经网络,达到与GPU相当的精度。
中国人工智能芯片厂商着重布局边缘端芯片产品,针对安防、自动驾驶、智能家居、物联网等领域的终端设备开发专用的人工智能芯片,代表厂商包括中星微、华为海思、瑞芯微、寒武纪、地平线、深鉴科技、云之声、旷视科技等,中国人工智能芯片市场以初创型厂商居多。
(2)云计算平台服务商
云计算是一种可迅速提供并发布网络、服务器、储存、应用等计算资源的模型,用户可通过网络按需访问计算资源共享池,实现管理成本或服务供应商干预最小化。按部署方式的不同,云计算可分为公有云、私有云、混合云,公有云指利用公共网络向客户提供具有弹性的计算资源和服务,现阶段的云计算服务市场以公有云服务为主。按服务模式的不同,云计算可分为IaaS、PaaS、SaaS。
①IaaS(InfrastructureasaService,基础设施即服务)是将通用计算、储存、网
络以及其他基础硬件资源虚拟化后,以出租的方式提供给客户的服务模式。典型的
IaaS服务有亚马逊的AWS,阿里云的弹性主机服务等。
②PaaS(PlatformasaService,平台即服务)指为开发者提供应用服务运行和开
发环境的服务模式。典型的PaaS服务有Google的GoogleAppEngine平台服
务、阿里云的量子计算云平台等。
③SaaS(SoftwareasaService,软件即服务)指直接通过网络为客户提供软件服
务的商业模式。典型的SaaS服务有Salesforce的CRM,Workday的HRM,用
友的云ERP等。
(3)大数据服务商
大数据服务商提供的服务包括数据采集、数据处理、数据存储、数据交易等,其类型包括学术机构、数据外包服务公司、人工智能应用服务公司。
学术机构通过自行采集、标注大量数据来建立学术研究数据库,以用于算法的创新性验证、学术竞赛等,该类数据库迭代速度慢,商业应用场景有限,典型代表有ImageNet。
数据外包服务公司是最常见的大数据服务商类型,其业务类型包括出售现成数据训练集的使用授权以及根据用户特定需求提供数据采集、数据标注、数据转写等服务。
人工智能应用服务公司同是大数据服务的需求方和供给方,除购买数据外包服务公司的相关服务外,人工智能应用服务公司还通过自建数据服务团队来构建自用数据库,部分人工智能应用服务公司将自建数据库包装成产品出售,大数据服务成为其业务板块之一。
机器学习基础开源框架是构建机器学习模型的重要根基,市场中的机器学习基础开源框架产品繁多,市场竞争激烈,谷歌、亚马逊、Facebook等互联网巨头在机器学习基础开源框架领域具有领先优势。
谷歌于2016年推出机器学习系统开源工具TensorFlow,适用于智能手机、大型数据中心服务器等各类硬件设备,市场关注度不断提升。MXNet是亚马逊的机器学习基础开源框架产品,其适用于Python,R,Julia,Scala,Javascript等语言,可在多个CPU、GPU设备上进行分布式训练,运算效率优势突出。Facebook于2018年推出机器学习基础开源框架产品Pytorch,该产品通用性强,语言简单,用户数量逐渐增多。
其他机器学习基础开源框架典型代表产品有Theano、Caffe、Keras等。
机器学习技术开放平台为开发者提供基于机器学习的应用开发环境,可简化开发者对算法的接口调用、可视化、参数调优等自动化任务的管理。典型的机器学习技术开放平台包括亚马逊的Amazon Machine Learning、微软的Azure机器学习工作台、腾讯的DI-X机器学习平台、阿里云机器学习 PAI等。
作为机器学习领域的主流算法之一,深度学习凭借其适应性强、准确率高等特点获得市场高度关注,应用领域不断拓宽,其在图像识别、语音识别、人脸识别等领域的应用逐步加深,发展步伐显著加快,深度学习的迅速发展是推动机器学习行业升级发展的重要因素。
在机器学习市场中,基础层核心芯片被英伟达、英特尔、IBM、谷歌、微软、高通等海外传统芯片大厂商掌控,云计算由谷歌、亚马逊、阿里云等互联网巨头引领,大数据服务商数量多,分布零散,市场竞争激烈。
技术层机器学习基础开源框架以谷歌的TensorFlow、亚马逊的MXNet、Facebook的Pytorch、Theano、Caffe、Keras等为主,机器学习技术开放平台主流产品包括亚马逊的AmazonMachineLearning、微软的Azure机器学习工作台、腾讯的DI-X机器学习平台、阿里云机器学习 PAI等。应用层以初创型厂商居多,市场竞争最为激烈,典型代表厂商包括商汤科技、依图科技、云从科技、第四范式、寒武纪、深鉴科技等。
参考来源:中国机器学习行业市场研究
转载申明:转载本号文章请注明作者和来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。
推荐阅读
更多架构相关技术知识总结请参考“架构师技术全联盟书店”相关电子书(35本技术资料打包汇总详情可通过“阅读原文”获取)。
全店内容持续更新,现下单“架构师技术全店打包汇总(全)”,后续可享全店内容更新“免费”赠阅,价格仅收188元(原总价290元)。
温馨提示:
扫描二维码关注公众号,点击阅读原文链接获取“架构师技术全店资料打包汇总(全)”电子书资料详情。