挖掘数据要素潜能,助力产业革新升级

共 9980字,需浏览 20分钟

 ·

2023-10-26 18:18



2023全球数商大会即将举办,亿欧采访了多家大数据企业,以梳理目前数据要素产业发展图景。


文 | 黄岚清



2022年12月,“数据二十条”出台,明确提出激活数据要素潜能,做强做优做大数字经济,增强经济发展新动能,构筑国家竞争新优势。2023全球数商大会即将举办,亿欧采访了多家大数据企业,以梳理目前数据要素产业发展图景。


数据要素在2020年正式成为第五生产要素,成为数字时代的竞争焦点。“数据二十条”的出台对数据基础制度建设系统化提出指导意见,构建了以数据产权、流通交易、收益分配、安全治理为核心的四个数据基础制度,随后相关政策细则迭出。


近年来,国家高度重视数据要素及其市场化配置改革,出台了多项数据要素相关政策。进入数字时代,做强做优做大数字经济,是把握时机、赢得未来的重要选择。


数据标准化、数据资源要素化,建立多层次的数据流通交易市场是一个复杂艰巨的任务,除了政府端,数据服务商和投资方也在数据要素产业发展中扮演着极为重要的“赋能者”角色,将数据要素标准化、资源化使其具有流通性和价值性,努力发挥国内海量数据规模和丰富应用场景优势,增加数据价值,促进生产效率。


01

炎凰数据赋能高效探索数据价值


数据可以分为结构化、半结构化和非结构化数据三类,其中结构化数据是目前应用最广泛的主流数据库。近年来,随着全球各个行业的数字化进程推进以及智能物联场景的广泛普及,产生了大量的半结构化数据和非结构化数据。


在异构数据大规模增长的情况下,传统的数据处理和分析方式无法通过预先规划的方式对非结构化数据进行分析,需要耗费更多的时间和人力来获得分析结果,一个项目工程的实施周期需要以周或者月为单位计算。


更大的弊端在于,当获取结果后提出新的数据需求,该项目工程可能需要重新将原始数据写入数据库,实施周期需要翻倍或者更多。


作为国内非结构数据处理技术的领头企业,炎凰数据专注异构数据处理,通过读时建模、处理半结构化数据的SQL引擎等核心技术为客户提供实时交互分析、异构数据融合的解决方案。为解决快速查询分析异构数据的需求,炎凰数据搭建了独立的数据库,结合查询引擎和计算引擎,通过全链路自研实现算法和数据库相互优化,从而满足对原始数据快速查询分析的需求。


其中,实现异构数据即时分析的核心技术是读时建模。与传统写时建模的技术实现逻辑不同,读时建模是指在数据接入时不进行清洗将原始数据直接存入系统,用户可以根据业务需求用标准化数据库查询语言访问原始数据,系统根据算法抽取所需数据展现。


读时建模的技术壁垒较高,炎凰创始团队来自Splunk,在数据引擎开发的实力强劲、经验丰富。成立三年,炎凰团队一直专注产品研发,目前国内没有其他通过读时建模实现的软件产品。


相比于传统的数字工具,炎凰异构数据即时分析平台以读时建模为核心,在传统应用场景下可以提高效率、降低成本,缩短实施和部署时间缩短至以天甚至更小单位的实施周期。


同时,炎凰数据平台还可以满足用户快速更新迭代需求,由于不需要经过数据写入、清洗再读取、分析的固定路径,所以可以更加灵活、高效地完成建模过程。炎凰数据平台不仅能满足大规模的数据清洗和快速迭代的数据建模,其高效的优势还能够满足传统工具无法实现的应用需求。


炎凰数据CEO叶晓路介绍,“在安全场景下,当企业内部系统出现安全漏洞时需要系统快速发现并定位问题,而传统工具需要几周甚至更长的时间,响应时间过长会导致巨量的损失。对于炎凰数据平台在时间周期上可以提高1-2个数量级。”


截至目前,炎凰数据平台已更新至2.12版本,完成存储端和计算端的分布式,持续优化查询性能,不仅可以满足日增数据量增长的需求,还可以通过增加节点缩短用户的等待时间,实现秒级到亚秒级的响应时间完成查询。


针对数据安全问题,炎凰在创建之初就对产品内部包括数据导入、数据审查和展示视图等权限以及角色管理进行了详细规划并在开发上投入大量人力。


关于软件代码漏洞问题,叶晓路表示,“我们的产品核心组件完全自研,产品依赖开源产品的部分占整体体量不超过5%,所以市场上的开源产品出现漏洞时,我们不需要等待漏洞修复,并且在产品版本发布前,我们会使用主流的商用开源工具对产品进行全代码扫描,在交付时会主动向客户提供安全漏洞扫描报告。”


为了更好的国内用户,炎凰数据在融资时选择人民币基金,明确定位要做国内市场,坚持打造国产自主可控软件,满足国内信息安全标准。


未来,炎凰数据将持续优化产品性能,让每一家企业轻松实现数字化转型,为数字化决策提供高效高能的生产工具。


02

富数科技赋能安全实现数据价值


在数据流通的实践中,为保障数据隐私安全问题衍生出了“原始数据不出域,数据可用不可见,可算不可识”的要求。除了在技术上满足数据不出域的要求,隐私安全计算在经济收益上为数据源提供保障,在法理上实现所有权和使用权分离。


作为隐私安全计算领域的科技服务商,富数科技专注于联邦学习、多方安全计算、匿踪查询等加密计算领域,是国内隐私安全计算的领跑者和数联网的先行先试者。


在技术层面,富数科技组建了国内少有的密码学专家团队,团队由来学嘉教授领衔,吸纳了二十多位密码学算法背景的博士。


作为科技部国家课题承担单位和工信部大数据示范单位,富数科技积极推动国内外相关技术规范的制定,是隐私计算互联互通首个国家标准的牵头单位。目前,富数科技Avatar隐私计算平台已经从“企业级”发展为“运营商级”隐私计算平台,支持海量数据多场景的大规模应用推广。已经成功中标了中国移动、银联集团、交通银行、邮储银行、中信银行等数十个大型隐私计算平台建设。


在生态层面,富数科技已经对接了丰富的数据源方和数据使用方,落地场景覆盖金融、政务、运营商、电力等各个数据相关领域。在金融领域中,富数科技以技术支持方助力交通银行实现国内第一例多方安全计算,助力交通银行获得2020年度人民银行金融科技发展奖一等奖,引发了金融行业隐私计算平台建设的热潮。


富数科技在隐私安全计算应用有丰富的实践经验,富数科技CEO张伟奇表示,“目前看来,参与数据要素开展还是以大型央企、国企和地方政府为主,这一类客户对于安全性和产品性能、稳定性的要求比较高,而数据安全和产品性能存在一定矛盾,因此需要考虑安全的深度能力和性能的极值情况。”


富数科技根据具体场景出发,将安全计算平台拆分为多个专用产品,通过工具组合解决实际问题。其中,安全多方计算主要解决在各方原数据不泄露的前提下,完成联合计算统计的任务;联邦学习主要解决两边数据都不出域的情况下,实现建模计算获得数据挖掘的结果,可用于运营商与银行针对信用卡贷款的联合建模;匿踪查询主要解决对数据方加密的情况下,获得查询结果反馈,可用于银行联盟进行联防联控反诈的场景。


目前国内处于数据流通交易市场的探索期,正在逐步完善市场交易机制和监管机制,张伟奇表示,“非常明确的一点是数据需要流通,而原本点对点的流通形式存在合规流程长、数据流通的运营商专线成本高、模型有效性评估效率低等困难。因此,建立网络化数据流通基础设施是必然趋势,在数据要素流通的顶层设计来看,国家数据交易所的建立将逐步完善市场监督管理,通过接入网络即可在高效率、低成本、可信赖的市场中体现数据价值。”


为提供低成本、高效率、可信赖的数据流通解决方案,运营商基于隐私计算、区块链、低代码开发等核心技术打造了可信数据流通基础措施——数联网,实现数据价值的网状流通。其中,富数科技作为运营商的合作伙伴提供相应的基础支撑,在保证数据安全的前提下,充分发挥数据要素价值,助力国家数字化转型发展。


面向未来,张伟奇表示,“我们认为未来中国的数据要素至少是十万亿级的产业规模,作为数据服务商,我们将发挥自身优势,持续提升隐私计算技术,打造在数联网中演变出数据路由器等产品形态,与运营商、地方政府共同推动探索互联互通数据生态建设。为适配未来发展,在商业模式上,在成熟应用的领域通过产品标准化的形式降低边际成本,对于新领域新需求将通过项目平台化的形式提升服务,围绕客户和市场实际提供解决方案。”


03

容亿投资赋能数字科技企业发展


作为炎凰数据和富数科技的投资方,容亿投资源自产业,重点布局硬科技和数字科技两大领域,在数字科技领域围绕数据要素产业链,聚焦数字化能力和产业数字化两大板块,在数源、数商、数基等细分领域布局深厚。


数据作为新型生产要素,在过去的一年中一直被强调也逐渐成为共识,是数字经济深化发展的核心引擎。


容亿投资执行董事闻茗萱表示:“追溯历史,农业社会中的生产要素是土地和人力,文明的进化受限于土地和人力,古代社会呈线性发展;工业革命之后,人类社会进入到工业社会,人类文明通过技术和资本的配置摆脱了土地和人力的约束,呈指数性发展;在20世纪90年代互联网信息革命后,社会的发展空间从原来的物理空间拓展到了虚拟的数字世界,数字世界承载了人类一切需求活动的根基和映射,因此如何利用好数字资源是未来数字社会向前发展的根基。”


对于今年的数字经济趋势变化,闻茗萱观察到由OpenAI训练的ChatGPT已达到万亿级,参数模型的训练将成为未来数据奇点的应用。


去年年底国家公布的“数据20条”的核心主线是促进数据合规高效流通使用,赋能实体经济,随后各地发改委或者数据局都在推动相关的细节性政策落地,这将会极大推动数据交易流通。


闻茗萱表示,目前,数据要素产业要真正发展任重而道远,因为政府和企业都要转型为数据要素型组织,需要他们做好数据管理的组织文化和机制建设,建立跨部门的数据资产委员会,将数据管理制度嵌入到组织日常流程中,基于数据的合规控制与业务结合,将组织资产数据要素当做资产的一部分。未来,数据互通互联,对于每一个数据要素型组织而言,绘制数字资产地图是数据要素化的首要任务。他们需要把各个业务场景下所处理的各类数据纳入统一管理范畴,针对内外环境变化动态盘点,同时对数据进行分类分级从而识别不同数据的不同风险以及合规义务。


数字经济在数据要素大模型的推动下全面进入数据要素时代。


在互联网时代,数据存在垄断封闭的现象,而在数据要素时代则需要数据开放共享,因此在金融或者工业等非互联网场景会最先落地,先以行业为核心汇总数据实现行业内流转,再延伸至跨行业流转。其中需要一些政策去做各种各样的推动和引导。


闻茗萱介绍道,“例如修改会计准则鼓励数据资产入表,能够为要素型企业获得金融支持,不仅能够增厚企业的资产负债表,也能改善企业的利润表和现金流量表。”


容亿投资始终坚持“行业+技术”的理念,炎凰数据和富数科技就是该理念的投资实践。对于数字科技投资会更加注重技术能力和交易层面能够放大垂直行业中数字价值的能力。一方面关注能为满足新的需求或场景提供技术能力的底座性质公司,需要团队画像为技术能力强,同时由于技术底座的研发周期长,切入客户的难度比较大,需要团队画像在技术能力强的同时,销售能力强,并且能够解决客户问题。另一方面重点关注在工业现场、能源或者交通等垂直行业中相对成熟的企业,由于行业数据开发运营会更看重行业积累,需要一定的客户基础和数据基础。


谈到全球数商大会,闻茗萱表示,“期待在数据流通层面有政策落地或者试点,数据发展的实质推动离不开国家政策的细则落地。国内的数据产业发展处于世界前列,中国在数据完整性层面有独特优势,同时数据作为生产要素最终目的是赋能产业链,国内拥有完整的工业链条和全面的工业数据,因此当数据实现全流通后,我国制造业将有一个全面升级,因此我们认为国家在数据要素时代能够实现弯道超车的机会。”


04

结语


作为新型生产要素,数据已经成为全球关注和博弈的焦点。目前,数字领域国际规则体系仍在构建中,我国正在牢牢抓住新一轮科技革命和产业变革的战略性机遇,努力探索出一条中国特色数字经济发展道路,赢得数字经济时代国际竞争的主动权。


2023全球数商大会将进一步围绕数据要素基础设施建设、数据要素交易流通、数据资产化创新等领域的话题开展深入交流,为全球经济的可持续发展贡献力量。让我们期待这场盛会的到来,共同见证市场发展,研判未来趋势,展望行业图景,为全球数据要素市场发展举旗定向。



届时,亿欧将发布《2023中国数据要素生态研究报告》,通过梳理数据要素行业市场化现状和分析市场各主体及其行动,展示数据要素产业全景与价值分析,希望能为产业合作与投资提供有益帮助。(关于本报告如有意合作,欢迎扫码沟通)



(
END
)



亿欧智库发布《2023中国AI商业落地投资价值研究报告》,本报告通过构建SCE评估模型,分析得出零售、互联网、金融、泛娱乐、汽车、智慧城市、医疗和制造行业中的高价值场景,最终从供给和需求侧提出提升AI商业落地场景价值的有效途径。

欢迎关注公众号,添加小助手后回复报告名称获取完整版。






浏览 350
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报