搜索
MapReduce大规模数据集软件架构
认领
关注
0
粉丝
MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(化简)",和他们
知识
简介
MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(化简)",和他们的主要思想,都是从函数式编程语言借来的,还有从矢量编程语言借来的特性。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值...
更多
其它信息
地区
不详
开源组织
无
所属分类
大数据、 其他
授权协议
未知
操作系统
未知
收录时间
2023-09-19
软件类型
开源软件
适用人群
未知
时光轴
里程碑
1
LOG
0
2023
2023-09
轻识收录
打卡
我要打卡
我要打卡
评价
0.0
(满分 10 分)
0 个评分
什么是点评分
图片
表情
视频
评价
全部评价( 0)
推荐率 100%
推荐
Apache Fluo大规模数据集增量处理系统
ApacheFluo是 GooglePercolator(搜索索引)的开源实现,允许用户对存储在ApacheAccumulo中的大型数据集进行增量更新,而无需重新处理所有的数据。与批处理和流处理框架不
Tencent ML-Images大规模多标签图像数据集
TencentML-Images 由多标签图像数据集ML-Images与业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。ML-Images:最大的开源多标签图像数据库,包括1
Cloudata分布式大规模数据存储
Cloudata 是一个分布式的大规模结构化数据存储解决方案,是 Google Bigtable 的
Cloudata分布式大规模数据存储
Cloudata是一个分布式的大规模结构化数据存储解决方案,是GoogleBigtable的开源Java实现。它是DBMS(DatabaseManagementSystem),但不是关系型DBMS,可
Apache Pig大规模数据分析平台
ApachePig是一个分析大型数据集的平台,它由表达数据分析程序的高级语言和评估这些程序的基础设施组成。Pig程序的突出特性是其结构可以进行大量的并行化,进而使其能够处理非常大的数据集。目前,Pig
Apache Pig大规模数据分析平台
Apache Pig是一个分析大型数据集的平台,它由表达数据分析程序的高级语言和评估这些程序的基础设
Cortex lab大规模机器学习生产基础架构
Cortex是大规模机器学习的生产基础设施,用于在生产中部署、管理和扩展机器学习模型。网站• Slack •文档无服务器工作负载实时-实时响应请求并根据正在进行的请求量自动缩放。异步-异步处理请求并根
DTShare金融数据软件
DTShare是一个完全开源、免费的数据开放项目。截至到目前,其主要从证券金融作为为出发点,提供了包
DTShare金融数据软件
DTShare是一个完全开源、免费的数据开放项目。截至到目前,其主要从证券金融作为为出发点,提供了包括股票、期货、基金和宏观经济等方面的数据。主要实现了股票、期货、指数、新闻资讯和一些另类数据的开发与
MR4CC++ 的 MapReduce 框架
MR4C是Google开发的C++的MapReduce框架,你可以在Hadoop架构中执行本地代码。依赖:testedwithUbuntu12.04andCentOS6.5testedwithCDH5