MapReduce大规模数据集软件架构认领

0粉丝

MapReduce是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念"Map（映射）"和"Reduce（化简）"，和他们的主要思想，都是从函数式编程语言借来的，还有从矢量编程语言借来的特性。当前的软件实现是指定一个Map（映射）函数，用来把一组键值对映射成一组新的键值

简介

MapReduce是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念"Map（映射）"和"Reduce（化简）"，和他们的主要思想，都是从函数式编程语言借来的，还有从矢量编程语言借来的特性。当前的软件实现是指定一个Map（映射）函数，用来把一组键值对映射成一组新的键值... 更多

技术信息

开源协议

未知

操作系统

未知

软件类型

开源软件

所属分类

大数据、其他

开源组织

无

地区

不详

适用人群

未知

时光轴

里程碑1

LOG0

2023

09-19

轻识收录

打卡

评价

0.0（满分 10 分）0 个评分

什么是点评分

图片

表情

全部评价( 0)

推荐率 100%

推荐

Apache Fluo大规模数据集增量处理系统

ApacheFluo是 GooglePercolator（搜索索引）的开源实现，允许用户对存储在ApacheAccumulo中的大型数据集进行增量更新，而无需重新处理所有的数据。与批处理和流处理框架不

Tencent ML-Images大规模多标签图像数据集

TencentML-Images 由多标签图像数据集ML-Images与业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。ML-Images:最大的开源多标签图像数据库，包括1

Cloudata分布式大规模数据存储

Cloudata 是一个分布式的大规模结构化数据存储解决方案，是 Google Bigtable 的

Cloudata分布式大规模数据存储

Cloudata是一个分布式的大规模结构化数据存储解决方案，是GoogleBigtable的开源Java实现。它是DBMS(DatabaseManagementSystem)，但不是关系型DBMS，可

Apache Pig大规模数据分析平台

ApachePig是一个分析大型数据集的平台，它由表达数据分析程序的高级语言和评估这些程序的基础设施组成。Pig程序的突出特性是其结构可以进行大量的并行化，进而使其能够处理非常大的数据集。目前，Pig

Apache Pig大规模数据分析平台

Apache Pig是一个分析大型数据集的平台，它由表达数据分析程序的高级语言和评估这些程序的基础设

Cortex lab大规模机器学习生产基础架构

Cortex是大规模机器学习的生产基础设施，用于在生产中部署、管理和扩展机器学习模型。网站• Slack •文档无服务器工作负载实时-实时响应请求并根据正在进行的请求量自动缩放。异步-异步处理请求并根

DTShare金融数据软件

DTShare是一个完全开源、免费的数据开放项目。截至到目前，其主要从证券金融作为为出发点，提供了包

DTShare金融数据软件

DTShare是一个完全开源、免费的数据开放项目。截至到目前，其主要从证券金融作为为出发点，提供了包括股票、期货、基金和宏观经济等方面的数据。主要实现了股票、期货、指数、新闻资讯和一些另类数据的开发与

MR4CC++ 的 MapReduce 框架

MR4C是Google开发的C++的MapReduce框架，你可以在Hadoop架构中执行本地代码。依赖：testedwithUbuntu12.04andCentOS6.5testedwithCDH5