PyCascadingPython 打包器

联合创作 · 2023-09-28 15:06

Cascading是一个新式的针对Hadoop clusters的数据处理API，它使用富于表现力的API来构建复杂的处理工作流，而不是直接实现Hadoop MapReduce的算法。

PyCascading 是Cascading 的 Python 打包器（wrapper）。可使用它控制来自 Python 上完整的数据处理流程。

管道是由 Python Operators 模块建造的

用户定义的功能都写在 Python 上

能够传递任意上下文到用户定义的功能上

临时结果的缓存会导致管道更快的重播（faster replay）

使用 Jython 2.5.2 将有利于 Java 和 Python库的集成

PyCascading 能够用于两种模式中：在本地的 Hadoop 或远程 Hadoop 部署。

使用 PyCascading 所需要的环境是：

Cascading 1.2.* or 2.0.0

Jython 2.5.2+

Hadoop 0.20.2+, the version preferably matching the Hadoop runtime

Java 编译器

Ant

运行条件：

Hadoop 在目标服务器上安装和设置

SSH 访问远程服务器

如果在本地测试，则需要合理的调用 JVM

浏览 20

点赞

收藏

分享

举报

评论

图片

表情

Webpack模块打包器

Webpack是一个模块打包器，主要目的是在浏览器上打包JavaScript文件。TL;DR捆绑 ES模块、CommonJS 和 AMD 模块（以及绑定）。可以创建在运行时异步加载的单个捆绑包或多个块

FastpackJavaScript 应用打包器

Fastpack 是一个 JavaScript 应用打包器，目标是做到对于中型应用（约1000个模块

FastpackJavaScript 应用打包器

Fastpack是一个 JavaScript应用打包器，目标是做到对于中型应用（约1000个模块）的打包时间小于1000ms，增量重新打包时间低于100ms。 $ npm install -g fpa

Webpack模块打包器

Webpack 是一个模块打包器，主要目的是在浏览器上打包 JavaScript 文件。TL;DR捆

JavaScript 模块打包器——Rollup

勾勾的前端世界

FuseBoxJS 打包/模块的加载器

FuseBox是一个打包、模块的加载器，用来合并包括webpack、JSPM和SystemJS的强大功能。示例代码：//npm install typescript fuse-box --save-d

90行代码实现模块打包器

FuseBoxJS 打包/模块的加载器

FuseBox 是一个打包、模块的加载器，用来合并包括 webpack、JSPM 和 SystemJ

自己实现一个简易的模块打包器(干货)

程序员成长指北

OneJSJavaScript 文件打包

OneJS(one.js)用来将Node.js项目打包成一个JavaScript文件，可直接在浏览器上运行。

点赞

收藏

分享

举报