SFrame数据分析处理组件

联合创作 · 2023-09-30 16:20

Scalable 表格 (SFrame, SArray) 和图形 (SGraph) 数据结构用于数据分析。SFrame 提供下列结构的完整实现:



  • SFrame


  • SArray


  • SGraph


  • C++ SDK surface area (gl_sframe, gl_sarray, gl_sgraph)




SFrame 包含来自 Dato 的开源组件 GraphLab Create  。


SFrame 关键特性:



  • 一个可伸缩的列压缩,基于磁盘后端存储的数据帧,为机器学习和数据科学研究优化.


  • 主要为表格和图形数据而设计


  • 支持强类型化的数据列和弱类型列


  • 统一支持数据丢失处理


  • 查询优化以及延迟仿真


  • A C++ API (gl_sarray, gl_sframe, gl_sgraph) with direct native access via the C++ SDK.


  • A Python API (SArray, SFrame, SGraph) with an indirect access via an interprocess layer.



环境要求:


SFrame 要求 64 位操作系统


操作系统



  • Mac OS X: 10.8+


  • Linux: Any distribution with GLIBC >= 2.11



    • Ubuntu >= 11.04


    • Debian >= 6


    • RHEL >= 6


    • SLES >= 11



  • Windows (7, 8, 10, Server 2012 R2)



Python



  • Python 2.7.x


  • Note: Unfortunately, Python 3.x is currently not supported.


浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报