DataVecETL 机器学习库

联合创作 · 2023-09-26

DataVec 是基于 Apache 2.0 许可的 ETL 机器学习(Extract,Transform,Load)操作库。 DataVec 的目的是将原始数据转换成可以馈送到机器学习算法的可用向量格式。

当前输入数据类型支持开箱即用:

  • CSV Data

  • Raw Text Data (Tweets, Text Documents, etc)

  • Image Data

  • LibSVM

  • SVMLight

  • MatLab (MAT) format

  • JSON, XML, YAML, XML

浏览 9
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报