微软开源的数据分析任务处理系统

开源你我他

共 1510字,需浏览 4分钟

 · 2024-04-11

关注 "GitHub精选",设为 "星标"
探索有意思的开源项目

大家好,又见面了,我是 GitHub 精选君!

背景介绍

在数据分析领域,我们经常会遇到需要将多种数据分析任务无缝地计划和执行的挑战。这些任务可能涉及诸如查看和解析数据、运行算法、生成报告等复杂过程。由于这些任务经常需要从多个源获取和处理数据,如数据库、网页以及 API,因此我们需要一个既可高效协调任务,又可方便地整合各类功能的解决方案。此外,为了提高代码质量,我们也需要一个可以检查输出代码并提供修复建议的工具。

今天要给大家推荐一个 GitHub 开源项目 microsoft/TaskWeaver,该项目在 GitHub 有超过 3.2k Star,用一句话介绍该项目就是:A code-first agent framework for seamlessly planning and executing data analytics tasks.

项目介绍

TaskWeaver 是一个依托于代码的代理框架,专门为无缝规划和执行数据分析任务而设计。本框架颠覆创新地运用了代码片段理解用户请求,并能有效地协同形如函数的各类插件,以有状态的方式完成数据分析任务。TaskWeaver 的亮点包括丰富的数据结构支持、自定义算法支持、专业知识引入、有状态的执行、代码验证、易用性、易调试、安全问题考虑以及易扩展性等特点。

以下是系统的处理流程图:

如何使用

TaskWeaver 的安装需要 Python 3.10 以上版本。运行以下命令克隆代码仓库并安装所需组件:

git clone https://github.com/microsoft/TaskWeaver.git
cd TaskWeaver
pip install -r requirements.txt

然后,修改配置文件 taskweaver_config.json,以确定使用的 LLM(内置的语言模型),例如 OpenAI。

在配置完成后,运行以下命令开始 TaskWeaver:

python -m taskweaver -./project/

除了命令行操作外,TaskWeaver 还支持通过 WebUI 操作,也可以作为一个库导入到你的现有项目中。

项目推介

TaskWeaver 是微软的开源项目,持续更新且活跃度高,还有不断添加的新功能,如视觉网络探索器插件,流媒体支持以及加入了各种 LLM ,如 LiteLLM、Ollama、Gemini、和 QWen 等。

以下是该项目 Star 趋势图(代表项目的活跃程度):

更多项目详情请查看如下链接。

开源项目地址:https://github.com/microsoft/TaskWeaver

开源项目作者:microsoft

开源协议:MIT License

关注我们,一起探索有意思的开源项目。

点击如下卡片后台回复:加群与技术极客们一起交流人工智能、开源项目,一起成长。如果你正在寻求开源项目推广、DevOps、AIGC 大模型、软件开发等领域的付费服务,可参考推文了解详情。

点击支持一下吧

浏览 4
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报