AI被人类骗走34万!用于解决复杂任务的通用多智能体系统#Magentic-One
共 3372字,需浏览 7分钟
·
2024-12-02 21:54
风险
工作原理
协调者 Orchestrator:负责任务分解、规划、指挥其他Agent执行子任务、跟踪总体进度并根据需要采取纠正措施
WebSurfer:基于 LLM 的Agent,能够熟练地指挥和管理基于 Chromium 的 Web 浏览器的状态。对于每个请求,WebSurfer 都会执行导航(例如,访问 URL、执行搜索)、与网页交互(例如,单击、键入)和阅读操作(例如,总结、回答问题)等操作。然后,它会报告网页的新状态。WebSurfer 依靠浏览器的可访问性树和标记集提示来执行其任务。
FileSurfer:基于 LLM 的Agent,可命令基于 markdown 的文件预览应用程序读取本地文件。它还可以执行常见的导航任务,例如列出目录内容并浏览它们。
程序员:基于 LLM 的Agent,专门负责编写代码、分析从其他代理收集的信息并创建新的任务。
ComputerTerminal:提供对控制台 shell 的访问,用于执行程序和安装新的代码库。
如果你想用多智能体完成你的某项工作(也许是毕业论文?
欢迎加入#AI编程 社群
备注:AI编程社群
原文:https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks
评论