打破单一Agent局限,AI创客松获奖作品汇总

共 10183字,需浏览 21分钟

 ·

2024-04-18 23:45

 Datawhale作品 

赛事:Multi-Agent for X,Create AI创客松





Multi-Agent的25种解题思路

随着 Agent的兴起,大家逐渐认识到单一Agent的局限性。综合多个不同功能的LLM-Powered Agent 的优点,通过多个 AI 智能体一起工作,分配任务并讨论和辩论想法,以提出比单个智能体更好的解决方案。斯坦福大学教授吴恩达也曾公开表示非常看好多智能体的发展,认为多智能体协作可以取得比单个智能体更好的性能。他期待AI智能体工作流在未来引领人工智能的新趋势。正是因为如此,本次比赛demo day现场吸引了诸多观众,期待通过本次比赛的参赛作品一窥AI未来。

(比赛前的“试用试玩环节”吸引了诸多AI从业者和爱好者前来交流)


透过本次比赛,我们可以看到游戏领域是MultiAgent最多落地的场景,Action、药品知识科普小分队、模法创新者从教育科普类游戏切入,瓦力向前冲均借助多智能体的方式为游戏带来更多个性化的体验;X-D Lab心动实验室、终抵繁星、鬼斧神工则带来沉浸式的角色扮演体验。

效率工具领域则是第二多落地的场景,AgentFreedom、cjy的队伍借助Multi-Agent提升视频和文本生成效率;嘉喻户晓、今日宜开摆、MVP小组、SQL BOY、赛博大叔、无可比倪队伍通过Multi-Agent重构工作流,为广告、设计、工程等场景实现降本增效。

而在广泛的生活需求上,包括生活减压、社交矛盾调解、儿童陪伴、提升学习效率等,甚至小到推荐一杯鸡尾酒,针对这些日常生活方方面面的需求,金牌调解员、老板说什么都不对、MumuLab、你有高速运转的机器进入UESTC、SUN、职场驭师、致胜AI创客、智慧协同小队这些队伍也分别从不同角度给出多智能体应用解决方案。

参赛选手们现场展示开发成果,并与观众和评委团进行交互体验。由AI领域的产、投、研专家组成专业评审团,从技术能力、产品体验、市场前景、创新思路、云上创新等多个维度进行综合评审。此次比赛也创新性开设观众互动环节,不仅有路演前的交流试玩,在路演中也邀请现场观众对心选作品参与点赞投票。


最终,以下队伍分获此次Create@AI创客松奖项:
一等奖

MumuLab



作品:【再忙也要陪陪小朋友】
MumuLab基于阿里云百炼平台打造虚拟童话世界,通过多智能体构建不同的童话故事角色并进行儿童故事创作,提供更好的亲子互动方式。MumuLab不仅能够自动生成奇思妙想的故事情节,还能生成形象和配音以及与虚拟角色进行对话,实现从文本到语音的全方位故事体验。

二等奖

嘉喻户晓



作品:【AI创意广告制造局】
嘉喻户晓队运用AgentScope框架,结合通义千问大模型和Sam Bert语音合成,构建了一套自动化广告创意短片工作流,通过@广告创业行业中的不同角色,如需求分析师、广告创意设计师、脚本制作师、视频制作师等,推动客户的创意广告的生成,实现从客户对接需求到最终成片的一整套智能流程。


老板说什么都不对



作品:《生活辩论家:现实逃离之旅》

老板说什么都不对队由一群拒绝内卷的年轻人组成,他们关注现代职场及社会中普遍存在的被迫加班、催婚压力、职场内卷等问题。在这次比赛作品中,他们通过三个渐进层次的游戏设计帮助玩家释放情绪、培养理性思考能力和促进自我觉醒。其采用自迭代的正反馈循环机制,通过AI智能体提供辩论选项,玩家的选择可实时反馈至系统,促使AI模型不断优化其对话内容。在游戏中,用户可以选择多种场景和角色,在模拟辩论环境中敢于表达真实情感,进而寻找真正的自我价值。

三等奖

模法创新者



作品:【模法学院之庭审风云】
模拟法庭游戏基于Agent Scope打造,利用通义千问Qwen-Max以解决法学生理论与实践脱节、法条应用难理解等问题。游戏模拟真实的法庭环境,包含证人证词、聊天记录等多类型证据的质证环节。用户可以扮演不同的法庭角色,如辩护律师或法官。模拟庭审结束后,系统会根据用户的表现进行角色评价,给出得分和具体改进意见。通过游戏化和情景化教学方式,使学习者能在实际案例情景中运用所学法律知识。


今日宜开摆



作品:【ChaosAgent混沌工程助手】
今日宜开摆队来自复旦大学MSE软件学院。这次比赛中,他们针对混沌工程落地打造了一个多Agent协作程序,通过自然语言交互简化混沌工程中庞大的团队协作,实现全流程管理。整个过程体现了系统的自动化和高效性,通过各Agent间的协调合作,实现了混沌工程实验从计划制定、故障注入、实时监控到实验报告生成的无缝衔接。


金牌调解员



作品:【AI金牌调解员】
金牌调解员基于Agent Scope框架,结合通义千问大模型和智能语音识别服务,打造一个智能化调解服务平台。他们现场模拟了一起关于邻居乱扔垃圾引发纠纷的调解过程,通过智能语音识别技术,确保了对话内容准确记录和理解。AI调解员通过与双方当事人互动,提出问题、收集信息,并引导对方当事人作出解释和提出解决方案。他们还利用向量数据库构建AI调解员的记忆系统,使其具备长期记忆能力,能够跨时间段跟踪复杂的调解案件;并将司法部人民调解指导案例库、调解专业资料等接入系统作为知识库,增强了AI调解员的专业调解能力,可有效应对各种复杂、多样化的民间纠纷。

最具创意奖
SUN



作品:游戏成长(YGO版)
SUN带来的是一款“非常规”游戏作品,将游戏设计中的吸引力机制应用到学习和工作中,以改变人们对于学习和工作的投入程度,使工作更有吸引力。此次比赛中,SUN以六级考试为例,演示了如何将目标转化为由AI agent分配和管理的学习计划,用户完成计划后可获得积分反馈,并可通过积分兑换游戏内的奖励道具,比如抽取不同稀有度的游戏卡片。该项目未来有望拓展至其他类型的游戏或学习应用场景,整合多种功能模块,通过Multi-Agent重塑现实生活中的任务执行模式,激发用户积极面对学习和工作任务的热情与动力。

最具技术突破奖
赛博大叔



作品:【Landing Page 生成器】
赛博大叔队观察到,市场上很多采用AI生成的组件需要经过大量调试和改造才能适应原有系统。与其让AI随机生成单个难以匹配现有系统的组件,不如构建一整套设计系统作为基础,再从中生成符合该体系的组件,提高生成组件与实际应用场景的契合度。他们简化了日常运营中落地页的创建流程,运用规划和多智能体协作的设计范式,结合千万级参数量的大型语言模型(如通义千问系列的72B模型),通过提升并发处理能力来确保产品快速响应并生成结果。使用的框架包括AgentScope和Next.js等。

最具商业价值奖
SQL BOY



作品:【数据精灵】
SQL BOY队针对实际工作中遇到的数据载体不一致性的问题,设计了这款基于多智能体技术的数据工程辅助系统。系统利用先进的模型提升整体效能,并借助AgentScore的共享内存机制实现多智能体协同工作。在技术架构上提供独立的平台服务,同时无缝对接企业现有的各种系统。在实际操作中,该系统能完成一系列复杂动作,如连接数据库、分析数据库类型与表结构、根据需求生成查询语句、根据数据生成图表、对数据进行总结分析等。另外,数据精灵还具备强大的归因分析功能,例如能对比不同时间段或地区的销售数据,通过计算各维度对销售额变化的影响系数,定位关键因素,为企业提供精准的业务洞察和经营策略建议,如案例中成功挖掘出广东省超美味品牌销售额增长背后的品类拉动因素。

最具潜力奖
你有高速运转的机器进入UESTC队



作品:【智恋】
你有高速运转的机器进入UESTC队基于Agent Scope进行拓展,结合通义万象等模型能力,开发了游戏化虚拟相亲平台。解决当代年轻人因工作压力大、社交时间有限及性格内向等原因,在寻找伴侣时面临的难题,同时也针对传统相亲渠道匹配效率低、安全性差等问题提出了创新解决方案。他们现场展示了平台的操作流程:用户输入基本信息后,系统中的虚拟主持人和女嘉宾会依据用户信息做出互动反馈,模拟相亲节目中的各个环节,包括男嘉宾自我介绍、女嘉宾留灯选择,以及最终牵手成功的场景。整个项目充分体现了多智能体在相亲交友方面的潜力。





从Agent到Multi-Agent,创业者如何快速落地
此次Create@AI创客松比赛中,我们看到很多优秀的AI创业团队带来了多智能体应用作品,感受到Multi-Agent在不同领域中发挥的价值。从Agent到MultiAgent,从技术锤子走向应用落地,AI创业者们如何小步快跑,对自己的产品进行快速迭代?在推向市场过程中又会有哪些技术难题和发展挑战?
对此,我们还邀请了AI领域的产、投、研专家,围绕《从Agent到MultiAgent:技术进展和应用落地》主题展开了一场圆桌讨论。

从投资的视角出发,Atom Capital创始合伙人杨孟彤看到,从早期的代表Copilot,逐渐过渡到如今的自主性更强的Agent,不仅能执行单一任务,更能承担起更为复杂的、独立闭环的工作流,实现某种程度的自主操作。这也意味着Agent正逐渐演变为具备完整功能的数字员工,能够在更多实际场景中落地应用,成为AI工作力量的重要组成部分。这一发展趋势被视为极具潜力和前景的赛道。

阿里巴巴集团投资部执行董事王冉也表示,随着底层模型的持续迭代更新,短期来看,Agent可能在精准度要求相对较低的游戏和C端消费领域中更容易落地,但从长期来看,Agent技术在效率提升和工具应用等B端场景中有望替代部分人工操作,并在某些方面超越。随着技术成熟,企业级和专业化应用场景将迎来更多的发展机遇和突破。

技术锤子在走向落地的过程中,AI创业者们还面临着很多难题,其中首当其冲的是模型幻觉问题。很多AI开发者会使用RAG技术进行优化。复旦大学计算机科学技术学院教授张奇肯定了RAG技术的积极作用,但也提到提升的过程仍面临重大挑战,尤其是在达到更高层次的性能时。例如,PDF解析和向量检索等任务在处理复杂格式和提高检索准确率方面存在困难。尽管大型模型提供了一定程度的改进,但在长文本处理等方面仍有待提高。将技术从demo到实际应用还需要在每个技术环节进行细致的优化,这是一个既艰难又必要的过程。

尽管挑战重重,目前市场上已经出现了相对成熟的多智能体产品,例如斯坦福小镇等,但也引起了社会对人机协作关系的广泛讨论。中国人民大学高瓴人工智能学院教授魏哲巍认为多智能体应用正深刻影响人文社会科学的研究范式。通过多智能体系统,能够模拟现实中不可行或具有争议的社会实验,例如公租房分配实验等。

总的来看,Multi-Agent在提升大型模型性能和应用效果方面有巨大潜力和长远意义。通义实验室资深算法专家李雅亮也提出,通过Multi-Agent系统积累的数据和经验,可以用于训练下一代大模型,使其具备更强的CoT(Chain of Thought,大模型思维链)能力。从长远来看,随着大模型CoT能力的提升,原本需要Multi-Agent协同完成的任务可能会由单个智能体独立完成。


(从左往右为:魔搭社区技术运营负责人成晨、通义实验室 资深算法专家李雅亮、中国人民大学高瓴人工智能学院教授魏哲巍、复旦大学计算机科学技术学院教授张奇、Atom Capital创始合伙人杨孟彤、明势资本合伙人夏令、阿里巴巴集团投资部执行董事王冉)


对于创业者而言,从技术走向应用不是重点,市场才是真正的目的地。正如澜码科技创始人兼CEO周健在启发演讲中总结的,AI创业者从想法到PMF的过程中,首先要找到解决问题的市场和目标客户群体,并在销售过程中需要不断地迭代和改进产品,寻找合适的销售渠道。产品走向市场过程中,品牌宣传和个人影响力可以帮助提高获客效率,而数据分析和用户反馈对于优化产品和提高转化率非常重要。创业者需要找到适合自己擅长的领域和专业技能,发挥自己的竞争优势。


(周健 澜码科技创始人兼CEO)





“云+AI”,构建多智能体应用开发新范式



今天,“云+AI”正成为一种创业新范式。阿里云在2023年9月正式推出创业者计划。该计划可以为创业者提供最高100万元的上云抵扣金,阿里云中小企业品牌总经理储尔勇在开场致辞中特别强调希望通过该计划帮助创业者快速启动,“为创业者创新成长提速”。据悉,当前已超过1.3万家创业公司申请加入。

(阿里云中小企业品牌总经理储尔勇开场致辞)


同时为了助力更多AI创业者快速构建自己的多智能体应用,阿里云与魔搭社区提供了云上创新资源支持。
此次Create@AI创客松比赛中,选手们都基于AgentScope框架进行多智能体应用开发。AgentScope是全新开源的Multi-Agent框架,提供了分布式模式,支持将同一个应用中的多个 Agent 运行在不同的进程甚至不同的机器上。该框架可以让多个Agent通讯及协作,从而提升任务完成的准确率和稳定性。
为创新成长提速,期待下一季Create@AI创客松再会!


获奖作品可点击阅读原文,跳转体验~




浏览 158
10点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
10点赞
评论
收藏
分享

手机扫一扫分享

分享
举报