Cognition AI 发布全球首个人工智能软件工程师-Devin,想象一下您的团队里有一位永不停歇、技艺超群的新成员——Devin,这位无所不能的“队友”不仅能够携手同行,还能独当一面,为您的工程项目带来前所未有的助力!Devin以其卓越的长期逻辑推理与精密规划能力,轻松驾驭涉及数千个决策点的复杂工程任务,无论何时何地都能追溯每一个步骤的深层背景,不断学习并自我修正错误。在技术装备方面,Devin已武装到了牙齿,囊括shell环境、代码编辑器、浏览器等全套开发者工具,随时准备着与人类工程师同步高效工作。而最令人惊艳的是,Devin具备实时沟通协作的本领。从进度汇报到采纳反馈,再到共同探讨设计方案,Devin始终保持与用户的紧密联系,确保整个过程流畅无阻。1)下面让我们一览Devin的神奇技能实例:1.1、技术快速习得:读完一篇博客后,Devin迅速掌握Modal上的ControlNet,在为Sara创作的图像中嵌入隐秘信息,展示出强大的适应性。1.2)端到端应用构建与部署:Devin亲手打造了一款模拟生命游戏的交互式网站,响应用户需求迭代更新,并一键将其部署至Netlify平台。1.3)自动化错误排查与修复:面对Andrew的开源编程书籍维护难题,Devin主动介入,成功协助定位并修复了代码库中的各类bug。1.4)自训AI模型升级:Devin仅凭一个GitHub研究库连接,就能完成大型语言模型的微调工作,不断提升自身智能化水平。1.5)无缝对接开源社区:不论是处理GitHub上的错误报告还是功能请求,只要给Devin一个链接,它便能迅速行动起来,完成所有设置与上下文分析,并提交修复代码。1.6)实战SWE-bench基准测试:Devin在SWE-bench这一严苛基准上大放异彩,针对知名Python代数系统sympy中关于对数计算的棘手问题,精准定位,亲自编码测试并完美修复。1.7)实战职场验证:Devin甚至在自由职业市场Upwork上接受了真实项目考验,编写并调试了运行计算机视觉模型的代码,高效完成数据采样及撰写专业报告。 2)AI工程师总体工作成绩:Devin在SWE-bench基准上创下了惊人纪录,端到端成功解决高达13.86%的真实GitHub问题,这远超过先前1.96%的最佳纪录。即使在给出确切编辑位置的情况下,之前的最优模型也只解决了4.80%的问题。最后Devin的横空出世,标志着AI软件工程领域进入全新纪元。这位超凡的AI工程师正在引领未来的潮流,期待未来AI软件工程师能够攻克更具挑战性的问题。参考文献:https://www.cognition-labs.com/blog