人人可做提示工程师!Claude上新:一键生成、测试和评估prompt机器学习算法与Python实战共 2037字,需浏览 5分钟 ·2024-07-12 11:29 机器之心报道 编辑:陈陈、小舟 不会写 prompt 的看过来。 在构建 AI 应用时,prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性,需要研究者深入了解应用需求,并具备大型语言模型方面的专业知识。为了加快开发速度并改善结果,AI 初创公司 Anthropic 简化了此流程,可以让用户更轻松地制作高质量的 prompt。 具体来说,研究者为 Anthropic Console 添加了新功能,可以生成、测试和评估 prompt。 Anthropic 提示工程师 Alex Albert 表示:这是他们过去几周投入了大量工作才得到的成果,现在 Claude 在提示工程(Prompt Engineering)方面表现得非常好。 难写的 prompt,交给 Claude 在 Claude 中,写一个好的 prompt 就像描述任务一样简单。控制台提供了一个内置的 prompt 生成器,由 Claude 3.5 Sonnet 提供支持,允许用户描述任务并让 Claude 生成高质量的 prompt。 生成 prompt。首先点击 Generate Prompt,进入 prompt 生成界面: 然后输入任务描述,Claude 3.5 Sonnet 将把任务描述转换为高质量的 prompt。例如「 撰写一个用于审查入站消息的 prompt…… 」,点击生成 prompt 就可以了。 生成测试数据。如果用户有了 prompt,可能需要一些测试用例来运行它。Claude 可以生成那些测试用例。 用户可以根据需要修改测试用例,并一键运行所有测试用例,还可以查看并调整 Claude 对每个变量生成要求的理解,以实现对 Claude 生成测试用例更细粒度的控制。 这些功能让优化 prompt 变得容易,因为用户可以创建 prompt 的新版本并重新运行测试套件以快速迭代和改进结果。 此外,Anthropic 还按照 5 分制为 Claude 响应质量设置了评分。 评估模型。如果用户对 prompt 感到满意,之后可以在「评估」选项卡中一次针对各种测试用例运行它。用户可以从 CSV 导入测试数据,也可以直接使用 Claude 为用户生成合成测试数据。 比较。用户还可以在测试用例中相互测试多个 prompt,并对更好的响应进行评分,以跟踪哪个 prompt 表现最佳。 AI 博主 @elvis 表示:Anthropic Console 是一项出色的研究,其自动化设计和优化 prompt 的过程可以节省大量时间。虽然生成的提示可能并不完美,但给了用户一个快速迭代的起点。此外,生成测试用例功能也很有帮助,因为开发者可能没有可供测试的数据。 看来,以后写 prompt 这个活,可以交给 Anthropic 了。 了解更多内容,请查看文档:https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview 大模型最新情报 Pandas 加速150倍! 用机器学习来优化人生 我“参加了”阿里巴巴全球数学竞赛决赛,分享一下经验 搭建机器学习开发环境及Python基础,108页PDF 116页PDF小册子:机器学习中的概率论、统计学、线性代数 浏览 12点赞 评论 收藏 分享 手机扫一扫分享分享 举报 评论图片表情视频评价全部评论推荐 测试工程师可接单 有10年的测试经验 测试工程师可接单 有10年的测试经验 测试工程师可接单 有10年的测试经验 测试工程师可接测试工程师可接单 有10年的测试经验 测试工程师可接单 有10年的测试经验 测试工程师可接单 有10年的测试经验 测试工程师可接单 测试工程师可接单 有10年的测试经验 测试工程师可接单 有10年的测试经验 测试工程师可...Prompt之文本生成DayNightStudy0 测试工程师可接单 有10年的测试经验测试工程师可接单 有10年的测试经验 微信:13521710578推荐一个神器,可一键生成浏览器指纹!全栈大佬的修炼之路0测试工程师请注意当你喊出我要开始测试了,你真的知道测试是怎么做的吗? 既然已经成为测试工程师,测试的流程想必大家都已经很清楚:需求分析、系统分析、测试分析、编写测试用例、测试执行、发送测试报告。 这里先说说需求分析。测...【招聘】阿里巴巴-Web测试工程师 / 无线测试工程师驻场开发者服务号0一键生成Springboot & Vue项目!Stephen0疫情下,零售人心理评估和压力测试联商网资讯0【深圳】TCL招聘测试工程师,可至20K/月Python测试开发0一键生成任意前端项目Java架构师社区0点赞 评论 收藏 分享 手机扫一扫分享分享 举报