动态基准测试Dynabench已发布,Facebook想用人类来「审问」人工智能
新智元
共 2395字,需浏览 5分钟
·
2020-10-11 07:57
新智元报道
新智元报道
来源:Facebook
编辑:QJP
【新智元导读】Facebook已经建立并正在共享Dynabench,这是第一个用于人工智能领域的动态数据收集和基准测试平台。它使用人类测试和模型一起循环迭代,目的是为了创造具有挑战性的新数据并且更优化的人工智能模型。
人工智能在过去十年左右的巨大成功通常归功于大量的数据和计算能力,但是「基准测试」在推动进步方面也发挥着至关重要的作用。
Dynabench:新的动态对抗性benchmark
静态基准测试-忽略了与人交互的体验
测试地址:https://dynabench.org/
参考链接:https://ai.facebook.com/blog/dynabench-rethinking-ai-benchmarking/
评论
stoolJavaScript 基准测试工具
stool是一个 JavaScript基准测试工具。优势:无需登录/姓名和电子邮件/验证码"always"up只使用静态的资源,所以可以本地和脱机工作(仅限打开HTML文件)快速
stoolJavaScript 基准测试工具
0
Swingbench基准测试程序
Swingbench是一个免费的负载生成器(和基准测试程序),用于对oracle数据库(10g,11g)进行压力测试. 这个软件是用Java开发的,因此可以在多种平台上运行,同时提供了一些扩展的API
Swingbench基准测试程序
0