简介
Arthur Bench 是一款用于评估生产用例 LLM 的工具。无论你是比较不同的 LLM、考虑不同的提示,还是测试温度和令牌数量等生成超参数,Bench 都能为你的所有 LLM 性能评估提供一个 touch point。Arthur Bench 帮助公司使用一致的指标来比较不同的 LLM 选项,... 更多
其它信息
授权协议
MIT
开发语言
Python
JavaScript
操作系统
跨平台
软件类型
开源软件
所属分类
神经网络/人工智能、 LLM(大语言模型)
开源组织
无
地区
不详
适用人群
未知
评价
0.0(满分 10 分)0 个评分
什么是点评分
全部评价(
0)
推荐率
100%