Arthur Bench评估生产用例 LLM 的工具

0获赞0粉丝0关注
Arthur Bench 是一款用于评估生产用例 LLM 的工具。无论你是比较不同的 LLM、考虑不同的提示,还是测试温度和令牌数量等生成超参数,Be
简介
Arthur Bench 是一款用于评估生产用例 LLM 的工具。无论你是比较不同的 LLM、考虑不同的提示,还是测试温度和令牌数量等生成超参数,Bench 都能为你的所有 LLM 性能评估提供一个 touch point。Arthur Bench 帮助公司使用一致的指标来比较不同的 LLM 选项,... 更多
其它信息
地区
不详
开发语言
Python JavaScript
开源组织
所属分类
神经网络/人工智能、 LLM(大语言模型)
授权协议
MIT
操作系统
跨平台
收录时间
2023-09-26
软件类型
开源软件
适用人群
未知

时光轴

里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
图片
表情
全部评价( 0)
推荐率 100%
推荐