简介
Arthur Bench 是一款用于评估生产用例 LLM 的工具。无论你是比较不同的 LLM、考虑不同的提示,还是测试温度和令牌数量等生成超参数,Bench 都能为你的所有 LLM 性能评估提供一个 touch point。Arthur Bench 帮助公司使用一致的指标来比较不同的 LLM 选项,... 更多
技术信息
授权协议
MIT
开发语言
Python
                                                                                                                                                                                                                                                                                                JavaScript
操作系统
跨平台
软件类型
开源软件
所属分类
神经网络/人工智能、                                                                                                                                                                                                                                                                                                LLM(大语言模型)
开源组织
无
地区
不详
适用人群
未知
评价
0.0(满分 10 分)0 个评分
        
          什么是点评分
          
全部评价(
                0)
            
                推荐率
                100%
            

