简介
Arthur Bench 是一款用于评估生产用例 LLM 的工具。无论你是比较不同的 LLM、考虑不同的提示,还是测试温度和令牌数量等生成超参数,Bench 都能为你的所有 LLM 性能评估提供一个 touch point。Arthur Bench 帮助公司使用一致的指标来比较不同的 LLM 选项,... 更多
其它信息
地区
不详
开发语言
Python
JavaScript
开源组织
无
所属分类
神经网络/人工智能、 LLM(大语言模型)
授权协议
MIT
操作系统
跨平台
收录时间
2023-09-26
软件类型
开源软件
适用人群
未知
时光轴
里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
全部评价(
0)
推荐率
100%
推荐
ClassBuilderC++用例工具
ClassBuilder是一个用例工具,主要面向C++开发者,支持Windows系统,可以用来创建、操作和浏览C++类以及类之间的关系,成员和属性等
ClassBuilderC++用例工具
0
LangChain构建 LLM 应用的工具
LangChain是一个用于构建基于大型语言模型(LLM)的应用程序的库。它可以帮助开发者将LLM与其他计算或知识源结合起来,创建更强大的应用程序。LangChain提供了以下几个主要模块来支持这些应
LangChain构建 LLM 应用的工具
0
corevidence™安全评估工具
corevidence™是一款以saas模式发布的安全工具,它提供了web应用程序评估,漏洞评估,VoIP安全评估,Web恶意代码监控,Web站点监控等服务。
corevidence™安全评估工具
0
StorScore存储设备评估工具
StorScore是一个用于测试存储设备的组件级评估工具。当运行默认设定的时候,它可以给出Windows应用开发者所希望的与实际相似的指标。示例代码:A Windows Perl interprete
StorScore存储设备评估工具
0
trycmdCLI 测试用例工具
trycmd是Rust编写的CLI测试用例工具,可用于枚举测试用例文件并运行它们以验证结果。trycmd旨在简化运行大量端到端CLI测试用例的过程,灵感来自 trybuild。示例#[test]fnu
trycmdCLI 测试用例工具
0