EvalsOpenAI 模型评估框架

0粉丝
Evals 是一个评估 OpenAI 模型的框架和一个开源的基准测试注册表,你可以使用 Evals 来创建和运行评估:使用数据集来生成提示信息衡量 OpenAI 模型所提供的完成度的质量比较不同数据集和模型的性能Evals 的目标是使建立一个评估尽可能简单,同时编写尽可能少的代码。要开始使用,建议你
简介
Evals 是一个评估 OpenAI 模型的框架和一个开源的基准测试注册表,你可以使用 Evals 来创建和运行评估:使用数据集来生成提示信息衡量 OpenAI 模型所提供的完成度的质量比较不同数据集和模型的性能Evals 的目标是使建立一个评估尽可能简单,同时编写尽可能少的代码。要开始使用,建议你... 更多
技术信息
开源协议
MIT
开发语言
Python
操作系统
跨平台
软件类型
开源软件
所属分类
神经网络/人工智能、 机器学习/深度学习
开源组织
地区
不详
适用人群
未知

时光轴

里程碑1
LOG0
2023
09-26
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
图片
表情
全部评价( 0)
推荐率 100%
推荐