搜索
下载APP
KTransformers 大模型推理优化框架
认领
关注
0
粉丝
KTransformers是由清华大学的KVCache.AI团队与趋境科技联合发布的开&
知识
简介
KTransformers是由清华大学的KVCache.AI团队与趋境科技联合发布的开&...
更多
其它信息
授权协议
Apache
开发语言
Python
操作系统
Linux
软件类型
开源软件
所属分类
神经网络/人工智能、LLM(大语言模型)
开源组织
无
地区
国产
投递者
红薯
适用人群
未知
时光轴
里程碑
1
LOG
12
2025
02-26
轻识收录
打卡
我要打卡
我要打卡
评价
0.0
(满分 10 分)
0 个评分
什么是点评分
图片
表情
视频
评价
全部评价( 0)
推荐率 100%
推荐
KTransformers 大模型推理优化框架
KTransformers是由清华大学的KVCache.AI团队与趋境科技联合发布的开&
SGLang 大模型推理框架
SGLang 是一个针对大语言模型和视觉语言模型的快速服务框架&
SGLang 大模型推理框架
SGLang 大模型推理框架
0
Mooncake 大模型推理架构
月之暗面 Kimi 和清华大学 MADSys 实验室联合 9#AISoft、阿里云、华为存&
Mooncake 大模型推理架构
月之暗面Kimi和清华大学MADSys实验
fastllm高性能大模型推理库
fastllm是纯C++实现的全平台llm加速库。支持Python调用,chatglm-6B级模型单卡可达10000+token/s,支持glm、llama、moss基座,手机端流畅运行。功能概述纯C
fastllm高性能大模型推理库
fastllm 是纯 C++ 实现的全平台 llm 加速库。支持 Python 调用,chatglm
FBGEMM服务器端推理优化库
Facebook开源了FBGEMM,一个针对服务器推理优化的高性能核心库。与其他库不同,FBGEMM最大程度优化了CPU性能,通过降低精度计算来加速深度学习模型。目前Facebook已经在自己的服务中
FBGEMM服务器端推理优化库
Facebook 开源了 FBGEMM,一个针对服务器推理优化的高性能核心库。 与其他库不同,FBG
SootJava 优化框架
Soot 是一个 Java 优化框架,它能够用来分析、检测、优化及可视化 Java 和 Androi