简介
AudioLDM2 支持文本到音频(包括音乐)和文本到语音生成。目前支持:添加文本转语音 checkpoint支持生成更长的音频(>10s)优化模型的推理速度。与 Diffusers 库集成(参阅 Diffusers)预训练模型可以通过设置“model_name”来选择模型 checkpoin... 更多
其它信息
地区
不详
开发语言
Python
开源组织
无
所属分类
神经网络/人工智能、 LLM(大语言模型)
授权协议
CC BY-NC-ND 4.0
操作系统
跨平台
收录时间
2023-09-26
软件类型
开源软件
适用人群
未知
时光轴
里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
全部评价(
0)
推荐率
100%
推荐
Bark文本提示生成音频模型
Bark是由Suno创建的基于转换器的文本到音频模型。Bark可以生成高度逼真的多语言语音以及其他音频-包括音乐、背景噪音和简单的音效。该模型还可以产生非语言交流,如大笑、叹息和哭泣。为了支持研究社区
Bark文本提示生成音频模型
0
Texen文本生成工具
Texen是一种通用的文字生成工具。能够生产几乎任何种类的文本输出。提供一个Ant的任务,Texen使用一个控制模板,以及一些可选的worker模板,用来控制和管理输出。控制模板示例:#*file:C
Texen文本生成工具
0
Processus文本生成工具
Processus是一个灵活而且强大的文本生成工具。包含各种生成策略:生成HTML、JSON和其他递归文本数据结构生成随机的单词、语句甚至是故事创建强密码生成字符名称和其他属性对字符串进行过滤从数据集
Processus文本生成工具
0
Siren基于文本的音频播放器
Siren是一个基于文本的音频播放器,用于Linux/Unix系统。支持OggVorbis,MP3,FLAC,WavPack,WAVE,AIFF等格式,通过sndio、PulseAudio、ALSA、
Siren基于文本的音频播放器
0