AudioLDM2文本转音频/音乐生成认领

0粉丝

AudioLDM2 支持文本到音频（包括音乐）和文本到语音生成。目前支持：添加文本转语音 checkpoint支持生成更长的音频（>10s）优化模型的推理速度。与 Diffusers 库集成（参阅 Diffusers）预训练模型可以通过设置“model_name”来选择模型 checkpoin

简介

AudioLDM2 支持文本到音频（包括音乐）和文本到语音生成。目前支持：添加文本转语音 checkpoint支持生成更长的音频（>10s）优化模型的推理速度。与 Diffusers 库集成（参阅 Diffusers）预训练模型可以通过设置“model_name”来选择模型 checkpoin... 更多

技术信息

开源协议

CC BY-NC-ND 4.0

开发语言

Python

操作系统

跨平台

软件类型

开源软件

所属分类

神经网络/人工智能、 LLM（大语言模型）

开源组织

无

地区

不详

适用人群

未知

时光轴

里程碑1

LOG0

2023

09-26

轻识收录

打卡

评价

0.0（满分 10 分）0 个评分

什么是点评分

图片

表情

全部评价( 0)

推荐率 100%

推荐

Bark文本提示生成音频模型

Bark是由Suno创建的基于转换器的文本到音频模型。Bark可以生成高度逼真的多语言语音以及其他音频-包括音乐、背景噪音和简单的音效。该模型还可以产生非语言交流，如大笑、叹息和哭泣。为了支持研究社区

Bark文本提示生成音频模型

Bark 是由 Suno 创建的基于转换器的文本到音频模型。Bark 可以生成高度逼真的多语言语音以

Texen文本生成工具

Texen是一种通用的文字生成工具。能够生产几乎任何种类的文本输出。提供一个Ant的任务，Texen使用一个控制模板，以及一些可选的worker模板，用来控制和管理输出。控制模板示例：#*file:C

Processus文本生成工具

Processus是一个灵活而且强大的文本生成工具。包含各种生成策略：生成HTML、JSON和其他递归文本数据结构生成随机的单词、语句甚至是故事创建强密码生成字符名称和其他属性对字符串进行过滤从数据集

Texen文本生成工具

Texen是一种通用的文字生成工具。能够生产几乎任何种类的文本输出。提供一个Ant的任务， Texe

Processus文本生成工具

Processus 是一个灵活而且强大的文本生成工具。包含各种生成策略：生成 HTML、JSON 和

Siren基于文本的音频播放器

Siren 是一个基于文本的音频播放器，用于 Linux/Unix 系统。支持 Ogg Vorbis

Siren基于文本的音频播放器

Siren是一个基于文本的音频播放器，用于Linux/Unix系统。支持OggVorbis,MP3,FLAC,WavPack,WAVE,AIFF等格式，通过sndio、PulseAudio、ALSA、

Audiocraft音频生成深度学习库

Audiocraft是用于音频生成的深度学习库。它使用深度学习进行音频处理和生成，具有最先进的EnCodec音频压缩器/分词器，以及MusicGen——简单且可控的音乐生成大模型，具有文本和旋律调节功

Audiocraft音频生成深度学习库

Audiocraft 是用于音频生成的深度学习库。它使用深度学习进行音频处理和生成，具有最先进的 E