使用Python三步完成文本到语音的转换
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
一篇文章带你了解文本到语音转换步骤
在《这篇文章》中,我们有简单提到“文本语音转换”的相关内容,本文将继续讲述其详细实现步骤。
这里小编将介绍文本到语音翻译的基础知识。简要介绍文本语音转换,然后介绍如何开始安装Google文本语音转换(gTTS)模块。然后继续了解gTTS模块的工作原理,并编写一个简单的程序以更好地掌握总体概念。最后将探索更多有关使用此模块可以完成的工作的想法,然后尝试理解可以使用gTTS完成的许多实际用例。
P.S 本文将通过互联网使用Google API进行文本到语音的翻译,所以请大家保持网络连接正常。
注意:这是语言建模教程的第一部分。在本教程系列中,我们将介绍如何使用gTTS进行语音转换,光学字符识别,深度学习模型(如序列到注意力序列模型)以及其他有趣的东西。
TTS简介
文本语音转换(TTS)是将单词转换为语音形式的过程。程序,工具或软件从用户处获取输入文本,并使用自然语言处理方法来理解所用语言的语言学,并对文本进行逻辑推断。该处理后的文本被传递到下一个块,在该块中对处理后的文本执行数字信号处理。经过一些算法的处理,最终转换为语音格式。这整个过程涉及语音的合成。下面是一个简单的流程框图,可以帮助理解上述过程。
乍一看,这似乎是一个相当复杂的过程,但是有了python和gTTS模块,该过程可以简化为仅仅几行代码。从框图中了解到,首先通过自然语言处理对传递的文本进行预处理,然后使用数字信号处理将其转换为语音。
事不宜迟,让我们快速开始~
安装gTTs模块:
在本教程的其余部分中都将使用python。请保证电脑中有安装Python哦~
gTTS模块的安装非常简单,可以在命令提示符中使用以下命令来完成:
pip install gTTS
转换:
安装完成后,我们可以继续编写一个非常简单的程序,以了解如何使用此模块将输入的文本转换为语音。 来看一下我们的示例程序:
from gtts import gTTS
text = "Hello! My name is Bharath."
tts = gTTS(text)
tts.save("hi.mp3")
gTTS(Google文本语音转换)是一个Python库和CLI工具,可与Google的文本语音转换API进行交互。我们将从gtts模块导入gTTS库,并用该库进行语音翻译。
文本变量是用于存储用户输入的字符串。文本可以替换为引号内的任何内容。另一种方法是在每次运行程序时使用input语句让用户自己输入。上述过程可按如下方式进行:
text = input("Enter your text: ")
tts = gTTS(text)
tts.save("user_input.mp3")
tts变量用于对用户的输入执行Google文本到语音转换。转换后的文本以语音形式存储在tts变量中。
tts.save函数允许以声音格式文件的形式来保存转换后得到的语音。在这里保存为一个名为user_inpurt,格式为.mp3的文件。当然也可以使用其他格式,如.wav等。
经过上述步骤已成功完成文件的保存。
读取:
1. 直接从文件夹运行保存的文件:可以在运行python程序的同一文件夹下找到保存的文件,并且直接播放。
2. 使用Python中的OS模块:使用python的OS模块直接从程序中运行文件。这样做的命令如下:
import os
os.system("user_input.mp3")
3. 使用playsound模块:playsound模块可以用一个简单的命令"pip install playsound"安装,然后使用以下命令继续播放文件中的音频:
from playsound import playsound
os.system("user_input.mp3")
结论:
gTTS模块也可以广泛用于其他语言,例如法语,德语,印地语等。当存在通信障碍并且用户无法将其消息传达给人们时,这个模块就显得非常有用了。文字转语音对视力障碍者或其他残疾人士也有很大的帮助,因为它可以通过协助文字到语音的翻译来帮助他们。
· END ·