Ecoute实时转录工具
Ecoute 是一种实时转录工具,可在文本框中为用户的麦克风输入 (You) 和用户的扬声器输出 (Speaker) 提供实时转录。它还使用 OpenAI 的 GPT-3.5 生成建议的响应,供用户根据对话的实时转录说出。
Ecoute 旨在通过提供实时转录和生成上下文相关的响应来帮助用户进行对话。通过利用 OpenAI 的 GPT-3.5 的强大功能,Ecoute 旨在使通信更加高效和愉快。
要求:
- Python 3.x
- 一个 OpenAI API key
- Windows OS (未在其他操作系统上测试)
- FFmpeg
虽然 Ecoute 提供实时转录和响应建议,但其功能还存在几个已知限制:
- 默认麦克风和扬声器: Ecoute 当前配置为仅收听系统中设置的默认麦克风和扬声器。它不会检测来自其他设备或系统的声音。如果你想使用不同的麦克风或扬声器,需要在系统设置中将其设置为默认设备。
- Whisper 模型:使用 Whisper ASR 模型的“tiny”版本,因为它的资源消耗低且响应时间快。但是,此模型在转录某些类型的语音(包括口音或不常用词)时可能不如较大的模型准确。
- 语言:Ecoute 中使用的 Whisper 模型设置为英语。因此,它可能无法准确转录非英语语言或方言。项目团队正在积极努力为程序的未来版本添加多语言支持。
评论