THUMT神经机器翻译工具包
THUMT 是由清华大学自然语言处理组开发的数据驱动机器翻译系统。
机器翻译是一种自然语言处理任务,其目的是使用计算机自动翻译自然语言。近几年来,端到端的神经机器翻译发展迅速,已经成为机器翻译系统的新主流。
THUMT 是用于神经机器翻译的开源工具包,构建于 Theano 之上,具有以下特点:
基于 Attention 的翻译模型。 THUMT 应用了标准的 attention 编码器-解码器框架。
最低风险训练。除了标准最大似然估计(MLE)之外,THUMT 还支持最小风险训练(MRT),其目的是找到一组模型参数,以最小化使用训练数据评估指标(如 BLEU)计算的预期损失。
使用单一语言语料库:THUMT 为 NMT 提供了半监督训练(SST)能力,能够利用丰富的单语语料库资源来改善源-目标和目标-源 NMT 模型的学习。
可视化。为了更好地了解 NMT 的内部工作,THUMT 提供了一个可视化工具来演示每个中间状态与其相关语境之间的相关性。
评论
MarianC++ 实现的神经机器翻译框架
Marian是一个用纯C++编写的高效神经机器翻译框架,具有最小依赖性。以纪念波兰数学家和密码学家MarianRejewski的名字命名。特点纯C++实现一个用于GPU/CPU训练和解码的引擎GPU/
MarianC++ 实现的神经机器翻译框架
0
Sockeye基于 Apache MXNet 的神经机器翻译框架
Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代
Sockeye基于 Apache MXNet 的神经机器翻译框架
0
Sockeye基于 Apache MXNet 的神经机器翻译框架
Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如,通过符号式和命令式 MXNet API,Sockeye
Sockeye基于 Apache MXNet 的神经机器翻译框架
0
Sanzang机器翻译平台
Sanzang是一个紧凑简单的跨平台机器翻译系统。特别为翻译CJK语言所涉及(Chinese,Japanese,andKorean),特别适用那些与古文打交道的人,用户可自行开发自己的翻译规则,系统使
Sanzang机器翻译平台
0