Sockeye基于 Apache MXNet 的神经机器翻译框架
Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如,通过符号式和命令式 MXNet API,Sockeye 结合了陈述式和命令式编程风格;它同样可以在多块 GPU 上并行训练模型。
Sockeye:为使用 MXNet 的机器翻译进行序列到序列建模
Sockeye 实现了 MXNet 上当前最佳的序列到序列模型。它同样为所有序列到序列模型的超参数提供恰当的默认值。对于优化,无需担心停止标准、指标跟踪或者权重初始化。可以简单地运行已提供的训练命令行界面(CLI),也可以轻易改变基础模型架构,比如:
RNN 单元类型(LSTM 或 GRU)和隐藏状态大小
RNN 层的数量
源序列和目标序列嵌入的大小
应用于源编码的注意力机制的类型
Sockeye 同样有其他更高级的功能,比如:
束搜索推理
多模型的简单集成
RNN 层之间的残差链接
输出层预测的词汇偏倚
门控语境(Context gating)
交叉熵标签平滑
层归一化
为了训练,Sockeye 允许使用者完全掌控重要的优化参数。例如,使用者可以设置优化器类型、学习率、动量、权重衰减和提前停止条件。Sockeye 跟踪了训练和验证数据上的多个指标(包括专门针对机器翻译的指标,比如 BLEU)。
评论
MarianC++ 实现的神经机器翻译框架
Marian是一个用纯C++编写的高效神经机器翻译框架,具有最小依赖性。以纪念波兰数学家和密码学家MarianRejewski的名字命名。特点纯C++实现一个用于GPU/CPU训练和解码的引擎GPU/
MarianC++ 实现的神经机器翻译框架
0
THUMT神经机器翻译工具包
THUMT是由清华大学自然语言处理组开发的数据驱动机器翻译系统。机器翻译是一种自然语言处理任务,其目的是使用计算机自动翻译自然语言。近几年来,端到端的神经机器翻译发展迅速,已经成为机器翻译系统的新主流
THUMT神经机器翻译工具包
0
Apache Turbine基于 Servlet 的框架包
ApacheTurbine是一个基于Servlet的框架包,可让经验丰富的Java开发人员快速构建Web应用程序。Turbine允许你使用个性化网站并使用用户登录名来限制对应用程序某些部分的访问。Tu
Apache Turbine基于 Servlet 的框架包
0
Apache Turbine基于 Servlet 的框架包
Apache Turbine 是一个基于 Servlet 的框架包,可让经验丰富的Java开发人员快
Apache Turbine基于 Servlet 的框架包
0
Fairseq基于卷积神经网络的机器翻译
Fairseq使用一种全新的卷积神经网络(CNN)进行语言翻译,结果以9倍于以往循环神经网络(CNN)的速度实现了目前最高准确率。它在单个机器上实现多GPU训练,并在CPU和GPU上实现快速搜索。Fa
Fairseq基于卷积神经网络的机器翻译
0
Apache GoraNoSQL 的 ORM 框架
Gora是一个应用于NoSQL数据库的ORM框架,支持包括:ApacheHBase/ApacheCassandra
Apache GoraNoSQL 的 ORM 框架
0