LASER可探索大量多语言句子表征形式的工具

联合创作 · 2023-09-25 21:31

LASER 是个计算和使用多语言句子嵌入的库,为的是加速自然语言处理在多语言上进行的零样本迁移。

LASER 拥有以下优势:

  • 极快的性能,能在 GPU 上每秒处理多达 2000 个句子。

  • 句子编码器是在 PyTorch 中实现的,只需要很少的外部依赖。

  • 资源有限的语言可以从多个语言的联合训练中受益。

  • 该模型支持在一个句子中使用多种语言。

  • 随着新语言的加入,系统会学习识别其语系特征,从而使相关性能有所提高。

浏览 5
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报