GoHanlp多语言 NLP 库

联合创作 · 2023-09-26 05:51

GoHanlp 是多语言 NLP 库,具有中文分词 词性标注 命名实体识别 依存句法分析 语义依存分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理功能。

前言

Hanlp 是基于PyTorch和TensorFlow 2.x的面向研究人员和公司的多语言NLP库,用于在学术界和行业中推广最先进的深度学习技术。HanLP从一开始就被设计为高效,用户友好和可扩展的。它带有针对各种人类语言的预训练模型,包括英语,中文和许多其他语言。 GoHanlp 是Hanlp的api接口golang实现版本

使用方式

安装 GoHanlp

go get -u github.com/xxjwxc/gohanlp@master

使用

申请auth认证

https://bbs.hanlp.com/t/hanlp2-1-restful-api/53

  • 不认证 hanlp.WithAuth("") 请填空

文本形式

package main

import (
    "fmt"
    "github.com/xxjwxc/gohanlp/hanlp"
)

func main() {
    client := hanlp.HanLPClient(hanlp.WithAuth("")) // 你申请到的auth,auth不填则匿名
    s, _ := client.Parse("2021年HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。阿婆主来到北京立方庭参观自然语义科技公司。",
        hanlp.WithLanguage("zh"))
    fmt.Println(s)
}

对象形式

package main

import (
    "fmt"

    "github.com/xxjwxc/gohanlp/hanlp"
)

func main() {
    client := hanlp.HanLPClient(hanlp.WithAuth("")) // 你申请到的auth,auth不填则匿名
    resp, _ := client.ParseObj("2021年HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。阿婆主来到北京立方庭参观自然语义科技公司。",hanlp.WithLanguage("zh"))
    fmt.Println(resp)
}

接口说明

  • HanLPClient 中 option 是变量参数,每次调用都会带上
  • Parse... 中option 是零时参数,只在本次调用有效

更多调用API 请查看

options

更多:

xxjwxc GoHanlp options

浏览 4
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报