chatgpt实现NLP基本任务(实体识别、关系抽取、属性抽取、事件抽取、文本分类)

机器学习AI算法工程

共 3037字,需浏览 7分钟

 ·

2024-04-19 11:00

向AI转型的程序员都关注了这个号👇👇👇


基础函数


一、实体识别

抽取文本:

驻港部队从1993年初开始组建,1996年1月28日组建完毕,1997年7月1日0时进驻香港,取代驻港英军接管香港防务,驻港军费均由中央人民政府负担。《中华人民共和国香港特别行政区驻军法》规定了驻香港部队的职责为防备和抵抗侵略,保卫香港特别行政区的安全以及在特别时期(战争状态、香港进入紧急状态时 )根据中央人民政府决定在香港特别行政区实施的全国性法律的规定履行职责。

代码:


结果:

驻港部队:组织机构

1993年初:时间

1996年1月28日:时间

1997年7月1日0时:时间

香港:地点

驻港英军:组织机构

中央人民政府:组织机构

中华人民共和国香港特别行政区驻军法:组织机构

防备和抵抗侵略:组织机构

保卫香港特别行政区的安全:组织机构

特别时期:时间

战争状态:时间

香港进入紧急状态时:时间

中央人民政府决定:组织机构

香港特别行政区:地点

全国性法律:组织机构


二、关系抽取

抽取文本:

糖尿病是一种常见的慢性疾病,主要症状包括多饮、多尿、乏力、体重下降等。发病人群通常是肥胖、家族病史、不良饮食习惯等高风险人群。治疗方法主要包括定期血糖检测、饮食控制、锻炼、药物治疗和胰岛素注射。治愈周期因不同患者而异,但坚持正确的治疗和生活方式改变,能有效控制病情、预防并发症的发生。

代码:


结果:

糖尿病-症状-多饮

糖尿病-症状-多尿

糖尿病-症状-乏力

糖尿病-症状-体重下降

糖尿病-发病人群-肥胖

糖尿病-发病人群-家族病史

糖尿病-发病人群-不良饮食习惯

糖尿病-治疗方法-定期血糖检测

糖尿病-治疗方法-饮食控制

糖尿病-治疗方法-锻炼

糖尿病-治疗方法-药物治疗

糖尿病-治疗方法-胰岛素注射

糖尿病-治愈周期-因不同患者而异

糖尿病-治愈周期-坚持正确的治疗和生活方式改变


三、属性抽取

抽取文本:

该款智能手机搭载高通骁龙处理器,内置5000mAh电池,支持快充功能,采用6.5英寸全高清显示屏,照方面具备6400万像素后置摄像头和1600万素前置摄像头。操作系统为Android 11,存储容量64GB,可扩展至512GB。

代码:

结果:

处理器-高通骁龙处理器

电池容量-5000mAh

功能-快充功能

屏幕尺寸-6.5英寸

分辨率-全高清

后置摄像头像素-6400万像素

前置摄像头像素-1600万像素

操作系统-Android 11

存储容量-64GB


四、事件抽取

抽取文本:

当地时间7月5日,俄罗斯铁路公司发布消息表示,俄罗斯铁路网站和移动应用程序遭受大规模黑客攻击。

代码:

结果:

事件类型:黑客攻击


事件论元:

时间-当地时间7月5日

地点-俄罗斯

事件主体-俄罗斯铁路公司

事件客体-俄罗斯铁路网站和移动应用程序

造成影响-大规模黑客攻击


五、文本分类

抽取文本:

中国国家女子足球队将于7月7日从广州出发,飞赴澳大利亚阿德莱德队伍大本营,踏上2023年女足世界杯之旅。抵达澳大利亚之后,队伍还计划于13日和17日分别与巴西国家女子足球队和哥伦比亚国家女子足球队进行热身赛。

代码:

结果:
体育

机器学习算法AI大数据技术

 搜索公众号添加: datanlp

长按图片,识别二维码




阅读过本文的人还看了以下文章:


TensorFlow 2.0深度学习案例实战


基于40万表格数据集TableBank,用MaskRCNN做表格检测


《基于深度学习的自然语言处理》中/英PDF


Deep Learning 中文版初版-周志华团队


【全套视频课】最全的目标检测算法系列讲解,通俗易懂!


《美团机器学习实践》_美团算法团队.pdf


《深度学习入门:基于Python的理论与实现》高清中文PDF+源码


《深度学习:基于Keras的Python实践》PDF和代码


特征提取与图像处理(第二版).pdf


python就业班学习视频,从入门到实战项目


2019最新《PyTorch自然语言处理》英、中文版PDF+源码


《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码


《深度学习之pytorch》pdf+附书源码


PyTorch深度学习快速实战入门《pytorch-handbook》


【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》


《Python数据分析与挖掘实战》PDF+完整源码


汽车行业完整知识图谱项目实战视频(全23课)


李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材


笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!


《神经网络与深度学习》最新2018版中英PDF+源码


将机器学习模型部署为REST API


FashionAI服装属性标签图像识别Top1-5方案分享


重要开源!CNN-RNN-CTC 实现手写汉字识别


yolo3 检测出图像中的不规则汉字


同样是机器学习算法工程师,你的面试为什么过不了?


前海征信大数据算法:风险概率预测


【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类


VGG16迁移学习,实现医学图像识别分类工程项目


特征工程(一)


特征工程(二) :文本数据的展开、过滤和分块


特征工程(三):特征缩放,从词袋到 TF-IDF


特征工程(四): 类别特征


特征工程(五): PCA 降维


特征工程(六): 非线性特征提取和模型堆叠


特征工程(七):图像特征提取和深度学习


如何利用全新的决策树集成级联结构gcForest做特征工程并打分?


Machine Learning Yearning 中文翻译稿


蚂蚁金服2018秋招-算法工程师(共四面)通过


全球AI挑战-场景分类的比赛源码(多模型融合)


斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


python+flask搭建CNN在线识别手写中文网站


中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程



不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  



浏览 137
10点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
10点赞
评论
收藏
分享

手机扫一扫分享

分享
举报