基于机器学习与BERT的在线招聘欺诈检测平台

机器学习AI算法工程

共 2288字,需浏览 5分钟

 ·

2022-01-14 13:43


向AI转型的程序员都关注了这个号👇👇👇

机器学习AI算法工程   公众号:datayx



随着个人电脑使用者的增多和互联网技术的普及与发展,企业进行招聘的方式也发生了很大的改变。从早期主要是内部推荐、张贴海报,到较早期发展为在报纸、杂志、电视或广播电台上发布招聘广告,再到到外地举办大型招聘会等方式,直至现如今网络招聘的兴起,可以看出,企业愈来愈主动拓展眼界,积极向外寻找适合的人才。与此相协调的是,而今求职者在寻找合适职位时,不仅仅局限于所在地区的企业,对于网络招聘的依赖程度日益增高。网络有效地拉近了全国范围内企业与求职者的距离。招聘的网络化已成为一种普遍的招聘模式。


然而,在线招聘并非一片净土,与之相反,由于网络平台的开发性、不安全性以及相关制度和法律的不健全等等原因,在线招聘平台逐渐变成了欺骗者的“无法无天之地”。更加令人沮丧的是,如今的虚假招聘变得越来越难以与真实招聘区分开来,越来越多的求职者陷入发布虚假招聘者的圈套之中。


项目目标

  1. 具体的研究在线招聘欺诈的各个方面

  2. 提供我们使用的在线招聘数据集

  3. 详细的分析数据集,并根据数据集给出判定招聘是否虚假的参考规则集

  4. 提出给予机器学习的在线招聘欺诈检测的解决方案

  5. 提供检测的使用接口及扩展接口

  6. 如果时间及精力允许,实现一个 demo


项目原则

  1. 客观性

    保证项目从始至终进行的过程客观的看待每一个步骤

  2. 真实性

    保证项目用到的所有数据及其他信息均真实且来源可靠

  3. 有效性

    保证所有项目理论及项目成果测试有效,争取满足商业使用

  4. 易用性

    保证项目提供的数据集、源程序或者成果易于使用,项目代码尽量保证模块化、自动化,项目结构保证解耦规范

  5. 可扩展性

    保证项目成果(特别是模型训练结果及输入数据集)具有高度的可扩展性


代码 获取方式:

关注微信公众号 datayx  然后回复 招聘 即可获取。


二、项目总体分析

业务分析




系统分析



项目流程图


项目部署

由于本项目为同时对数据的向量和文本分类,使用了 Bert 作为文本编码服务,部署文本分类的环境比较大,故本仓库没有提供文本编码服务(只有一个文本分类的模型)

测试:测试向量分类可在安装好环境后直接运行 tests-vec.py 查看运行结果。如果部署好了文本编码服务也可直接运行 tests.py 查看运行结果


机器学习算法AI大数据技术

 搜索公众号添加: datanlp

长按图片,识别二维码




阅读过本文的人还看了以下文章:


TensorFlow 2.0深度学习案例实战


基于40万表格数据集TableBank,用MaskRCNN做表格检测


《基于深度学习的自然语言处理》中/英PDF


Deep Learning 中文版初版-周志华团队


【全套视频课】最全的目标检测算法系列讲解,通俗易懂!


《美团机器学习实践》_美团算法团队.pdf


《深度学习入门:基于Python的理论与实现》高清中文PDF+源码


《深度学习:基于Keras的Python实践》PDF和代码


特征提取与图像处理(第二版).pdf


python就业班学习视频,从入门到实战项目


2019最新《PyTorch自然语言处理》英、中文版PDF+源码


《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码


《深度学习之pytorch》pdf+附书源码


PyTorch深度学习快速实战入门《pytorch-handbook》


【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》


《Python数据分析与挖掘实战》PDF+完整源码


汽车行业完整知识图谱项目实战视频(全23课)


李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材


笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!


《神经网络与深度学习》最新2018版中英PDF+源码


将机器学习模型部署为REST API


FashionAI服装属性标签图像识别Top1-5方案分享


重要开源!CNN-RNN-CTC 实现手写汉字识别


yolo3 检测出图像中的不规则汉字


同样是机器学习算法工程师,你的面试为什么过不了?


前海征信大数据算法:风险概率预测


【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类


VGG16迁移学习,实现医学图像识别分类工程项目


特征工程(一)


特征工程(二) :文本数据的展开、过滤和分块


特征工程(三):特征缩放,从词袋到 TF-IDF


特征工程(四): 类别特征


特征工程(五): PCA 降维


特征工程(六): 非线性特征提取和模型堆叠


特征工程(七):图像特征提取和深度学习


如何利用全新的决策树集成级联结构gcForest做特征工程并打分?


Machine Learning Yearning 中文翻译稿


蚂蚁金服2018秋招-算法工程师(共四面)通过


全球AI挑战-场景分类的比赛源码(多模型融合)


斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


python+flask搭建CNN在线识别手写中文网站


中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程



不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

浏览 24
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报