LIST | 社科(经管)可用数据集列表
大邓和他的Python
共 2317字,需浏览 5分钟
· 2024-04-14
个人感觉博客 textdata.cn 优质数据集都集中在这里了,我将内容按大类分成
- 用户层面
- 企业层面
- 政府社会层面
- 词向量资源
- 词典资源
用户层面
2T数据集 | 使用GH Archive获取Github社区用户数据
数据集 | 3.3万 Instagram Influencer的 1018万条推文数据
企业层面
数据集(付费) | 中国裁判文书网(2010-2021) 数据集(付费) | 36330条上市公司仲裁数据(2000-2021)
数据集(付费) | 3.9G全国POI地点兴趣点数据集 数据集(付费) | 2.49亿条中国工商注册企业信息(23.9更新)
数据集(付费) | 5.6亿条海关数据集(2000-2021.3 已统一商品hs编码)
数据集(付费) | 3571万条专利申请数据集(1985-2022年)
数据集(付费) | 专利转让数据集(1985-2021)
数据集(付费) | 上市公司 208 万条专利数据集 (1991-2022)
数据集(付费) | 2001-2022年A股上市公司年报&管理层讨论与分析
词向量(付费) | 使用MD&A2001-2022语料训练Word2Vec模型
数据集(付费) | 2014年-2022年监管问询函
数据集(付费) | 2006年-2022年企业社会责任报告 数据集(付费) | 84w条业绩说明会问答数据(2005-2023)
数据集 | 使用Python对27G招股说明书进行文本分析
数据集 | 70G上市公司定期报告数据集
数据集 | 2007-2021年A股上市公司年度报告(txt文件)
数据集 | 上市公司高管违规数据(2008-2022)
数据集 | 2007-2021年上市公司「委托贷款公告」
数据集 | 90w条中国上市公司高管数据
政府社会层面
数据集(付费) | 人民日报/经济日报/光明日报 等 7 家新闻数据集 数据集(付费) | 372w政府采购合同公告明细数据(2024.03)
数据集 | 众筹金融投资平台kiva借贷数据
数据集 | cctv新闻联播文稿数据 数据集 | 人民网政府留言板原始文本(2011-2023.12)
数据集 | 2024年中国全国5级行政区划(省、市、县、镇、村)
数据集 | 行政区划代码历史沿革数据集
词向量资源
预训练模型(付费) | 使用1000w专利摘要训练word2vec模型,可用于开发词典
NLP资源 | 汽车、金融等9大领域预训练词向量模型下载资源
词典资源
DomainWordsDict | 领域词库构建方法与68领域、916万级专业词库分享
Google Books Ngram Viewer显示英文词汇历史使用趋势
评论
CVPR 2024|大视觉模型的开山之作!无需任何语言数据即可打造大视觉模型
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨科技猛兽编辑丨极市平台极市导读 本文提出一种序列建模 (sequential modeling) 的方法,不使用任何语言数据,训练大视觉模型。本文目录1 序列建模打造大视觉模型(来自 UCB,Johns Hopki
小白学视觉
0
CVPR 2024|大视觉模型的开山之作!无需任何语言数据即可打造大视觉模型
↑ 点击蓝字 关注极市平台作者丨科技猛兽编辑丨极市平台极市导读 本文提出一种序列建模 (sequential modeling) 的方法,不使用任何语言数据,训练大视觉模型。>>加入极市CV技术交流群,走在计算机视觉的最前沿本文目录1 序列建模打造大视觉模型(来自 U
极市平台
1
人工智能周刊#18:微软发布手机端大模型、Llama 3 中文模型列表、苹果开源新项目、
主打尊重隐私的搜索引擎 duckduckgo,也推出了 ai chat 服务,可以使用 chatgpt 或者 claude机器学习周刊:关注 Python、机器学习、深度学习、大模型等硬核技术本期目录:1、Qwen1.5-110B:Qwen1.5 系列的首个千亿参数开源模型2、苹果开源
机器学习算法与Python实战
0
21.3K star!推荐一款可视化自动化测试/爬虫/数据采集神器!功能免费且强大!
【温馨提示】由于公众号更改了推送规则,不再按照时间顺序排列,如果不想错过测试开发技术精心准备的的干货文章,请将测试开发技术设为“星标☆”,看完文章在文尾处点亮“在看”!大家好,我是狂师!在大数据时代,信息的获取与分析变得尤为重要。对于开发者、数据分析师乃至非技术人员来说,能够高效地采集网络数据并进行
测试开发技术
4
Python列表知识应知应会
点击上方“Go语言进阶学习”,进行关注回复“Go语言”即可获赠从入门到进阶共10本电子书今日鸡汤只在此山中,云深不知处。一、前言 在Python程序开发中,列表(List)经常会使用。假设一个班里有50个学生现需要统计每一个学生的总成绩情况,如果不使用列
Go语言进阶学习
0
小美播报|3月IPTV数据排行榜发布!
小美播报3月IPTV数据排行榜:《与凤行》登顶连续剧榜榜首拥有4.05亿家庭用户的中国IPTV平台已经成为国内主流视听平台,IPTV平台数据对视听产业各环节都具有重要意义。截至2024年4月,全国已有29个省级IPTV加入“看中国”,覆盖全国超2.25亿户家庭、辐射近7亿人。点击查看详情湖南广电与马
流媒体网
0
4款最新可用的老牌 KMS 工具,亲测完美激活!
对于没有激活的Windows、Office系列产品的电脑,确实有点难用!例如没有激活的Windows电脑,大大的图标水印提示需要激活!例如没有激活的Office产品,根本没有办法编辑。为了解决激活Windows、激活office、还有Windows家庭版升级专业版。这里给大家推荐4款亲测有效的KMS
dotNET全栈开发
10
python读取一个文件里面几百个csv数据集然后按照列名合并一个数据集
点击上方“Python爬虫与数据挖掘”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤但使龙城飞将在,不教胡马度阴山。大家好,我是Python进阶者。一、前言前几天在Python最强王者交流群【FiNε_】问了一个Python自动化办公,问题如下:python 读取一个文
Python爬虫与数据挖掘
3