科研数据中心
宝和数据
共 5215字,需浏览 11分钟
·
2020-11-11 00:35
商品详情
商品亮点
- 科研成果数据中心通过外部标准数据接口、人工导入等多种方式,对不同格式、不同类型、不同来源的成果数据资产进行采集,并进行定期更新,便于成果数据资产的可持续存储与利用;
- 通过向学校信息化系统开放接口的方式,确保校内成果数据统一数据源,通过获取外部标准数据回滚机制完善校内数据,并实现成果数据满足信息化要求自定义字段、类型、功能自定义,使科研成果数据中心得以可持续发展
- 支持按照业务需要实现不同角色分工治理成果数据
- 平台架构采用MPP的新型数据库集群,通过列存储、粗粒度索引等多项数据处理技术,再结合MPP架构高效的分布式计算模式,有效支撑PB级别的结构化数据分析
商品说明
版本: V2.0 | 交付方式: 人工服务 |
适用于: Windows/Linux | 上架日期: 2019-10-17 |
交付SLA: 120 自然日 |
建设内容
科研成果数据中心主要按数据采集、数据治理、认领与审核平台、数据查询使用、数据统计分析展示、智慧校园对接、系统管理七个部分进行建设。
1 数据采集
1.1 多渠道数据采集
(1)外部数据采集:通过合规的数据获取途径,从机构外部标准数据源直接获取本机构2019年之前所有开放成果数据,成果数据内容包括论文、专利、项目。数据源包括:WOS(SCIE\SSCI\A&HCI\CPCI-S\CPCI-SSH)、CSCD、Scopus、PubMed、EI、CSSCI、知网、万方、维普、国家自然科学基金、国家社会科学基金。获取数据的数据源已被校方购买使用权,能够合法地使用这些数据源进行数据采集。
(2)人工填报:支持特殊资源类型、其他校内成果数据的人工填报。
(3)多渠道数据采集:平台支持校内外科研数据的采集,提供机器采集、批量导入、单篇导入等方式。
2 成果数据主体元数据
(1)基础元数据。预先定义好科研论文、专利、项目等资源类型的元数据。支持元数据定制添加。
(2)成果属性数据。包括作者贡献度(第一作者、通讯作者、其他作者位次等)、被引数据、期刊数据等。
3 数据治理
3.1 数据标准化处理
(1)采集的成果数据来自各个来源各个阶段,数据质量参差不齐,在对成果数据进行去重、指派、切分等一系列操作之前需要对成果数据进行标准化处理。
(2)平台预置了成果论文数据规范,对进入平台的成果数据都会进行评估,当发现数据不符合规范时程序会自动执行标准化。例如,对于一条期刊论文数据,进入平台后评估后,发现缺少期刊ISSN号,则系统会自动按照期刊字典通过期刊名称对ISSN号进行补充。如果该期刊未在收录库,则可进行人工校正。
3.2 数据合并去重
(1)成果数据去重是指在一个数字文件集合中,找出重复的数据并将其删除,只保存唯一的数据单元。
(2)在删除的同时,要考虑数据重建,即虽然文件的部分内容被删除,但当需要时,仍然将完整的文件内容重建出来,这就需要保留文件和唯一成果数据单元之间的索引信息。
3.3 数据关联指派
包括成果与项目、学科等数据的关联及学术论文与期刊属性的关联,以利于为发规处等职能部门进行本校学科评估时提供数据支撑。学科包括ESI学科、Scopus学科、教育部学科;期刊包括中科院分区(包括大类分区、小类分区)、ESI分区、期刊发表当年影响因子、5年影响因子、最新影响因子等。
3.4 元数据管理
支持元数据的自定义扩展。相应的元数据可抽离为元数据字典,梳理师资字典、机构字典、期刊字典、主题词表字典、项目字典等。
支持字典的规范扩展,可实现年代、国家、城市、会议等各类学术元数据字典的扩充和完善。
3.5 主数据管理
平台支持各类成果数据实体的仓储,学术主数据存储以元数据形式数据关联建模后储存在数据仓储中,能够根据学校实际数据情况及业务需求情况,定义不同的数据数据类型。
3.6 数据治理规则管理
主要包括数据获取规则管理、数据标准化规则管理、数据合并去重规则管理、数据关联指派规则管理。支持自定义调整,能够进行灵活的数据治理。
4 认领与审核平台
经过清洗指派后的科研数据推送至认领平台,学者可在认领平台实现对本人成果的认领,或学院秘书可以直接指派学者与成果的关系,结合学校管理流程,对认领的成果进行审核,经审核后的数据回流到科研数据中心,存储为标准科研数据。
4.1 成果认领
系统将成果推送到读者名下,读者登录到系统内置的认领平台进行成果认领。读者可以快速浏览成果是否为本人成果,若发现存在非本人成果,可以将成果剔除,剩下的成果可支持批量认领,如果有未推送到读者名下的成果,支持成果补缺。
(1)成果筛选
对来源、出版年、核心刊、审核状态、聚类字段进行成果筛选。
(2)单篇认领和批量认领
单篇认领:本人成果选择“认领为个人成果”;非本人成果可选择“不是我的成果”,以后数据再次更新则不会再推送给学者,系统将取消该成果与学者的对应关系。
批量认领:通过成果前的选择框,完成批量认领处理。
(3)成果剔除
不是本人成果支持删除放入回收站,回收站里的成果支持还原到待认领重新认领;
支持从回收站中彻底删除,被删除的数据以后不再推送给读者,减少读者重复认领操作。
(4)信息完善
支持编辑完善作者在论文的排名情况、作者身份、论文类型信息,并提供上传全文入口。
(5)论文补缺
支持在线检索和批量上传缺少的论文。
在线检索支持在线输入论文标题,选择数据来源检索,返回检索结果,选择目标论文进行认领。
批量上传按照平台内置的上传字段模板要求上传缺失的成果。后台定期处理完成后再推送到读者进行认领。
4.2 成果审核
按照权限分配进行审核,后台为每个学院设置科研秘书,科研秘书登录系统后只审核自己管理范围的学院的人员成果。
(1)成果审核权限,学院科研秘书审核自己管理范围内院系学者认领的成果
(2)支持两种审核方式:
成果角度审核:支持从成果的角度审核读者认领的信息,支持同一篇论文被多个人认领时,可同时审核多个人认领的信息,减少重复审核操作。
学者角度审核:支持从学者的角度审核读者认领的信息,进入读者认领的所有成果列表,只能审核当前读者的认领信息。
(3)审核通过:审核通过后给成果添加通过标签
(4)审核驳回:填写驳回原因退回给读者,读者支持查看被驳回的原因、驳回时间和驳回人员。可修改信息重新认领,提交审核
(5)审核撤回:当审核人员审核错误时,支持撤回重新审核。
4.3 学院秘书成果指派
(1)支持指派学者与成果的归属关系,减少读者的认领。
如果学者与成果归属关系正确,支持点击“馆员指派”,代表此论是属于当前作者的成果。
如果学者与成果归属关系不正确,支持点击“非他成果”,此论文会与该学者解除指派关系,不会再读者名下展示此论文。
(2)支持对成果字段信息纠错编辑。
5 数据查询使用
5.1 数据查询
支持数据按照一定规则查询。如:根据期刊影响因子5以上,发表年、类型、所在院系等多重条件查询。
5.2 数据导出
支持数据导出。支持成果按照不同组合条件灵活导出。包括按照学者角度成果导出、机构角度成果导出、成果角度(涉及发表时间、按照成果基础元数据字段、扩展字段(定制部分需与校方商定))。
6 数据统计分析展示
6.1 数据展示
科研数据浏览
对本校的科研数据进行展示。展示的内容包括:标题、所属数据库(针对论文数据)、作者、作者全称、作者机构、关键词、来源、资源类型。可对科研数据聚类筛选。
聚类包括:资源类型、数据来源、是否核心刊、年份、刊名、本校作者、本校机构、关键词以及高质量论文。
师资数据浏览
以列表的形式,展示所有的师资情况,可通过教师职称、学术头衔、年龄阶段、教师学历以及是否有海外经历对本校专任教师进行筛选,并可通过教师姓名进行精确检索;
师资详情页,展示教师的基本信息,包括教师姓名,教师现任职机构以及教师的研究热点;
展示教师的科研影响(包括教师发文数量、被引次数、H指数(一名学者的h指数是指其发表的Np篇论文中有h篇每篇至少被引h次、而其余Np-h篇论文每篇被引均小于或等于h次)等)、教师的科研贡献(包括各数据库下教师的具体发文情况与聚类分析)、教师的知识图谱情况(包括教师的研究热点、历年发文情况、合作国家、合作机构、合作作者、发文期刊等详细分析图谱)以及个人详细简历情况。
机构数据浏览
展示本校所有类型的分支机构情况,按类型展示分支机构类型下的机构列表,展示的内容包括院系机构名称、院系机构类型、下属机构数量、关联的师资数量、科研数据的数量以及人才培养的数量。
自定义实体浏览
支持自定义实体展示,包括专利、基金等本平台系统数据。
6.2 数据分析
基础统计分析:支持学者、机构、科研数据等角度的知识图谱的生成,需包括但不仅限于历年发文趋势图、研究热点云图、合作作者图谱、发文期刊图谱等。支持贡献度分析等。
7 智慧校园对接
7.1 统一身份认证对接
可以支持与XX大学统一身份认证系统对接;包括但不限于基于CAS的统一身份认证系统,实现单点登录的对接。
7.2 主数据中心对接
通过与XX大学主数据中心的对接,支撑主数据中心实现科研成果数据的进一步流转,为校内各职能部门提供可自定义的数据标准接口。贯彻“服务可选,平台可扩,数据可用”。
8 系统管理
8.1 角色管理
设立分级权限,不同系统角色使用的页面及功能模块不同,同一人可以分配多个角色。角色分根据学校要求可分多级、多类管理,可进行不同的角色设置。 用户访问时,受角色和权限的双重控制。
8.2 权限管理
包括平台权限管理以及用户权限管理。
平台权限管理包括平台各模块启用的设置。
用户权限管理基于角色组进行权限的设置。
8.3 备份管理
包括增量备份和全量备份。可对备份周期、备份时间等备份规则进行设置,可实现备份日志浏览,具休实施方案根据学校要求执行。
8.4 日志管理
包含基本任务处理日志、登录访问日志等,并提供简单的日志统计分析图展示。
科研成果数据中心主要按数据采集、数据治理、认领与审核平台、数据查询使用、数据统计分析展示、智慧校园对接、系统管理七个部分进行建设。
1 数据采集
1.1 多渠道数据采集
(1)外部数据采集:通过合规的数据获取途径,从机构外部标准数据源直接获取本机构2019年之前所有开放成果数据,成果数据内容包括论文、专利、项目。数据源包括:WOS(SCIE\SSCI\A&HCI\CPCI-S\CPCI-SSH)、CSCD、Scopus、PubMed、EI、CSSCI、知网、万方、维普、国家自然科学基金、国家社会科学基金。获取数据的数据源已被校方购买使用权,能够合法地使用这些数据源进行数据采集。
(2)人工填报:支持特殊资源类型、其他校内成果数据的人工填报。
(3)多渠道数据采集:平台支持校内外科研数据的采集,提供机器采集、批量导入、单篇导入等方式。
2 成果数据主体元数据
(1)基础元数据。预先定义好科研论文、专利、项目等资源类型的元数据。支持元数据定制添加。
(2)成果属性数据。包括作者贡献度(第一作者、通讯作者、其他作者位次等)、被引数据、期刊数据等。
3 数据治理
3.1 数据标准化处理
(1)采集的成果数据来自各个来源各个阶段,数据质量参差不齐,在对成果数据进行去重、指派、切分等一系列操作之前需要对成果数据进行标准化处理。
(2)平台预置了成果论文数据规范,对进入平台的成果数据都会进行评估,当发现数据不符合规范时程序会自动执行标准化。例如,对于一条期刊论文数据,进入平台后评估后,发现缺少期刊ISSN号,则系统会自动按照期刊字典通过期刊名称对ISSN号进行补充。如果该期刊未在收录库,则可进行人工校正。
3.2 数据合并去重
(1)成果数据去重是指在一个数字文件集合中,找出重复的数据并将其删除,只保存唯一的数据单元。
(2)在删除的同时,要考虑数据重建,即虽然文件的部分内容被删除,但当需要时,仍然将完整的文件内容重建出来,这就需要保留文件和唯一成果数据单元之间的索引信息。
3.3 数据关联指派
包括成果与项目、学科等数据的关联及学术论文与期刊属性的关联,以利于为发规处等职能部门进行本校学科评估时提供数据支撑。学科包括ESI学科、Scopus学科、教育部学科;期刊包括中科院分区(包括大类分区、小类分区)、ESI分区、期刊发表当年影响因子、5年影响因子、最新影响因子等。
3.4 元数据管理
支持元数据的自定义扩展。相应的元数据可抽离为元数据字典,梳理师资字典、机构字典、期刊字典、主题词表字典、项目字典等。
支持字典的规范扩展,可实现年代、国家、城市、会议等各类学术元数据字典的扩充和完善。
3.5 主数据管理
平台支持各类成果数据实体的仓储,学术主数据存储以元数据形式数据关联建模后储存在数据仓储中,能够根据学校实际数据情况及业务需求情况,定义不同的数据数据类型。
3.6 数据治理规则管理
主要包括数据获取规则管理、数据标准化规则管理、数据合并去重规则管理、数据关联指派规则管理。支持自定义调整,能够进行灵活的数据治理。
4 认领与审核平台
经过清洗指派后的科研数据推送至认领平台,学者可在认领平台实现对本人成果的认领,或学院秘书可以直接指派学者与成果的关系,结合学校管理流程,对认领的成果进行审核,经审核后的数据回流到科研数据中心,存储为标准科研数据。
4.1 成果认领
系统将成果推送到读者名下,读者登录到系统内置的认领平台进行成果认领。读者可以快速浏览成果是否为本人成果,若发现存在非本人成果,可以将成果剔除,剩下的成果可支持批量认领,如果有未推送到读者名下的成果,支持成果补缺。
(1)成果筛选
对来源、出版年、核心刊、审核状态、聚类字段进行成果筛选。
(2)单篇认领和批量认领
单篇认领:本人成果选择“认领为个人成果”;非本人成果可选择“不是我的成果”,以后数据再次更新则不会再推送给学者,系统将取消该成果与学者的对应关系。
批量认领:通过成果前的选择框,完成批量认领处理。
(3)成果剔除
不是本人成果支持删除放入回收站,回收站里的成果支持还原到待认领重新认领;
支持从回收站中彻底删除,被删除的数据以后不再推送给读者,减少读者重复认领操作。
(4)信息完善
支持编辑完善作者在论文的排名情况、作者身份、论文类型信息,并提供上传全文入口。
(5)论文补缺
支持在线检索和批量上传缺少的论文。
在线检索支持在线输入论文标题,选择数据来源检索,返回检索结果,选择目标论文进行认领。
批量上传按照平台内置的上传字段模板要求上传缺失的成果。后台定期处理完成后再推送到读者进行认领。
4.2 成果审核
按照权限分配进行审核,后台为每个学院设置科研秘书,科研秘书登录系统后只审核自己管理范围的学院的人员成果。
(1)成果审核权限,学院科研秘书审核自己管理范围内院系学者认领的成果
(2)支持两种审核方式:
成果角度审核:支持从成果的角度审核读者认领的信息,支持同一篇论文被多个人认领时,可同时审核多个人认领的信息,减少重复审核操作。
学者角度审核:支持从学者的角度审核读者认领的信息,进入读者认领的所有成果列表,只能审核当前读者的认领信息。
(3)审核通过:审核通过后给成果添加通过标签
(4)审核驳回:填写驳回原因退回给读者,读者支持查看被驳回的原因、驳回时间和驳回人员。可修改信息重新认领,提交审核
(5)审核撤回:当审核人员审核错误时,支持撤回重新审核。
4.3 学院秘书成果指派
(1)支持指派学者与成果的归属关系,减少读者的认领。
如果学者与成果归属关系正确,支持点击“馆员指派”,代表此论是属于当前作者的成果。
如果学者与成果归属关系不正确,支持点击“非他成果”,此论文会与该学者解除指派关系,不会再读者名下展示此论文。
(2)支持对成果字段信息纠错编辑。
5 数据查询使用
5.1 数据查询
支持数据按照一定规则查询。如:根据期刊影响因子5以上,发表年、类型、所在院系等多重条件查询。
5.2 数据导出
支持数据导出。支持成果按照不同组合条件灵活导出。包括按照学者角度成果导出、机构角度成果导出、成果角度(涉及发表时间、按照成果基础元数据字段、扩展字段(定制部分需与校方商定))。
6 数据统计分析展示
6.1 数据展示
科研数据浏览
对本校的科研数据进行展示。展示的内容包括:标题、所属数据库(针对论文数据)、作者、作者全称、作者机构、关键词、来源、资源类型。可对科研数据聚类筛选。
聚类包括:资源类型、数据来源、是否核心刊、年份、刊名、本校作者、本校机构、关键词以及高质量论文。
师资数据浏览
以列表的形式,展示所有的师资情况,可通过教师职称、学术头衔、年龄阶段、教师学历以及是否有海外经历对本校专任教师进行筛选,并可通过教师姓名进行精确检索;
师资详情页,展示教师的基本信息,包括教师姓名,教师现任职机构以及教师的研究热点;
展示教师的科研影响(包括教师发文数量、被引次数、H指数(一名学者的h指数是指其发表的Np篇论文中有h篇每篇至少被引h次、而其余Np-h篇论文每篇被引均小于或等于h次)等)、教师的科研贡献(包括各数据库下教师的具体发文情况与聚类分析)、教师的知识图谱情况(包括教师的研究热点、历年发文情况、合作国家、合作机构、合作作者、发文期刊等详细分析图谱)以及个人详细简历情况。
机构数据浏览
展示本校所有类型的分支机构情况,按类型展示分支机构类型下的机构列表,展示的内容包括院系机构名称、院系机构类型、下属机构数量、关联的师资数量、科研数据的数量以及人才培养的数量。
自定义实体浏览
支持自定义实体展示,包括专利、基金等本平台系统数据。
6.2 数据分析
基础统计分析:支持学者、机构、科研数据等角度的知识图谱的生成,需包括但不仅限于历年发文趋势图、研究热点云图、合作作者图谱、发文期刊图谱等。支持贡献度分析等。
7 智慧校园对接
7.1 统一身份认证对接
可以支持与XX大学统一身份认证系统对接;包括但不限于基于CAS的统一身份认证系统,实现单点登录的对接。
7.2 主数据中心对接
通过与XX大学主数据中心的对接,支撑主数据中心实现科研成果数据的进一步流转,为校内各职能部门提供可自定义的数据标准接口。贯彻“服务可选,平台可扩,数据可用”。
8 系统管理
8.1 角色管理
设立分级权限,不同系统角色使用的页面及功能模块不同,同一人可以分配多个角色。角色分根据学校要求可分多级、多类管理,可进行不同的角色设置。 用户访问时,受角色和权限的双重控制。
8.2 权限管理
包括平台权限管理以及用户权限管理。
平台权限管理包括平台各模块启用的设置。
用户权限管理基于角色组进行权限的设置。
8.3 备份管理
包括增量备份和全量备份。可对备份周期、备份时间等备份规则进行设置,可实现备份日志浏览,具休实施方案根据学校要求执行。
8.4 日志管理
包含基本任务处理日志、登录访问日志等,并提供简单的日志统计分析图展示。
用户案例
浙江大学 科研数据管理平台(一期)
1)实现浙大科研数据一张表(对接校园主数据中心,摸家底) 2)为浙大学科决策提供数据支撑依据(学科监控及规划等),例如快速构建某学科领域下科研团队、快速查询某学科领域科研团队的师资队伍、科学研究情况。 3)为浙大各职能部门院所业务开展提供科研数据支撑(业务流程数据源之一) 4)为浙大师生提供全面的科研数据个人档案服务(个人科研名片) 5)促成浙大科研数据可持续性建设与维护 6)成为浙大信息化建设、双一流学科建设的有力工具
南京农业大学人事绩效、科研数据中心
1)助力南京农业大学顺利完成2018全校绩效考核; 2)构建了考核方案配置、科研数据管理、我的科研工作量、科研积点详情查询和用户授权管理等五大功能模块,核算数据项涉及科研项目、学术论文等10类科研数据类目; 3)实现了论文、专利、基金项目、软件著作权、植物新品种、新药品等多类型科研成果数据的采集与治理。 4)完成教学工作量数据采集与定量计算系统。共涉及四类业务流程,18个单项业务子系统(不含农技推广工作量计算)。数据内容涉及基地建设、教学研究、课程建设、课程工作量、指导学生竞赛、教材建设、团队建设、专业建设、工作量定额、指导青年教师、指导研究生、教学效果系数、文化素质、文献综述、SRT; 5)考核方案配置灵活,不同学院可自由设定各项考核指标的参数值; 6)利用绩效考核作为抓手,倒推优化现有业务系统的工作流程及数据质量,形成“协助数据治理”的观念。
北京邮电大学一流学科服务平台(一期)
1)构建了学科数据中心,为学校学科决策规划提供数据支持,例如某学科进入ESI前1‰,利用WOS发文数据分析校内与计算机学科相关的所有二级学院的贡献度。利用论文期刊分布,找出各学科友好期刊,激励师生发文。按照中科院分区,查找4区论文。 2)提供学位点申报服务,进行新学位点申报时将各项指标数据与国家标准要求进行对比;分析当前某个学位点建设情况,找出不足进行针对性加强。 3)提供学科群服务,实现大型交叉学科团队的创建。
南京医科大学科研数据服务
致力于科研层面的数据服务,通过专业的科研成果数据治理为该校的易普拉格科研管理系统提供成果数据方面的支撑,避免由于学校规模较大,填报数据人数较多造成的数据收集时间长、数据质量差等问题。
北京理工大学科研数据中心、绩效考核系统
1)科研数据中心应包含科研成果数据采集、科研成果数据处理、科研成果数据仓储、科研成果数据查询使用、科研成果数据更新、科研成果数据管理与审核以及系统管理等功能。 2)根据学校考核办法,从教师教学工作量、服务工作量、科研工作量和其他新增工作量等四个方面统计核算教师工作量。 3)考核方案配置灵活,不同学院可自由设定各项考核指标的参数值;
评论