精选| 2021年2月R新包推荐(第51期)

生信宝典

共 3161字,需浏览 7分钟

 ·

2021-03-30 22:25

译:黄小伟,资深大数据分析从业者。目前就职杭州有赞数据分析团队!

知乎专栏:中国R语言社区、R语言中文社区 |25,000+关注
知乎圈子:数据分析圈|11,000+加入

2021年2月,243个R新包收录于CRAN(2021年1月份收录230个),累计收录18,483个R包!此次选摘了40个R包(12个类别),分布结构如下:

以下是本期(总第51期)R新包的核心功能介绍:

一. 计算方法

1. blaster: 实现一种高效的(类似于BLAST)序列比较算法,该算法以C ++ 11编写.
2. rando: 提供比内置函数更能感知上下文的随机数生成函数.

二. 数据

1. AWAPer: 提供来自澳大利亚气象局水资源可用性项目的全澳大利亚集水区加权气候数据NetCDF文件.

2. caRecall: 提供对加拿大政府车辆召回数据库的API访问,该数据库由缺陷调查和召回部门用于车辆、轮胎和儿童汽车座椅.

3. geofi: 提供在R中读取芬兰开放地理空间数据的工具.

4. hockeystick: 为非气候专家提供获取基本气候变化数据集的工具。用户可以从权威渠道下载最新的原始数据,并通过预定义的ggplot2图表进行查看。数据集包括大气CO2、仪器和代理温度记录、海平面、北极/南极海冰和古气候数据.

5. votesmart: 实现对Project VoteSmart API的封装.

三. 金融

1. PriceIndices: 提供计算双边和多边指数的函数。有关详细信息请参见:de Haan和Krsinich(2017)以及Diewert和Fox(2020).
2. treasuryTR: 根据固定期限的债券收益率数据(例如报告的国库券收益率)生成总收益(TR),这可为商业产品提供替代方案.


四. 游戏

1. pixelpuzzle: 实现一个益智游戏,可以在R控制台中玩.


五. 基因组学

1. CDSeq: 提供同时使用批量测序数据估计细胞类型特异性基因表达谱和样本特异性细胞类型比例的函数.

2. ClusTorus: 提供各种工具,用于在圆环体上对多变量数据进行聚类,同时包括对常用聚类方法(如k-均值聚类、成对角度距离)的角度调整.

3. dsb: 提供了一种基于液滴的单细胞实验中蛋白质表达数据的标准化和去噪方法.


六. 机器学习

1. besridge: 使用Wen等人(2020)提出的原始-对偶活动集算法,提供在高维数据的复杂情况下执行岭回归的函数.

2. ROCket: 提供估计接收器工作特性(ROC)曲线和曲线下面积(AUC)计算的函数,能够区分两种类型的ROC曲线表示形式:1)参数曲线-真实正率(TPR)和错误正率(FPR)为 得分参数的函数;2)函数曲线-TPR是FPR的函数.

3. wordpiece: 提供在给定适当词汇表的情况下,对输入文本应用词条标记化的函数.

七. 数学

1. fractD: 用盒计数法估计二维和三维(切片)图像中黑色区域的分形维数.

2. spacefillr: 生成随机和准随机的空间填充序列,包括Halton、Sobol和其他错误分布为各种类型抖动蓝色噪声的序列.

3. tensorsign: 提出了一种基于符号序列的非参数张量完备化算法,Lee和Wang(2021)中描述了采用交替优化方法解决加权分类问题的算法.

八. 医药领域

1. bhmbasket: 提供使用贝叶斯层次模型和贝叶斯决策规则评估具有二进制端点试验设计的函数.
2. bp: 通过为研究人员提供描述性和可视化工具,提供有助于分析各种形式的血压数据的函数.

3. CHOIRBM: 提供用于可视化通过“协作健康结果信息注册表”(Collaborative Health Outcours Information Registry CHOIR)收集的体图数据的函数.

4. QDiabetes: 通过使用ClinRisk得出的风险预测算法,可以计算患2型糖尿病的风险.
5. SteppedPower: 提供纵向混合模型的功率和样本量计算、设计诊断工具,重点是使用Hussey和Hughes(2007)中介绍的方法和Li等人(2020)中讨论的扩展进行阶梯楔设计.

九. 网络图形

1. bnmonitor: 实现了贝叶斯网络的灵敏度和鲁棒性方法,包括通过各种协变方案进行参数变化、计算灵敏度函数以及通过距离和发散量量化两个贝叶斯网络的不同性的方法.

2. iconr: 提供使用网络和空间分析研究考古图像数据集(岩画、陶艺装饰、石碑等)的方法.

3. MLVSBM: 提供使用随机块模型框架对多级网络进行模拟、推理和聚类的函数,如Chabert-Liddell等人所述.
4. motifr: 提供分析多层次网络(将多个网络结合在一起的网络,例如社会生态网络)基序(节点和边的小配置)的工具.

十. 统计领域

1. cfda: 提供将分类数据编码为功能数据并执行基础统计分析的功能.

2. cvCovEst: 实现了一种高效的协方差矩阵估计交叉验证方法,特别适用于高维环境.

3. flipr: 对多种数据类型实现置换框架点估计、置信区间或假设检验.

4. ipmr: 使用基于表达式的框架实现积分投影模型,该框架处理密度依赖性和环境随机性,并提供诊断、绘图、模拟和分析工具.
5. metapack: 提供通过马尔可夫链蒙特卡罗算法对元分析和网络元分析模型执行贝叶斯推理的函数.
6. sassy: 加载一组程序包,这些程序包的共同目标是使SAS®程序员更容易使用R。函数将许多熟悉的SAS®概念带到R中,包括数据库、数据字典、格式和格式目录、数据步骤和可跟踪日志.

十一. 应用工具

1. gargoyle: 实现基于事件的框架以构建Shiny应用程序, 该程序包不再依赖于标准的Shiny反应对象,而是依靠更轻量的触发器.

2.quarto: 提供Quarto markdown发布系统的界面,并允许将R Markdown文档和Jupyter Notebooks转换为多种输出格式.

3. var: 提供功能以管理,配置和使用为R预先配置的虚拟机,以及在干净的环境中开发,测试和构建程序包.

十二. 可视化

1. ggh4x: 通过为每个面板设置单独的比例、调整面板大小,提供嵌套的构面并允许每个图使用多种颜色和填充比例来扩展ggplot2图形.

2. tastypie: 提供用于制作饼图的函数和模板.

3. terrainr: 提供检索、操作和可视化地理空间数据的功能,目的是在Unity 3D渲染引擎中生成“3D”景观可视化.

说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~
https://rviews.rstudio.com/2021/03/19/february-2021-top-40-new-cran-packages/

往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集


浏览 42
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报