精选| 2021年5月R新包推荐(第54期)

生信宝典

共 3156字,需浏览 7分钟

 ·

2021-07-09 01:23

翻译:黄小伟,资深大数据分析从业者。目前就职杭州有赞数据分析团队!

知乎专栏:中国R语言社区、R语言中文社区 |26,000+关注、150万+阅读
知乎圈子:数据分析圈|11,000+加入

2021年5月,205个R新包收录于CRAN(2021年4月份收录179个),累计收录约19,088个R包!此次选摘了40个R包(10个类别),分布结构如下:


一. 计算方法

1. madgrad: 实现随机优化的自适应双平均梯度法 MADGRAD.

2. TriDimRegression: 提供使用Stan拟合2D和3D变换的函数,Stan返回拟合参数的后验分布.


二. 数据

1. AtmChile: 提供来自智利国家空气质量系统 (S.I.N.C.A.) 的空气质量和气象信息.
2. basemaps: 提供一个轻量级接口,用于从开放源(如OpenStreetMap、Mapbox等)访问spatial basemaps.

3. causaldata: 提供用于运行在线因果推理教科书:The Effect and Causal Inference: What If 中的示例问题的数据集.
4. exoplanets: 提供对 NASA外行星档案的访问.

5. frenchdata: 提供对 Kenneth 的法国金融数据库的访问.

6. tradepolicy: 提供对Yotov等人(2016)数据集的访问,以及一本包含评论和代码的在线书籍.


三. 基因组学

1. artemis: 为环境DNA采集实验的设计和分析提供了一个建模框架.

2. MAGEE: 提供执行基于变体集的主效应测试、基因-环境相互作用测试和关联联合测试的功能,如 Wang 等人提出 (2020).
3. MultIS: 实施生物信息学方法来检测同一克隆内病毒载体的多重整合.

4. TopDom: 提供从 Hi-C 序列数据中识别基因组拓扑结构域的功能,如 Shin 等人所述(2016).

四. 机器学习

1. cjbart: 使用贝叶斯加性回归树 (BART) 实现分析联合实验的工具,这是一种由 Chipman & McCulloch (2010) 开发的机器学习方法.

2. fastText: 实现 Facebook 的 fastText 库的接口,见 Bojanowski 等人 (2017) 对算法的描述.

五. 医药领域

1. afdx: 提供在没有黄金标准时,通过使用对数指数模型或潜在类别模型估计归因分数来估计诊断测试的诊断性能(灵敏度、特异性、阳性预测值、阴性预测值)的功能.

2. covidcast: 为Delphi 的 COVIDcast Epidata 提供接口,包括用于数据访问、地图和时间序列绘图、基本信号处理的工具,以及与美国 COVID-19 大流行相关的众多指标的集合.

3. eventTrack: 在临床试验中实施用于事件预测的混合框架,如 Fang & Zheng (2011) 所述.

4. goldilocks: 如 Broglio 等人所述 (2014),使用分段指数模型和共轭 Gamma 先验分布为事件结果的时间实现 Goldilocks 自适应试验设计.

六. 科学

1. CopernicusDEM: 使用AWS CLI命令行工具提供与欧洲航天局哥白尼DEM数字高程模型的接口,分辨率为90米和30米.

2. nimbleCarbon: 在灵活的建模框架内,为放射性碳日期的贝叶斯分析提供函数和自定义概率分布,包括用于人口统计推断的前后预测检查的一套函数,如Crema&Shoda(2021)所述.


七. 统计领域

1. bayesmodels: 提供一个框架:将许多贝叶斯模型引入 tidymodels 生态系统.

2. div: 提供帮助分析公司环境中团队的功能,评估每个级别和工作的多样性,搜索偏差,还提供模拟偏差影响的方法.

3. HotellingEllipse: 提供计算Hotelling椭圆的半轴长度和坐标点的函数.

4. makemyprior: 提供用于构造和可视化方差参数的联合先验的工具.

5. Rage: 如Jones等人(2021)所述,提供使用矩阵人口模型(MPM)计算生命史指标的函数.

6. unusualprofile: 提供函数来计算一组结果变量的每一行的马氏距离.


八. 时间序列

1. gsignal: 实现了Ovtave信号包,它提供了多种信号处理工具,如信号产生和测量、相关和卷积、滤波、滤波器设计、滤波器分析和转换、功率谱分析、系统识别、抽取和采样率变化等.

2. legion: 提供用于实现多变量状态空间模型(如向量指数平滑和向量误差趋势季节模型)的函数,用于时间序列分析和预测,如de Silva et al.(2010)所述.

九. 应用工具

1. parsermd: 使用 Boost Spirit X3 库实现 R Markdown 文档的正式语法和解析器。它还包括一组用于处理生成的抽象语法树的高级函数.
2. riskmetric: 提供用于根据多个指标评估 R 包的工具,以帮助量化其稳健性.
3. shinyvalidate: 通过在缺少所需输入或输入值无效时提供反馈,提供改善 Shiny 应用程序用户体验的功能.
4. ttt: 提供工具来创建结构化、格式化的 HTML 表格.

十. 可视化

1. fitbitViz: 实现与 Fitbit Web API 的连接,以提供 ggplot2、Leaflet 和 Rayshader 可视化.

2. ggbreak: 提供用于为 ggplot2 设置轴中断的比例函数.

3. ggpp: 提供对ggplot2的扩展,以使用本机和npc数据坐标向绘图添加插入.

4. ggseg: 实现一个ggplot geom,使用简单的功能绘制大脑图谱。包中最大的组件是两个内置地图集的数据.

5. ichimoku: 实现Ichimoku Kinko-Hyo,也就是通常所说的云图,包括静态和交互式可视化,以及用于创建、回溯测试和开发定量Ichimoku策略的工具.

6. liminal: 为高维数据探索性分析提供组合交互式可视化和创建链接交互式图形的功能.

7. mipplot: 提供通用功能,按照综合评估建模联盟(IAMC)提交格式生成面积图、条形图、方框图和折线图,以便可视化气候迁移场景.

8. qqboxplot: 将Q-Q箱线图作为ggplot2的扩展实现.

说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~
https://rviews.rstudio.com/2021/06/24/may-2021-top-40-new-cran-packages/


往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集


浏览 71
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报