R包分类:生物医学

数据分析挖掘与算法

共 6113字,需浏览 13分钟

 ·

2020-07-30 21:54

R语言是医学统计、生物医学、基因组学中一个非常强大的工具. CRAN上有着庞大数量的医学分析相关R包, 既有哈佛大学医学院的Bioconductor项目,也有约翰·霍普金斯大学的医学研究, 以及连接诸如WHO数据库的API接口.

医学图像

1

DICOM格式数据

临床成像设备捕获的数据,标准格式为DICOM(Digital Imaging and Communications in Medicine).

DICOM文件非常广泛并且复杂.

通常而言, 每一个DICOM文件都是由2个四字节序列组成文件, 表示十六进制数字, 并形成一个标记. 元素/组用于表示后续的信息类型.


R中支持读取/导出DICOM文件格式的R包有:

oro.dicom

divest

fmri

tractor.base

以上R包均提供了读取/导出DICOM文件格式的函数方法.


2

ANALYZE格式数据

尽管医学成像数据行业标准为DICOM, 但另一种格式图像分析也被大量使用.

ANALYZE格式图像由两个文件组成, 分别为hdr和img文件.

R中支持ANALYZE和NIfTI文件格式的R包有:

RNifti

AnalyzeFMRI

fmri

tractor.base

oro.nifti

neuroim

以上R包均提供了读取/导出ANALYZE和NIFTI文件格式的函数方法.


3

核磁共振成像MRI

Magnetic Tensor Image(MRI)核磁共振成像

  • Diffusion Tensor Imaging(DTI):

tractor.base 

speaq:OOL核磁共振波谱对其,基于峰值处理、定量分析和可视化。


  • Dynamic Contrast-Enhanced MRI:

DATforDCEMRI

dcemriS4 


adaptsmoFMRI: 使用fMRI数据估计血氧水平

AnalyzeFMRI:处理和分析ANALYZE格式与MRI格式文件.

fmri: 处理MRI数据, 提供了建模方法与分析函数.


mritc:提供了用于MRI分析的工具及


brainR:提供了3D和4D图片处理/

Morpho:绘制交互式2D/3D图像

Rvcg:三角面网格操作、拓扑.例如从医学图像分割出表面


neuRosim: 允许用户生成fMRI时间序列或4D数据, 以及高维数据处理和分析


4

通用图像处理

adimpro: 2D数字图像(黑白图像),通常不用于医学影像, 但可用于一般图像处理.

bayesImageS:用于2D与3D图像分割,例如CT、MRI.包括了贝叶斯、隐马尔可夫链等方法.

EBImage:提供了一个图像的读取、写入、处理和分析功能.

mmand:Mathematical Morphology in Any Number of Dimensions, 提供了形态操作.


5

PET

 

Positron Emission Tomography:

occ: 提供一组通用方法用于PET审计受体.


6

EEG脑电图

 

Electroencephalography (EEG)脑电图:

edfReader: 读取主流格式的EEG文件.

eegkit: EEG标记工具集


流行病学

epiR: 流行病学数据分析

epiflows:提供用于处理、可视化区域间流行病流动的功能和类别, 以及用于预测疾病传播的统计方法.

epibasix:提供流行病学及生物统计学的基本流行病学函数

COVID19:COVID数据跟踪项目API

covid19.analytics: JHU数据

covid19france:COVID19法国数据

covid19italy:COVID-19意大利数据, 按照国家、地区、省份划分

covid19us:COVID19美国数据


可视化案例


临床试验设计、检测、分析


1

设计与检测

TrialSize: 包含超过80个函数方程, 收录在Sample Size Calculations in Clinical Research (Chow & Wang & Shao, 2007, 2nd ed., Chapman &Hall/CRC)中

asd:通过使用早期治疗结果选择, 模拟高级无缝设计.

bcrm:实现单个参数和双参数的贝叶斯CRM设计.可实现交互式结果.

blockrand:创建随机临床试验. 可输出PDF文件作为随机卡片.

clusterPower:使用蒙特利尔方法模拟, 计算随机试验的影响效果.

conf.design:用于计算复杂的分数设计.

CRTSize:包括传统的power-based methods、meta-analysis等,用于随机试验中的聚类评估.

dfcrm:对CRM和TITE-CRM进行解析.

ewoc:Babb, Rogatko and Zacks (1998)药剂过量分析.

模拟临床试验进程中下一剂量的状况, 得到操作特性.

experiment:临床试验工具.例如,随机试验以及一些专门的临床分析选项.

FrF2:线性、非线性部分因子设计.

GroupSeq:使用alpha spending方法,对数据集的组、子序列进行计算.

gsDesign:推导数据子序列设计, 并描述特性.

ldbounds:使用Lan-DeMets Method 计算成组序列试验.提供了大量函数用于计算亚组的边界和概率.

Mediana:基于Clinical Scenario Evaluation(CSE)方法,提供了一个通用框架用于模拟临床试验.该R包支持多种数据类型、分析决策以及关键评估.

PIPS:使用数据和假设理论,预测未来数据分布、绘制区间、模拟置信区间

PowerTOST:计算多种类型临床试验设计的影响、样本大小.

pwr:line of Cohen(1988)的影响分析

qtlDesign:QTL试验分析与设计

samplesize:均衡/非均衡的Student‘s t-test样本大小, Wilcoxon-Mann-Whitney test方法计算分类数据.


2

设计与分析

AGSDest:亚组试验参数评估

clinfun:临床试验、分析工具.包括Fisher's exact test等,可计算亚组的试验.包括临床II期、临床III期试验.

CRM:临床I期Continual Reassessment Method(CRM)模拟

dfpk:包括药物动力学测量在内的统计方法,包括了临床I期的诸多模型,和关系参数、层级模型.该R包提供了一组函数产生数据,用于模拟和决策最大耐受计量.

dfped:儿科药物剂量试验设计与数据分析.包括药物动力学、贝叶斯模型等.

DoseFinding:制药临床II期的药物计量计算.包括multiple contrast test、非线性药物反馈模型等.

MCPMod:dose-response研究的方法与分析.

TEQR:The target equivalence range(TEQR)、modified toxicity probability interval (mTPI) design、standard 3+3 design (3+3)

ThreeArmedTrials:three-arm non-inferiority、

superiority trials、gold-standard design、试验性治疗


3

专用分析工具

adaptTest:自适应二期测试.包括了四个测试:Bauer and Koehne (1994), Lehmacher and Wassmer (1999), Vandemeulebroecke (2006), and the horizontal conditional error function. User-defined tests can also be implemented. Reference: Vandemeulebroecke, An investigation of two-stage tests, Statistica Sinica 2006.

clinsig:临床中带有参数或非参Jacobson-Truax评估

nppbib:非参统计检测,计算部分均衡不完全组的试验结果的数据范围

speff2trial:计算或评估数据范围, 定量或二分数端点非参统计检验.

ThreeGroups:由Gerber, Green, Kaplan, and Kern (2010).提出的, three-group designs中three-group designs


4

通用分析方法

基础R: R中自带了大量高效函数用于计算和分析临床试验.例如:chisq.test, prop.test, binom.test, t.test, wilcox.test, kruskal.test,mcnemar.test, cor.test, power.t.test, power.prop.test, power.anova.test, lm, glm, nls, anova (and its lm and glm methods)

asypow:计算相关性、渐进可能性比率方法.

binomSamSize:计算置信区间、 伯努利分布所需的必要样本大小

coin:双样本、K-sample、非线性ANOVA等方法,相关检测、排序、多变量等问题.

epibasix:流行病学、生物统计学随机试验分析.

Hmisc:包括了大约200个函数,用于高维数据图像、样本计算、缺失值处理、数据标柱、聚类等.可使用LaTeX和S代码.

multcomp:在参数分析中,计算线性和非线性的对比试验、置信区间

survival:描述统计学、双样本检验、参数失效模型、Cox模型等模型.Case-cohort设计.

ssanv:双样本差异中的样本大小计算.调整由于数据与参数的不匹配.


5

Meta-Analysis

metasens:统计方法,并调整meta分析中的偏差.

meta:修正随机影响的meta分析,包括检验、偏差、森林、漏斗图绘制.

metafor:meta分析.修正了随机影响的模型、线性模型,2x2表格数据, Mantel-Haenszel and Peto's method

rmeta:双样本中的meta分析随机影响修正.绘制标准的统计图,检测相关性和异质性


6

综合

mediana:临床试验模拟

rbhit:单倍型抗体

wnl:药物动力学

c212: 工程和物理科學研究理事會 (英國) 資助的專案, 該專案名為 CASE 2 12,用于检测临床试验的安全信号

bayesCT:自适应贝叶斯临床试验的模拟与分析

PTE:个性化治疗评估。为个性化的医学模型提供推断。

simcdm:模拟认知诊断模型数据

Buddle:使用深度学习方法实现统计分类。案例数据包括临床试验患者的统计分类、预测疾病的临床分析。考虑到今日疾病的负面影响,及时正确的对病患进行确诊,在临床中是关键的。确定高危患者群体,并在适当时机安排医疗方案。借助深度学习方法,帮助在各种具有挑战性的临床试验中寻找答案。

webddx:在线诊断生成工具。用户可以生成列出给定的一组症状鉴别诊断,web工具可能会被用于临床实践,但方案交互和数据操作能大大提高效率和再现性研究临床信息。


生物医学

iCellR:单细胞高通量测序分析

riceidconverter:生物数据ID转换

radsafer:辐射安全,也称为“辐射防护”,物理上称为“健康物理学”,此包中包含辐射安全专业人员所需的大量计算。


基因组学

Map2NCBI: 将标记映射到最近的基因组特征

chromoMap:人类染色体的交互式图形可视化,引入染色体热图

GROAN:一个测试基因组回归准确性的工作台

pathfindR:通过提供的基因列表识别蛋白质-蛋白质相互作用路径,并对已确定的子网络实现途径强化分析,确定具有代表性的路径。帮助研究人员能够发现表行背后的机制。

detectRUNS:提供滑动窗口(Purcell等)和连续运行(Marras等)等方法,检测二倍体基因组中纯合性和杂合性的运行。

cRegulome:提供方法来构建预计算的转录因子或microRNA的SQLite数据库文件,数据源于Cistrome和miRCancerdb数据库

ICDS:肿瘤功能障碍鉴定亚途径,基于DNA甲基化、复制数变异和基因表达的数据

GRAPE:基因排序的路径表达分析

DetSel:检测目标基因或者自然选择的基因。

BGData:大基因组数据分析套件

genoPlotR:绘制人口基因组与基因地图

Eagle:在基因组范围内实现多位点关联映射。基于线性混合模型,适合于连续性状的数据分析

GenoScan:用于全基因组序列分析的全基因组扫描统计框架


脑科学

NetworkToolbox:脑、认知、心理网络分析方法


代谢组学

MetabolicSurV:利用代谢组学特征进行分类和预测生存的生物标志物验证方法

cliqueMS:代谢组学分析工具


法医鉴定

benford.analysis: 基于Benford方法的数据验证和法医鉴定


综合

DrInsight:能够反向查询疾病表型或者查询相似功能药物

bamp:贝叶斯年龄-时期队列模型。使用马尔可夫链和蒙特卡洛模拟方法

grf:提供了非参数最小二乘回归、量化回归和治疗效果估计的方法

DSAIRM: 提供一组Shiny应用程序,实现动态模拟系统, 探索宿主免疫反应.

localIV: 提供使用局部工具变量估计边际治疗效果的函数,参见Heckman et al. (2006)、Zhou and Xie (2018)


数据

fingertipsR:Fingertips提供的公共卫生数据

CytobankAPIstats:提供了从细胞库获取和处理细胞数据的工具

SympluR:通过访问Symplur接口,提供了对医疗社会图(Healthcare Social Graph)进行数据分析的功能

getTBinR:获取世卫组织结核病数据

UCSCXenaTools:从UCSC Xena数据库获取数据和探索分析

malariAtlas:从疟疾地图集项目服务器下载公共可用数据。

BioInstaller:生物信息学资源集合

UCSCXenaTools: 顶级基因库. 支持对USCS Xena数据中心等数据访问. 是UCSC托管等公共数据库的集合.



猜你喜欢

浏览 22
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报