剧集

使用多源数据在药物发现实验中使用 R 进行集成群集分析

替换为 Marijke Van Moerbeke

useR!2017:Dr 中的 R 集成群集分析...

  1. 比利时哈塞尔特大学生物统计与统计生物信息学研究所
  2. 独立顾问 关键字:高维数据、聚类分析
    网页:https://cran.r-project.org/web/packages/IntClust/index.html
    发现化合物的确切活动对药物开发具有主要兴趣。 单个药物可以与多个目标交互,意外的药物目标相互作用可能导致严重的副作用。 因此,药物发现早期阶段不仅能展示化合物的所需目标有效性,而且要概述其不需要的脱目标效果,这一点很有价值。 此外,先前不需要的行为被记录在一起,越好。 否则,这种药物可能会在后面的阶段失败,这意味着投资的时间、精力和资金都丢失了。
    在药物开发的早期阶段,收集不同类型的化合物信息:分子的化学结构(指纹)、预测目标(目标预测)、各种生物分析、毒性等。 对每个数据源的分析可能会揭示有趣的但不相交的信息。 它只提供有限的观点,并没有提供有关全球图片中一切如何相互联系的信息(石、德摩尔和莫劳2009年)。 因此,对多个数据源的同时分析可以提供对化合物活动的更完整的见解。
    基于多个数据源的分析是药物发现和药物开发方面相对较新的和不断增长的领域。 多源聚类分析过程让我们有机会将多个数据源相互关联,以便更好地了解化合物的操作机制。 QSTAR(定量结构听录活动关系)联盟(Ravindranath et al. 2015)调查了多个数据源的使用。 目标是在分析一组正在开发的化合物时,找到化学、生物分析与转录数据之间的关联。
    在目前的研究中,我们扩展了在(2016年秘鲁拉-坦等人)中介绍的聚类分析方法,并回顾了 R 中实际药物发现项目上几种聚类分析方法的性能。我们说明了新的聚类分析方法如何为分析一组特定化合物中的化学、生物分析和听录数据提供有价值的见解。 建议的方法在 R 包 IntClust 中实现并公开提供,它是许多组合聚类分析方法的包装包。
    引用佩拉里拉-坦,N.,Z. 什凯迪,W.塔伦,H.W. Goehlmann,QSTAR 财团,M.范莫尔贝克,和A.卡西姆。 2016. “早期药物迪斯科基中化学结构和生物活动数据的加权相似性聚类分析。 生物信息学和计算生物学杂志。

拉文德拉纳特,A.C.,N.秘鲁拉-坦,A.卡西姆,G.德拉基斯,S.利吉,S.C.布鲁尔顿,D.梅森,等2015年。 “从连接映射连接基因表达式数据以及小分子行动机制分析的 Silico 目标预测中连接基因表达式数据。 Mol. BioSyst. 11 (1). 皇家化学学会:86-96。 doi:10.1039/C4MB00328D

石,Y.,德摩尔,和Y.莫劳。 2009. “通过异类数据融合进行聚类分析:框架和应用程序。 NIPS研讨会