预防护理_结肠溃疡

学科联系药学和生信之间那些事儿

编辑寄语

生物学是药学的基础，生物学和药学是医学的基础，而生物信息学，则是贯穿于以上三个组成的金字塔，起到极大的辅助作用的新兴学科，尤其是现代生物医药领域，生物信息学更是必不可少。

本文引用文献：王可鉴，贺林，杨仑《生物信息学在药物研究和开发中的应用》

新药研发过程中需要解决的一个十分重要却又异常复杂的问题是:药物以何种方式影响了哪些通路以及通路中的哪些基因，进而如何产生药效或毒性。通常情况下，药理学、毒理学或分子生物学实验是主要的探究方法。然而，考虑到这些方法或平台所需的资金和人力往往难以达到最佳的投入产出比，生物信息学方法则能体现出其特有的优势。例如在计算机辅助下，通过对基因组学和其他组学数据进行分析，能够以较小资金投入实现对“药物基因”关系的高通量筛选，从而降低了科研风险。

在当前新药研发的各种主流策略中，生物信息学越来越受到重视，分析高通量组学数据的生物信息学方法发挥着重要的作用。

下面就药物生物信息学的四个方面，带大家走进药学和生信的小世界~

基本原理

药物生物信息学作为生物信息学的一个重要独立分支学科，更侧重于处理与药物直接相关的知识和数据，如旧药新用、不良反应、药物作用机制、药物相互作用和电子病历等信息，并在临床转化和新药研发中发挥着重要作用。当前，药物相关的研发受益于生物技术和计算机技术的进步，并不断产生着大量的与药物作用和药物反应相关的高通量数据，例如基因组学、转录组学、蛋白质组学和代谢组学等等。因此，当今药物研发在信息处理层面上的主要瓶颈不再是数据的匮乏，而是数据过剩带来的信息解读的不充分。也就是说，药理学和毒理学研究的发展和进步不仅要依靠更新更快的硬件平台来产生数据，也要依靠更有效更可靠的各种算法、软件和工具来对大量抽象的实验数据进行清晰而准确的分析。

而药物生物信息学就是挖掘和利用实验数据中的信息，从众多的数值、文本和序列中去伪存真，发现统一的、系统性的药理或临床规律，并将这些规律总结成可读可视可用的格式(如图表、公式和软件等)以供后续的研究参考和使用，从而促进高效和安全的药物研发。可以预见，随着生命科学的研究方向不断向系统生物学的思维靠拢，药物研发也将越来越多地遵循系统药理和毒理学的研究思路，其中药物生物信息学必将发挥越来越重要的作用。

新发展

在药物开发过程中，单纯依靠分子生物学实验的研究方法通常耗资大，周期长;而对生物信息学工具加以充分利用，使其与生物学实验验证相配合，则能够取长补短、发挥合力。研究表明，现有的预测工具虽然在预测效率方面仍然有提高的空间，但至少能够在一定程度上为化学、药理、毒理学家和制药公司等提供决策支持。

在新药研发的流程中，几乎每一个主要步骤都有生物信息学发挥的重要作用。

①先导化合物筛选:药物研发的本质就是发现具有特定生物学和药理学活性的化合物分子。以往需要在海量的化合物分子中通过生物化学方法进行大规模的筛选，其成本极其高昂。在生物信息学定量构效关系模型(QSAR)的帮助下，可以总结出某些规律，指示具有特定化学结构的分子更倾向于具有特定的药理作用。

②靶蛋白发现：药靶发现历来是药物开发的先决条件，人类基因组测序的不断完善为药物研究提供了大量的潜在靶基因，应用生物信息学方法可以对已知有效的靶基因进行量化分析，比如总结其在核苷酸和氨基酸序列方面的特性，并将其他一系列人类基因与经典靶基因进行基因结构上的同源性对比，从而快速确定新基因是否有潜力成为新药靶，这样就可以避免盲目而草率地进行相对昂贵的实验验证。而最近各种新兴的脱靶(offtarget)挖掘技术的产生，又为新靶点的发现提供新的候选。

③药物作用机制:在确定了药物分子的化学结构和靶蛋白之后，通常还需要进一步研究药物与机体不同组织和细胞之间相互作用的结果，从而确定药物可通过何种方式对潜在适应证产生疗效以及可产生的副作用。在传统的药物研发中，这一阶段的研究主要基于动物模型实验。由于动物培养和药物处理通常所需的时间很长且成本极高，所以数据规模有限，难以进行不同药物之间横向的对比，影响了研究结论的系统性和可靠性。通过结合大规模的微阵列和创新的生物信息学分析方法

④临床统计分析:经过不断优化和测试的化合物究竟是否成为一个成功的药物，其最终的评价标准还在于临床应用的效果，在这一方面生物信息学的参与也极具重要性。众所周知，动辄涉及数千患者的临床试验是药物开发流程中成本最高的步骤，如果由于患者样本的选择不合理而引起统计学上的偏差，则无异于拿患者宝贵的生命和巨大的资源投入来冒险。使用生物信息学工具在基因组水平对临床受试的患者群体进行有效的划分和甄别，可以大大提高新药开发的效率并节省大量的时间和经费。比如，美国斯坦福大学的Tatonetti等收集了大量的临床试验数据和电子医疗记录并进行整理，在分析中有效消除了其中性别年龄等协变量的干扰。通过观察药物在大的人群样本中倾向于引起那些特定的药物反应，可以从中发现未知的新药靶、药物适应证和药物联用。

应用

基于表达谱的药物研究

虽然许多研究都致力于解释药物分子在上游结合靶蛋白之后，间接地影响了哪些下游基因，以及这些下游基因之间又发生了怎样的相互作用和形成了怎样的网络，但是想要通过可视化的图表和可定量的数据来描述每一个受到药物影响的下游基因却是件十分艰巨的任务。一方面，生物体内基因与基因之间的关系是一个有机的整体，当上游的药物作用影响到了第一批下游基因后，受影响的基因又会继续调控第二批、第三批基因，而且这种波浪式扩散中往往还包含着正反馈和负反馈效应，因此任何一个药物对体内基因的作用都可谓“牵一发而动全身”。另一方面，对于如此复杂的药物作用，如果单纯依靠分子生物学实验来进行逐个基因的验证无疑将耗费大量的资源和时间。按照生物学发展的现有条件来说，要同时确定一大批基因的表达变化的方式和程度，可行性和可靠性最高的方案就是通过基因芯片平台对整个基因组的表达水平进行高通量的检测。

由于基因芯片技术的普及，在生物学领域的各大公共数据库中已经公开了大量药物相关的基因组表达数据。其中对基因芯片比较典型的应用方式是使用各种药物处理人类或动物组织的细胞，通过比较药物处理前后细胞内基因表达谱可以得到差异表达基因(differentiallyexpressedgene)，用来代表药物的药效特征信号，或者称为基因组中的特征基因。假设药物A引起一部分基因表达上调和另一部分基因表达下调;同时某个治疗另一种适应症与A不同的药物B处理细胞后，A引起上调(或下调)的基因在B处理的细胞中也普遍倾向于表达升高(或降低)。这种情况表明A和B调控的基因具有高度正相关的表达变化，也就是说两种药物影响下游基因的方式高度相似，则A和B很可能在作用机制方面存在某种未知的重叠或关联。从类似A和B这样的“药物-药物”配对中寻找新的适应证定位———即检验A是否能够治疗B的适应证，或B治疗A的适应症———显然比随机的筛选或经验型地摸索具有更高的效率和成功率。基于以上逻辑的一系列研究都取得了令人信服的结果，足见通过计算药物之间在基因组表达谱上的相关度来对比它们在作用机制上的相似性是一条完全可行的研究道路。然而，由于不同的基因芯片、不同的实验设计甚至不同的实验人员操作习惯都能对基因芯片实验的结果产生一定程度的影响，因此相互独立的小规模实验所产出的药物特征基因表达谱往往不具备足够的相互之间的可比性，也就难以进行统一的数据分析来实现大规模的新药研发。

年，美国Broad研究所的Lamb等在美国《Science》上发表了其建立的大规模药物处理人类细胞的数据库以及相关研究成果。在这个被被命名为“联系图”(connectivitymap，CMap)的药物基因组学研究项目中，研究人员首先使用种药物对个人类细胞系进行了处理(图2)。处理之后的细胞相对于未经处理的对照细胞必定产生了某种程度的基因表达变化。其后，研究人员利用Affymetrix公司的微阵列技术平台对所有细胞中的余个基因进行了定量检验，从而明确地测量出每个细胞系在特定药物处理后有哪些基因发生了表达水平的上调或下调，这些信息即构成了该药物特有的“基因组表达谱”。最后，通过对比不同药物之间在基因组表达谱上的相关程度即可判断药物在调控下游基因的方式上的相似程度，也就间接反映了不同药物是否影响了相近的或部分重叠的下游基因。例如，如果某个治疗糖尿病的药物在CMap中的基因组表达谱体现出与多个抗癌药物的显著正向相关性，则预示着该糖尿病药物很可能调控了癌症相关基因并具有潜在的抗癌作用。

为了定量衡量一对药物表达谱之间正向或负向的相关程度，CMap根据特定的计算方法（具体见）能够给出一个介于－1和+1之间的“联系分值”，用以定量衡量各药物表达谱之间的相似程度。

自从发表以来，各方基于CMap数据的研究主要集中在旧药新用方面，而且取得了一系列不同程度的进展。还有研究以改进CMap基本分析方法为切入点，通过一定的预处理程序提高CMap数据的质量，再用升级后的CMap发掘出之前被埋没在数据噪声中的信号，从而展示了数据预处理对药物研发的重要性。在中会对若干最具代表性的应用性研究如美国斯坦福大学的Butte研究组基于CMap方法进行了成功的老药新用研究、美国爱荷华大学的Adams研究组通过反向比对的方法提出了针对肌肉萎缩这一常见疑难疾病的新疗法等加以详细介绍。

在积极应用药物基因组表达数据同时，研究者们也注意到以CMap为代表的大规模表达数据在数据质量上可能存在着一些不容忽视的问题。其中最主要的问题就是大规模生物学实验中常见的“批次效应”，即数据信号的主要决定因素并非样本本身的生物学特征，而是样本在获取、培养或测量过程中周围环境的微小差异。具体到CMap数据中，由于全部个细胞样本是在个不同批次中培养出来，研究人员发现，同一批次不同药物处理的样本之间的表达相似度甚至高于同一药物不同批次的细胞样本(即细胞培养条件的噪声掩盖了药物作用的信号)。为了克服这一不足，生物信息学家们从不同角度提出了多个解决方案。研究者发现，对于同一药物处理的不同批次细胞来说，其差异主要体现在细胞条件而非药物作用，所以其表达谱的差异基本能够反映细胞批次间的差异。通过对此差异进行定量计算，可以对整个CMap进行系统性的校正。结果表明，校正后的CMap表达谱更真实地反映了药物作用的特性，并成功地被用来研究药物药靶的表达。

展望

综合以上众多的理论性和应用性研究，可以发现在系统生物学理论的指导下，基于药物生物信息学方法对药物相关的高通量数据进行分析和挖掘，能够在传统的经验性临床摸索和低通量实验之外，建立一套更高效的新药研发的方法论。较之实验药理、毒理学和临床医学研究，药物生物信息学方法在研究成本具有优势，研发周期也相对更短，特别是在临床样本收集和动物模型建立十分困难的研究“初级阶段”，可采用系统生物学理论和生物信息学方法摸清大致脉络，从而实现在前期较少经费的基础上，为后续实验提供可行可靠的假说，也就为后续长期大额经费的投入指明了正确的方向。

因此，建立并完善我国药物生物信息学平台，对于研发适合我国国情的旧药新用(药物新组合)，或预测并预防药物不良反应具有重大意义，是我国新药创制不可缺少的重大平台。但同时我们也必须认识到，单纯依靠药物生物信息学分析并不能直接得到新的药物和疗法，而是最终要落实到生物化学和临床医学实验当中。单纯依靠实验而忽视了在计算层面上对信息和数据的深入分析，则难以有效地降低药物研发成本和提高研发效率。因此，未来药物生物信息学乃至整个制药工业的发展方向必将是信息学、药理、毒理学和医学的高度协作。

拓展阅读

如何衡量药物表达谱之间的相关程度：

为了定量衡量一对药物表达谱之间正向或负向的相关程度，CMap根据特定的计算方法能够给出一个介于－1和+1之间的“联系分值”，用以定量衡量各药物表达谱之间的相似程度。首先在药物A的基因组中选择表达差异最大的一部分基因探针(比如上调和下调各个，合计个探针)作为其“特征基因”。随后，将药物B的基因组中所有个基因探针与药物的特征基因进行比对。如果A的上调特征基因(下调同理)在B中更多地倾向于过表达，则代表两药在基因调控方面的相似程度越高。该程度可以量化为以下分值:第i个(i为1～之间的某个数值)在B表达谱中的上调排名(介于1～之间)。

基于此计算公式，可以实现不同药物之间高效率的基因组表达定量比对。在过往以CMap为基础的众多研究中，主要的思路就是以某个药物的基因组表达谱为参照，将其在整个CMap数据中进行“查询”(即将所有的CMap基因组表达谱与之进行比对)，最终正向联系分值最高(最接近于+1)的一部分药物便被认为可能与参照药物之间存在下游基因调控和临床药物反应层面上的潜在关联。对于每个细胞样本来说，其中一部分加入特定药物而成为“处理组”，而另一部分未作任何处理便作为“对照组”。处理组相对于对照组细胞来说，各个基因的表达水平应当都发生了某种程度的变化，而整个基因组的整体变化水平就是该处理药物特有的基因组表达谱。当把某个药物作为参照标准时，其基因组表达谱中上调和下调倍数最高的一部分基因就被选为该药物的特征基因。如果要查询某个其他药物与参照药物在基因组表达谱上的相似程度，只需计算参照药物的特征基因在查询药物的表达谱中的上调和下调水平。如果参照药物的上调(或下调)基因在查询药物处理的细胞中也普遍倾向于上调(或下调)，则两者的表达谱呈正向相关;反之，如果参照药物的上调(或下调)基因却在查询药物处理的细胞中呈现出普遍下调(或上调)的趋势，则两者为反向相关。

基于CMap数据的研究：

发现具有抗癌活性的新药物，是生命科学的热点领域之一。而如何以低投入和高效率的方式发现抗癌新药始终是一个难点问题。意大利TeleThon研究所的Isacchi研究组广泛分析了所有个CMap药物之间的表达谱相似度，并从中发现了一系列相互紧密联系并具有相似疗效的的“药物群”。比如，2DOG(2-deoxy-D-glucose)分子已知能够引发细胞自噬作用，一种与癌症、感染和神经退行性疾病广泛相关的生物学过程。而在药物群中，2DOG和降血压药物法舒地尔体现出了显著的强联系，表明法舒地尔具有潜在的引发细胞自噬的能力。为了验证这一CMap生成的线索，分别以人类成纤维细胞和HeLa细胞为模型，该研究组检测了法舒地尔对细胞自噬作用标志物LC3-Ⅱ水平变化的影响。免疫印迹和抗体免疫染色的双重证据都证实，法舒地尔引发了明显的细胞自噬，从而通过低成本和高通量的数据分析精准发现了法舒地尔的潜在抗癌疗效。美国斯坦福大学的Butte研究组基于CMap方法进行了成功的老药新用研究，并在《NatureTranslMed》上发表了2篇系列文章。

该研究组首先从美国国立卫生研究院(NIH)的GeneExpressionOmnibus数据库中收集了大量数据，最终提取出个疾病模型和个化合物小分子的基因组表达谱信息。通过CMap的分析方法，可以计算药物分子与疾病模型的反向联系。比如疾病模型中上调(或下调)的基因在药物处理中普遍下调或(上调)，则很可能提示了未知的“药物-适应证”关系。比如，抗惊厥药托吡酯被发现可能具有治疗炎症性肠病的作用，而在硝基苯磺酸引发的炎症性肠病动物模型中，口服托吡酯显著减轻了总体病理特征和受感染结肠组织的为损伤。同时，抗溃疡药物西咪替丁(甲氰咪胍)具有潜在的抗癌疗效的老药新用假设也在动物疾病模型中得到了有效验证。美国爱荷华大学的Adams研究组通过反向比对的方法，提出了针对肌肉萎缩这一常见疑难疾病的新疗法。该研究组首先从人类和大鼠的肌肉样本中定位出63个与肌肉萎缩显著相关的mＲNA片段，用以表征相关的体内病理环境。随后，通过将疾病特征mＲNA与CMap药物的基因组表达模式进行对比，寻找到了包括熊果酸在内的一部分与疾病样本显著相反的药物。该研究组认为，那些与病理样本相反的药物有可能扭转肌肉萎缩的体内环境，从而实现对疾病的治疗。最后，动物模型实验证明熊果酸确实刺激了与肌肉生长相关的信号通路，并且有效提升了动物体内的肌肉重量。

相关结果发表在《CellMetabolism》上，为肌肉萎缩的治疗提供全新的临床研究方向。

文字

石笑颖，李睿

图片

网络，CNKI，石笑颖，李睿

责编

李映雪

审核

张嘉宁，窦同意

北京最好的白癜风医院在那
北京有那些中医治白癜风好

转载注明： http://www.qwoao.com/yfhl/5820.html

上一篇文章：肝癌概述NCCN临床实践指南开篇
下一篇文章：一位医生告诉你如何预防大肠癌

学科联系药学和生信之间那些事儿

最新文章

推荐文章

热门文章