‘壹’ 大数据挖掘在虚拟医药科研方面的思考
大数据挖掘在虚拟医药科研方面的思考
1.基于大数据挖掘的虚拟医药科研案例
数据挖掘发展到今天,按照时下的概念应该到了“大”数据挖掘的时代了。我们还是先从几个相关案例开始吧。
1.1 虚拟临床试验-大数据采集
我们首先来看这样一个案例。2011年06月,辉瑞制药有限公司宣布开展一项“虚拟”临床研究,该项研究是一个得到美国食品和药物管理局批准的试点项目,首字母缩写为“REMOTE”。“REMOTE”项目是在美国开展的第一项病人只需使用手机和互联网、而不用重复跑医院的临床研究,该项目的目标是要确定此类“虚拟”临床研究能否产生和传统临床研究一样的结果。而传统的临床研究要求病人住在医院附近,并且定期前往医院或诊所进行初次检查和多次后续检查。如果这一项目有效,那它可能意味着全美国的病人都能参加今后的许多医学研究。这样一来,原先的科研项目中未得到充分代表的群体将得以参加,数据收集速度将大大加快,而且成本也很可能会大幅下降,参与者退出的几率也很可能会降低不少。
从上例中,我们可以看到,利用互联网可以收集远远大于传统临床科研样本数目的超大量病人的临床数据,而且其中有些临床数据可能来自于更加便捷的可穿戴健康监测设备。如果这样的研究,在科研设计严谨、质量标准得到有效执行、各种误差得到有效控制的情况下,科研的效率和成果的可信度可以显着提高。正如辉瑞公司首席医疗官弗蕾达?刘易斯-霍尔所说的:“让更多样化的人群得以参与研究有可能会推动医学进步,并为更多的病人带来更好的疗效。”
1.2 虚拟药物临床试验-大数据挖掘
我们再来看另外一个案例。1992年,抗抑郁药物帕罗西汀(Paxil)获准上市;1996年,降胆固醇药物普拉固(Pravachol)正式开售。两种药品生产企业的研究证明:每种药物在单独服用时是有效且安全的。可是,患者要是同时服用两种药是否安全,没有人知道,甚至很少有人想过。美国斯坦福大学的研究人员应用数据挖掘技术分析了数万例患者的电子病历后,很快发现了一个出人意料的答案:同时服用两种药物的患者血糖含量较高。这对于糖尿病患者来说影响很大,过多的血糖对他们来说是一种严重的健康威胁!科学家还通过分析血糖检测结果和药物处方,来寻找隐藏的规律。
对于单个医生来说,他所经历的同时服用这两种药物的病人是很有限的,虽然其中可能有少数的糖尿病患者莫名其妙地血糖升高了,但医生很难意识到这是由于病人同时服用了Paxil和Pravachol造成的。因为这是一种掩藏在大数据中的隐含规律,如果不是有人有目的地专门研究Paxil和Pravachol联合用药的安全性的话,个体医生是很难揭示这个规律的。但是,临床药品成千上万,我们怎么可能对任意组合的两、三种药联合应用的安全性和有效性进行逐一研究呢?数据挖掘很可能是一种有效的、快速的、主动式的探索多种药联合应用问题的方法!
研究者不必再召集患者去做临床试验,那样做的话花费太大了。电子病历及其计算机应用的普及为医疗数据挖掘提供了新的机遇。科学家不再局限于通过召集志愿者来开展传统的课题研究,而是更多地从现实生活中的实验中,如日常的大量的临床案例中筛选数据并开展虚拟科研,这些并非来自计划的课题立项的实验数据保存在许多医院的医疗记录中。
类似本案例,应用数据技术使得研究人员可以找出在药物批准上市时无法预见的问题,例如一种药物可能对特定人群产生怎样的影响。另外,对医疗记录的数据挖掘不仅将为研究带来好处,还会提高医疗服务系统的效率。
1.3 虚拟药物靶标发现-知识发现
我们再看看这样的一类研究。通常新药研发的过程都比较漫长,投入巨大,风险也很高。有数据表明,新药研发的平均时间长达15年,平均耗费超过8亿美元。但是,由于药物疗效的不佳和毒副作用太高,使得许多药物的研发经常在临床阶段就失败了,造成了巨大的经济损失。作为药物研发的源头,药物靶标的发现和识别对药物的研发成功率具有举足轻重性的作用。随着生物信息技术的不断发展,以及蛋白质组学数据、化学基因组学数据的日益增长,应用数据挖掘技术结合传统生物实验技术,可为药物新靶标的发现提供新的技术手段,为靶标识别预测提供新的方法。构建药物靶标数据库,利用智能计算技术和数据挖掘技术对现有的药物靶标数据开展深入探索,以期发现新的药物靶标正是这样一类研究,我们也称之为药物靶标的知识发现。
传统的药物靶标的发现,通常大都是通过大量的、反复的生物化学实验来实现的,不仅成本高、效率低,成功率也很低,犹如瞎子摸象一样,不好掌握方向。而应用数据挖掘这一自动的、主动的、高效的探索技术,可以开展虚拟药物靶标发现,不仅大大加快了药物靶标发现的进程,而且大幅减少了生物化学实验的次数和成本,同时也提高了传统生化实验的成功率。
2. 数据挖掘在虚拟医药科研上的应用
大数据时代,医药研发面临更多的挑战和机遇,为了更好的节约研发成本,提高新药研发成功率,研发出更有竞争力的新药,可以应用数据挖掘技术开展虚拟医学科研和药物研究。数据挖掘在虚拟医药科研上的应用,可以总结为如下几个方面。
2.1 通过预测建模帮助制药公司降低研发成本提高研发效率。模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。
2.2 通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议。例如: 通过聚类方法对患者群体进行聚类,寻找年龄、性别、病情、化验指标等方面的特征,判定是否满足试验条件,也可以根据这些特征更好的设立对照组。
2.3 分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应症的营销。通过关联分析等方法对试验数据进行挖掘可能会发现事先想不到一些成果,大大提高数据的利用程度。
2.4 实时或者近乎实时地收集不良反应报告可以促进药物警戒。药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防。通过聚类、关联等大数据挖掘手段分析药品不良反应的情况,用药、疾病、不良反应的表现,是否跟某种化学成分有关等。例如不良反应症状的聚类分析,化学成分与不良反应症状的关联分析等。另外在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
2.5 针对性药物研发:通过对大型数据集(例如基因组数据)的分析发展个性化药物。这一应用考察遗传变异、对特定疾病的易感性和对特殊药物的反应的关系,然后在药物研发和用药过程中考虑个人的遗传变异因素。很多情况下,病人用同样的用药方案但是疗效却不一样,部分原因是遗传变异。针对同病种的不同的患者研发不同的用药,或者给出不同的用法。
2.6 对药物化学成分的组合和药理进行挖掘,激发研发人员的灵感。例如针对于中医药物研发,用数据挖掘手段对于中药方剂和症候进行分析研究,探讨方剂和针对症状之间的联系,从功效、归经、药性和药味等方面进行分类特征分析。
3. 虚拟药物临床试验分析系统
现在越来越多的临床科研和药物临床试验都是从日常的临床工作中生成的大数据中经过严格的条件筛选来提取数据的。正如我们在本文1.1和1.2中提到的案例一样,所谓虚拟药物临床试验,是以更广泛的临床数据采集,和从海量的医院电子化的病历中按照事先的设计需求经过严格的条件筛选来开展的,虽然是虚拟的方法而不是传统的方法,这种药物临床试验研究有样本代表更广泛、成本低、效率高、研究成果更丰富等优点。采用虚拟研究的方法可以完全替代某些传统的药物临床研究,也可以作为某些传统的药物临床研究的预试验或探索性研究,以使真正的药物临床研究工作多、快、好、省。我们现在来看一下虚拟药物临床试验分析系统是如何工作的。
3.1 虚拟药物研究的基本思路
1、建设药物临床试验数据仓库,充分整合和积累的临床数据和药物应用数据。 2、设计、选取药物临床试验的观察组样本与对照组样本。 3、应用数据挖掘技术探索药物对于疾病治疗的效果和产生的副作用。 4、应用统计学技术进行药物临床试验效果的推断和评价。
3.2 建立药物临床数据仓库
建设药物临床试验数据仓库有两种途径,一种是通过经典的药物临床试验设计来定制化和采集相关数据,传统的方法主要记录在纸质文档上,也有专门数据录入软件,这种方法采集的数据是按照预先设计进行的,直接形成药物临床试验的专用数据,但通常样本数据量不会太大;另外一种是将医院大量的、历史的临床用药数据进行抽取、变换、装载,然后充分整合积累的其他临床数据和药物应用数据,形成药物临床试验数据源,为生成药物临床试验数据提供支撑,这样的样本数据量可能很大,我们后面演示的方法就是采用种数据进行“虚拟”样本筛选和分析的。
3.3 药物临床试验样本设计
药物临床试验样本根据药物研究的需要可以有很多设计,例如单因素单水平设计,单因素两水平设计,单因素多水平设计,配对设计设计,区组设计设计,重复测量设计等。我们这里以两因素区组设计为例来介绍一下样本筛选。本例仅以方法演示为目的,不考虑严格的医学专业意义。
本研究的疾病为动脉硬化心脏病,处理因素为药物应用,共有三种药物,分别为倍他乐克、诺和灵、硝酸异山梨脂。区组因素为年龄,分了三个年龄段。观察指标为血钠。我们科研设计按照“三要素、四原则”进行数据筛选。所谓“三要素”是研究人群,处理因素和观察对象。所谓四原则是指随机、对照、重复、均衡等原则。按照如下图一的输入条件,可以将数据集筛选出来,然后再用统计分析工具进行统计分析。
3.4 药物临床数据挖掘
应用数据挖掘技术不仅可以提高药物临床数据的利用程度,而且可以探索和发现药物临床应用中的新的积极作用和新的消极作用。利用多种数据挖掘方法分析临床试验数据和病人的电子化数据,可以确定药物更多的适应症和发现未知的副作用。在对临床试验数据和病人记录进行挖掘分析后,可以对药物进行重新定位,或者实现针对其他适应症的推广应用。通过对药物试验数据进行挖掘可能会发现意想不到一些成果,大大提高数据的应用效益。
如本例,我们使用数据挖掘的方法深入研究药物对于实验室指标的影响。探索和发现药物临床应用中的正负影响,可以通过观察病人用药前后的很多医学特征和生理指标来进行,而观察更加客观的各种实验室指标是很多药物研究的必备设计之一。下面是一个应用倍他乐克药物治疗冠心病的研究,我们应用了数据挖掘的有关技术分析了倍他乐克的血药浓度的变化对病人各个实验室指标的影响,如下图二,显示了部分实验室指标的影响结果。
以上结果需要与临床医务人员以及药物研究人员共同探讨。在刨去了各种人为因素以及业务系统客观影响因素之后,我们可以发现先前未知的倍他乐克对病人生理指标的影响,其中有些影响在医学上可能是积极的,而有些影响在医学上可能是反面的。
3.5 统计分析设计
虚拟药物临床试验分析系统的统计分析模块,包含了药物研发中常用的统计分析方法,如T检验、方差分析、相关分析、回归分析、非参数检验等,设计思路按照统计学思维,首先对数据进行验证,根据验证结果选择统计分析方法。下面我们以重复测量设计为例进行说明。
本研究的疾病为动脉硬化心脏病,处理因素为药物应用倍他乐克,观察指标为我们从数据挖掘中发现有影响的血钾指标。我们可以使用3.3提供的模块对筛选的样本进行提取和分析,也可以从本模块直接选取所需的数据并分析。重复测量分析有两种方法,一个是Hotelling T2检验,另一个是方差分析,本系统提供了这两种统计检验方法。
部分样本数据如下图三所示:
这里,我们仅观察一下方差分析方法的结果输出,如下图四所示。
从图中我们可以看到,根据P值得到:处理因素“倍他乐克”药物对血钾起作用,测量时间对血钾有影响,处理因素和测量时间有交互影响。从而验证了我们应用数据挖掘得到的结果。
4. 数据挖掘在中药研发上的应用
以上内容,我们重点是以西药的研究应用为例来说明以数据挖掘为特色的虚拟医药研究的方法。其实,数据挖掘和虚拟药物研究还非常适合于中医中药的研究工作,因为中医学本身是一个经过几千年不断摸索、积累和验证的、知识体系庞大的、具有完整理论体系的医学科学,但我们还需要应用现代知识不断地深入理解、挖掘、提高和应用,以便与现代科学能更好地融合。而数据挖掘正是探索和解释中医学奥秘的有力工具!
国内许多单位也开展一些中医中药数据挖掘的局部性的尝试。现在,我们就将这些数据挖掘在中医中药研究中的尝试加以汇总,分列如下: 1、中药配方中的文本数据挖掘; 2、对“药理”起关键作用的“有效成分”——单体或化学成分的挖掘; 3、中药方剂配伍规律的数据挖掘与研究; 4、方剂配伍物质基础与药效如(证侯、症状)关系的数据挖掘; 5、方剂配伍的用量与方剂效用级别间的关系(量效关系及模型) 挖掘; 6、中药药性理论与中药有效成份的关系挖掘; 7、方剂中各药味间的相关性挖掘; 8、相似病症的隐含相似关系挖掘; 9、同种疾病不同药方的相似性和差异性的挖掘和研究。 10、数据挖掘用于不确切病症的分类和研究。
‘贰’ 临床医学研究的三种方法
临床医学研究的三种方法是:观察法;实验法;理论法。
临床医学的介绍:
临床医学是研究疾病的病丛散侍因、诊断、治疗和预后,提高临床治疗水平,促进人体健康的科学。临床即“亲临病床”之意,它根据病人的临床表现,从整体出发结合研究疾病的病因、发病机理和病理过程,进而确定诊断,通过预防和治疗以最大程度上减弱疾病、减轻病人痛苦、恢复病人健康、保护劳动力。临床医学是直接面对疾病、病人,对病人直接实施治疗的科学。
临床医学需要在基础医学所取得的知识基础上诊治病人,二者的关系与基础科学和应用科学的关系有类似之处。然而还应看到,基础医学与临床医学的关系又有相当重要的不同之处。基础医学和临床医学都有认识人体(主要是健康人,也包括病人)生命活动、发现其中规律的使命,而临床医学是发现疾病的唯一途径,为医学发展提供了渗吵丰富的研究材料。
‘叁’ 大数据分析在疾病与健康研究方面的应用
大数据分析在疾病与健康研究方面的应用
大数据分析技术将在以上方面发挥着特殊的作用。
一、疾病与健康研究
在疾病与健康研究方面,我们可将其分为三个子方面:健康研究、亚健康研究和疾病研究。
1、健康研究
中国是地域辽阔的多民族国家,不同地区不同种群的人的基因和健康指标有所不同,同一地区同一种群的人在不同的性别和年龄上健康标准也有差异。深入研究和分析上述人群的健康规律,对卫生保健、健康促进、疾病预防和治疗有着重大的指导意义。例如:
1.1 对体检数据分析和挖掘,得出不同地区、不同人群的健康差异,以确定精确的不同人群的健康标准,针对不同人群制定适宜的防病,治病方法以及预后标准,并量身打造个性化,地区化的健康评估模型。
1.2 在制定不同地区不同人群的参考值时,可进一步分析健康指标在不同性别、年龄和季节的差别,以及权重比,从而完善适合于国人全面的系统化的更科学的健康参考值。
1.3 人体存在的内在平衡,使得各个可观察数据间有其特有的规律,基于经验只能发现简单的规律如钙、磷常数等,使应用数据挖掘等大数据分析技术可以主动发现复杂的系统性的人体医学规律,大幅提升防病,治病以及预后推测的技术水平,并且也对亚健康有个更科学的判断依据,以及了解健康到亚健康的逐渐失衡的过程。
1.4 对孕妇在孕产期、产后及新生儿的健康数据进行深入分析,研究孕产妇和新生儿的健康规律,开发对孕产妇和新生儿的健康评价和因素的评估模型,给出更科学的孕产妇和新生儿保健的指导。
1.5 对儿童成长的体检数据分析和挖掘,研究儿童的健康规律,开发对儿童成长的评价和因素的评估模型,分别适应中国辽阔的地域和众多的人群,给出更科学的儿童成长发育指导。
1.6 对老年人的健康数据分析和研究,研究老年人的健康特点,开发对老年人健康的评价和因素的评估模型,给出更科学的老年人养生的指导。
1.7 对健康人的精神和心理数据进行深入分析,制定健康人的精神和心理参考标准,开发对健康精神和心理的评价和影响因素的评估模型,给出更科学的精神和心理卫生方面的保健指导。
2、亚健康研究
世界卫生组织将机体无器质性病变,但是有一些功能改变的状态称为“第三状态”,也称为“亚健康状态”,主要包括:功能性改变,而不是器质性病变;体征改变,但现有医学技术不能发现病理改变;生命质量差,长期处于低健康水平;慢性疾病伴随的病变部位之外的不健康体征。
对亚健康进行深入分析与研究对保持健康状态,预防和纠正亚健康状态以及对疾病的预防和治疗都有十分重要的意义。例如:
2.1 研究亚健康与疾病间的相互关系。研究各种可观察指标(体检数据)在亚健康中的权重,以及在不同地区、人群中的分布。应用时间序列,线性/非线性回归研究亚健康观察指标之间的关联性。通过亚健康体检数据挖掘,分析导致疾病的影响因素,建立评估模型来预测危险度,并进一步建立疾病的预测模型。
2.2 研究亚健康与健康间的相互关系。通过对体检人群的地区、职业、年龄等因素的分析,研究最新的健康和亚健康的人群分布。不同的人群地区环境不同,生活习惯不同,加入亚健康医学指标以外的相关外部数据(如职业、饮食、习惯、性格、爱好等)后,可发现综合因素对亚健康的影响,以及这些因素的各自权重,及相关关系,从而探究出亚健康的原因,对预防和治疗亚健康起着指导作用。
2.3 研究亚健康治疗和预后的研究。通过对亚健康治疗和预后的数据分析,评价治疗效果,评估最佳治疗方案,进一步开展对专科亚健康治疗和预后的研究,同时研究其与疾病的关系。
2.4 对精神和心理亚健康的研究。如对常见的精神亚健康状态:如神经衰弱、抑郁、焦虑和强迫等症状,进行数据归纳整理、分析挖掘,从而导出精神和心理亚健康的新知识发现,探究出精神疾病的原因,对预防和治疗精神疾病起着指导作用。
2.5 将住院和社区健康管理数据相结合,进行因素权重分析和多因素的特性抽取,最后形成模型指导治疗。最理想的情况是个体化评估模型,为每个病人建立专用预测模型。
3、疾病研究
中国面临的严重危害人民健康的疾病包括:
传染性疾病,如结核病、艾滋病、SARS、禽流感、甲型H1N1流感等;
慢性非传染性疾病,如恶性肿瘤、脑血管病、心脏病、糖尿病等;
精神和心理疾病;
小儿出生缺陷。
对患有各种疾病的病人的医学数据及相关数据的研究分析,对各种疾病的预防和治疗都有十分重要的价值。例如:
3.1 对传染性疾病,如结核病、艾滋病、SARS、禽流感、甲型H1N1流感等疾病的研究。应用数据挖掘技术对传染性疾病的数据进行分析,找出传染性疾病的发病规律,揭示传染性疾病的病因,进一步摸索出传染性疾病的变异规律,建立传染性疾病的预测模型。
3.2 对慢性非传染性疾病,如恶性肿瘤、脑血管病、心脏病、糖尿病等疾病的研究。应用数据仓库技术和数据挖掘技术对慢性常见病的数据进行分析,找出慢性常见病的发病规律,探索慢性常见病的病因,进一步摸索出慢性常见病的并发症规律,科学评估各种治疗方案的疗效,建立慢性常见病的预测模型。
3.3 对精神和心理疾病的研究。应用数据仓库技术、数据挖掘技术和数理统计技术对精神和心理疾病的数据进行分析,从广泛的多变量集中找出影响精神和心理疾病的主要因素,在遗传学、后天影响和病理学等多方面探索精神和心理疾病的病因,科学评估各种治疗方案的疗效,建立精神和心理疾病的预测模型。
3.4 对小儿出生缺陷的研究。应用大数据分析技术对儿童出生缺陷的数据进行分析,从广泛的大变量集中找出影响儿童出生缺陷的主要因素,在环境、遗传学、病理学等多方面探索儿童出生缺陷的病因,建立儿童出生缺陷的预测模型。
3.5 针对门诊和住院病人数据在线分析统计学差异,寻找阳性案例,为研究提供素材,并为科研的预实验提供思路和准备。对住院数据进行多维度分析和挖掘,横向达到单病种的水平,纵向包括所有可观测数据,所收集来的知识有很大可能会启发医学专家有新发现。
3.6不同 治疗手段和治疗效果的在线分析。结合收集来的大量资料全面分析,尽量提前全面的了解治疗的临床效果。
3.7 药品治疗效果在线分析,治疗效果、副作用、对其他疾病的效果评估。结合收集来的大量资料全面分析,尽量提前全面的了解新药和老药。目前的药品不良反应主要靠医生的通报,对医生的职业素养和敏感有很大的依赖,而使用数据挖掘及数据库中的知识发现,可以极大限度地改进这项工作。
二、环境与健康研究
环境因素对健康造成的损害较其他健康损害复杂,是微量、慢性、长期和不可逆转的。环境健康影响与公众利益息息相关,环境健康损害如得不到妥善处理还将转化为社会、经济问题。环境与公共健康研究以人类生态系统可持续发展研究为基础,关怀人类现在和未来的健康与安全,从环境研究途径关注社会、经济活动对人类生理和心理的健康影响,探索环境变迁对人民健康造成危害的预防和治理措施。
应用大数据分析技术对环境健康的研究,主要包括发现案例、发病机理和临床治疗研究,预防和治理各类环境流行病在污染源以及污染途径控制的研究等。例如:
1. 应用大数据分析技术研究环境因素对健康的影响,实行 一体化的环境和健康监测,并在全国实现数据共享。
2. 应用大数据分析技术研究环境污染对儿童的影响,以解决环境对儿童所造成的不健康和疾病迅速增长的问题,从而给予儿童特殊注意的环境和健康指导。
3. 应用大数据分析技术开展职业病和职业多发病的预防预测。对于各种职业的发病分布和严重程度,以及对职业病的深入分析。不仅包括传统意义的职业病,也包括不同职业的不同的疾病分布和在病因中的权重。另外,还可以分析不同职业的暴露特点进而对病因进行研究。
4. 应用大数据分析技术开展对空气污染显着提高城市人群呼吸道和过敏性疾病的发生 率的研究。
5. 应用大数据分析技术开展噪声污染损害儿童的听力和干扰他们的学习能力的研究。
6. 应用大数据分析技术开展快餐业的发展使肥胖病发病率不断增长的研究,尤其是不合理的营养对儿童健康的影响。
7. 应用大数据分析技术开展对转基因生物技术的应用对自然界生物和人类基因的潜在影响的研究。
三、医药生物技术与健康
生物技术涵盖生命科学的所有领域,医药生物技术是生物技术的重要组成部分。当今人类面临的人口、食物、健康、环境和资源问题,无不与之紧密相关。医药生物技术最鲜明的特点是大量新思想、新技术、新材料、新方法和新产品引入医学研究和医疗保健之中,如全新的医学成像技术、基因工程技术、微电子技术、干细胞工程技术、组织工程技术、纳米技术、生物芯片技术、克隆技术、酶工程技术、细胞工程技术、发酵工程技术、蛋白质工程技术、生物医学工程技术、基因组与蛋白质组技术、生物信息技术和中医药技术等及其产品,将大大提高疾病预防、诊断、治疗和药物设计研制水平,以及对突发事件(如传染病和生物恐怖等)的检测、预防与治疗水平。
以大数据分析技术为核心的生物信息技术在由众多新技术构成的医药生物技术中发挥有独特的作用。例如:
1. 利用生物信息技术进行生物信息的存储与获取。
2. 利用生物信息技术开展基因的序列对比、测序和拼接。
3. 利用生物信息技术进开展基因预测。
4. 利用生物信息技术进行生物进化与系统发育分析。
5. 利用生物信息技术进行蛋白质结构预测和RAN结构预测。
6. 利用生物信息技术进行分子设计和药物设计。
7. 利用生物信息技术进行肿瘤分类及遗传学分析。
8. 利用生物信息技术开展在生物分子层面对精神病的研究及遗传学分析。
9. 利用生物信息技术开展在生物分子层面对如H1N1等传染病的研究。
四、卫生宏观决策支持
卫生宏观决策支持系统是以数据仓库为数据中心、以数据挖掘为技术核心、以商务智能为展现工具的综合卫生信息平台。它可以建立在各级别卫生系统上,如医院、地区卫生系统、全国卫生系统,为各级卫生部门提供智能决策系统,深入了解卫生系统的历史和现在,把握卫生系统业务发展的未来,评估卫生系统内部各部门的业务效绩,帮助各级决策者提供最佳实施方案,给决策者一双慧眼,清晰认知系统内各方面变化趋势和业务得失,使对系统各部门的评价、考核、奖励更加科学、公正、客观,使系统内各级关系更加和谐,积极发挥各部门的潜能,提高系统的整体业务水平和经济效益。使用商务智能辅助决策,可以提供各种有价值的信息,各种事件的关联,以及不同于微观的角度分析各种卫生信息,如预防接种基本数据,传染病报告等等。
以上是小编为大家分享的关于 大数据分析在疾病与健康研究方面的应用的相关内容,更多信息可以关注环球青藤分享更多干货