6.3 基因大数据和精准医疗
中国科学院院士、中科院生物物理研究所陈润生研究员指出,医疗体系要实现从治病到预防的这种转变,依赖于两个方面:首先,依赖于组学的发展,之所以能产生精准医学这个词,就是因为从基因组研究开始导致了所有组学的发展,使得我们能从更精确的层次上,对生命活动有所了解。没有基因组学和其他组学的发展,精准医学就精准不起来。所谓精准,就是精准到分子水平,我们能精确地知道疾病、健康、生命活动的分子基础,包括基因组、转录组、蛋白质组、代谢组学等一系列组学。所以精准医学的一个基础是组学,那么有了组学以后,同时要有对相应大数据的把握、获取、分析、解释等各个工作。其次,依赖于生物信息大数据的发展,这些工作正好涉及建立大数据的一套办法。
因此,组学和大数据是当前决定精准医学发展的一个基础。而二者结合起来刚好是生物信息学家所最关心、所正在从事的研究。生物信息学正好站在国际当前两大科学前沿的交汇点上,这决定了生物信息学的重要性、它承担的责任和未来的重要前景。
英特尔(中国)有限公司健康与生命科学亚太区业务创新经理李健认为,精准医疗是一门大数据驱动的科学,精准医疗不同于传统的单个学科的单兵作战,它更是一个多学科融合的学科,是包括病理科、影像科、分子医学、遗传学、计算科学等领域的综合。当然更重要的,还有的基因组学。
从数据的维度来看精准医疗,包括数据的采集、数据的互联、数据的分享,以及数据的计算和分析。同时,它也包括数据的标准化、隐私和安全问题。
以下因素促进了生物医学领域大数据的出现。
(1)生命的整体性和疾病的复杂性。例如,严重威胁人类健康的慢性病多为复杂性疾病,其发生具有复杂的遗传和分子机制,受到基因、环境及其交互作用的影响,其病因学研究将产生大量的数据。
(2)高通量技术的发展和基因组测序成本的下降。高通量测序技术可以对数百万个DNA进行同时测序,使得对一个物种的转录组和基因组进行细致全面的分析成为可能。随着人类基因组计划的完成和计算能力的快速发展,每个基因组的测序成本已从数百万美元降低至数千美元(并且还将继续降低),这将产生海量测序数据。医疗的真正大数据来源于基因检测。传统的医疗产生的数据通常才几十兆(M)字节,大型影像学检查已经达到几个GB,但这些影像信息更多是用于三维重构,而不是大数据分析。而在基因检测方面,一个人遗传密码可以用30亿个字符来描述,存储到文件里大小为3GB左右,与一部高清电影的大小差不多。利用主流的基因测序技术对遗传密码进行测定的话,所产生的原始数据超过90GB甚至几百GB,再加上蛋白质,加上影像系统好几个TB才能够做成一个人的数据。华大基因现在一年才做几十万人,一年产生30多万PTB的数据,产生的数据和腾讯都是差不多的,如果是大人群更不得了,所以这是真正的大数据,每一个个人的基因大数据。
(3)生物医学大数据广泛涉及人类健康相关的各个领域:临床医疗、公共卫生、医药研发、医疗市场与费用、个体行为与情绪、人类遗传学与组学、社会人口学、环境、健康网络与媒体数据。
生物医学基因大数据有以下几方面的应用。
(1)开展组学研究及不同组学间的关联研究。从环境、个体生活方式行为等暴露组学,至个体细胞分子水平上的基因组学、表观组学、转录组学、蛋白组学、代谢组学、宏基因组学,再到个体健康和疾病状态的表型组学等。利用大数据将各种组学进行综合及整合,既能为疾病发生、预防和治疗提供全面、全新的认识,也有利于开展个体化医学,即通过整合系统生物学与临床数据,可以更准确地预测个体患病风险和预后,有针对性地实施预防和治疗。
(2)快速识别生物标志物和研发药物。利用某种疾病患者人群的组学数据,可以快速识别有关疾病发生、预后或治疗效果的生物标志物。在药物研发方面,大数据使得人们对病因和疾病发生机制的理解更加深入,从而有助于识别生物靶点和研发药物;同时,充分利用海量组学数据、已有药物的研究数据和高通量药物筛选,能加速药物筛选过程。
(3)快速筛检未知病原和发现可疑致病微生物。通过采集未知病原样本,对病原进行测序,并将未知病原与已知病原的基因序列进行比对,从而判断其为已知病原或与其最接近的病原类型,据此推测其来源和传播路线、开展药物筛选和相应的疾病防治。
(4)实时开展生物监测与公共卫生监测。公共卫生监测包括传染病监测、慢性非传染性疾病及相关危险因素监测、健康相关监测(如出生缺陷监测、食品安全风险监测等)。此外,还可以通过覆盖全国的患者电子病历数据库进行“疫情监测”,通过监测社交媒体或频繁检索的词条来预测某些传染病的流行。
(5)了解人群疾病谱的改变。这有助于制定新的疾病防治策略。全球疾病负担研究是一个应用大数据的实例,该研究应用的数据范围广、数据量巨大,近4700台并行台式计算机完成了数据准备、数据仓库建立和数据挖掘分析的自动化和规范化计算。
(6)实时开展健康管理。结合可穿戴设备对个体体征数据(心率、脉率、呼吸频率、体温、热消耗量、血压、血糖、血氧、体脂含量等)的实时、连续监测,提供实时健康指导与建议,更好地实施健康管理。
(7)实施更强大的数据挖掘。数据挖掘的任务包括关联分析、聚类分析、分类分析、异常分析等。大数据挖掘能够增加把握度和发现弱关联的能力。
大数据改变的不仅仅是产业本身,更重要的是,它改变了人们的生活方式。在精准医疗方面,医疗大数据带给人们不仅仅是最优的诊断和治疗计划,而是通过数据的挖掘和筛选,对未来生活方式的改变作出正确的指导。斯坦福大学医学院院长劳埃德·米诺在推行医疗大数据的应用时提到:“我们已在和谷歌、苹果公司合作,也将与更多中国科学家合作。”劳埃德这里说的“合作”,其实就是通过医疗大数据的挖掘和筛选,给政府、医保政策制定者、医院以及大众更好的生活方式指导。
2020年以后的社会,我们会看到大数据影响着我们的生活。任何商业的行为都将回归到人性的行为。大数据的积累,最终会回归到以人为中心。人的一切行为是否能够形成信息化,没有人能够回答,但是以人为本形成的数据化,这是已经实现的时代。
到2020年的时候,5G时代的到来应该能够实现,每秒钟传输一个人的基因组数据不会是一个梦想,小型的DNA快速检测仪会是大众手上的一个很酷的健康玩物。这样一个基因信息时代,是大数据的时代,还有五年时间,跨界的大数据玩家和基因行业的生物信息产品经理,将是这个时代的弄潮儿。
在基因信息化时代,有两个很明显的标志:一个是基因数据搜索引擎的出现,另一个是基因产品的封装和实用性不断提高。基因信息化的形成需要对基因大数据的接入和搜索进行重新的定义。在经历了大数据时代基因信息的存储、分析、解读和标准化接口应用等环节的成熟,人们对于基因信息化的需求会不断的提高。这个需求导致的结果就是基因搜索引擎的出现。一旦搜索引擎的成熟应用得到推广,基因产品的研发将能够在一个封闭的生态环境里面不断得到加速。产品的研发会被封装,实用性会以提高用户体验为核心,最终这样的生态环境,带来的是信息化时代的到来。
作者:何嘉焜 时间:2024-05-18 19:20:38 文章来源:原创
作者:码万祺 时间:2024-05-18 19:20:38 文章来源:原创
作者:码万祺 时间:2024-05-18 17:37:49 文章来源:原创
作者:李钊 时间:2024-05-17 17:57:51 文章来源:首发
作者:邵珠富 时间:2024-05-17 17:48:25 文章来源:原创
作者:晨晓 时间:2024-05-17 17:48:25 文章来源:转载