6月17日,中国科学院院士赵国屏应邀在金沙9001w以诚为本入口健康医疗大数据研究院报告厅作了题为“中国的生物医学大数据体系-全维度数据与智能诊疗中的科技问题”的专题报告。金沙9001w以诚为本入口副校长、金沙9001w以诚为本入口院长陈子江主持报告会。
赵国屏院士在报告中首先说明生命科学和医学已进入大数据驱动的颠覆性变革时代。从第一次分子生物学革命到第二次基因组学革命已过渡到由生命科学、物理化学、工程科学交叉汇聚的第三次革命。研究平台也从20世纪的理论科学、计算科学逐渐转化为科学民主/大众化的生物学科研范式的工程化研究平台。
赵国屏院士还认为,生物医学研究及应用数据爆炸性增长催生了转化医学研究和精准医学研究的出现。系统生物医学的研究体系是传统的认识健康和认识疾病,转化医学研究则是将从临床获取的数据经过转化再返回到临床的研究,是一个“Bench side”到“Bedside”再到“Bench side”来回往返的过程。目前,生物医学研究已经进入了第三个阶段—精准医学研究阶段。赵院士提出医学研究是将单个数据进行分析,建立数据间联系,进而织成网络,最终形成医学知识的过程。但是仅形成医学知识是不够的,要利用医学知识建立工程系统服务社会才是最终目的。在整个研究过程中,都会产生大量的数据,从而形成了生物大数据。生物大数据具有“质量”“数量”“结构化”和“可信度”等特性。
赵国屏院士综合之前所讲,概括数据主要来源于三大部分:“组学”数据来源、系统生物医学数据来源和转化医学/精准医学数据来源。这些数据可以分为五大类,第一类是基础研究数据,包括实验/文献数据;第二类是个人/自然人群健康/临床数据,是反映真实生活的数据。介于这两类数据中间还存在三类数据。一是系统生物学与合成生物学数据,是系统/工程数据;二是比较医学数据,主要是来源于动物实验以及将动物和人类作比较实验获得的数据;三是转化型研究数据,如人群队列/流行病调查临床转化医学研究产生的人群系统研究数据。以上三类数据可以用于生物医学核心研究。
在讲到生物医学研究的情怀与责任时,赵国屏院士回顾了1999年到2016年中国生命科学与生物医学界的发展历程,并结合自身研究经历说明了生物医学大数据价值实现所面临的挑战。赵国屏院士认为,目前生物医学大数据具有多尺度、高维度和异质性等特点,导致获得的数据信息碎片化、孤岛化,使得生物医学大数据具有体系复杂、价值密度低的问题。赵国屏院士进一步提出,想要解决这些问题,就要组织数据积累的科学互动,建设完整安全的数据管理应用技术体系;搭建数据服务的工程平台,创建先进适用的数据链服务体系;建设数据人才的成长基地,培养人才和组建研发队伍及组织。最后,赵国屏院士介绍了国家生物医学大数据基础设施建设的初心是融合生物医学大数据和人群样本信息支撑生物医学基础和临床研究。仅靠单纯项目支持和搭建科研/医学机构或企业是走不通的,必须建设国家统一的权威性服务型公益性设施才能实现。
健康医疗大数据研究院师生员工、齐鲁医院、千佛山医院、济南市儿童医院及济南市儿科医学研究所的专家共一百余人聆听了此次报告。