人工智能时代,医疗大数据方面也有所更新,医疗数据库如何为行业提供更好服务,值得探究。6月3日下午,2017北京常春藤医学高端人才联盟健康产业论坛火热进行中。本次论坛的议题是“医疗大数据的现在和未来”,中国临床肿瘤学会(CSCO)临床数据专业委员会委员、新屿信息科技(上海)有限公司CEO王学兴先生在论坛上对科研数据中心建设进行讲解。
以下为发言原文(有删减):
发言人:王学兴中国临床肿瘤学会[CSCO]临床数据专业委员会委员、新屿信息科技(上海)有限公司CEO
首先非常感谢有这样一个机会。我曾经也是一名外科医生,后来一直专注于做肿瘤大数据的应用,所以今天借这个机会,从科室的角度,或者是从临床医生的角度,分享科研数据中心建设的心得。
早期我们用一套数据库的时候,更多的功能是用在做搜索,但是在精准医疗的背景下,我们怎么把这个数据库的功能再扩大一下,成为做科研和探索的工具呢?在精准医学或者大数据任务的背景下,对医生来讲,它的财富除了知识或者技能以外,那么显然最重要的就是数据。以前我也是外科医生出身,所以经常觉得,手术水平很高,觉得自己就可以独行天下。但是在今天人工智能的环境下,数据可能是比技能更重要的东西。那么我们在整个行医的生涯中,其实除了去学习知识技能以外,也应该从今天开始去积累数据,这才是我们最宝贵的财富。
整个医疗数据的分析维度,可以简单地分为四个层次,第一国家或者政府在讲的行业大数据,从卫计委的大数据去看整个国家疾病的发病率等,这是一个传统意义上的大数据。而我们从一个群体的数据去分析,更多的是偏向于科研分析。还有站在个人的基础上,对一个人进行医疗数据的个体化项目,对他提供更精准的治疗指导意见。第四在微观层面上,随着现在GS、基因数据的出现,微观层面进行数据分析。其实明码生物科技首席技术官孙宏业介绍的平台无非是把临床数据和基因大数据以及一些环境数据、基因数据整合一起,做管理分析。
我会着重于临床大数据的分享,因为临床数据是每一个病人最重要的数据来源之一,很多资料写在系统里面,或者最早的时候写在病例里面,这些数据在今天仍然没有被最大化的利用起来,这本身就是一个宝库。另外涉及到患者数据的整合时,我们把临床大数据和基因大数据以及一些环境大数据做数据分析。把所有的数据整合在一起,这样的数据产生才有价值。可能目前的信息是被割裂的,也是我们常说的在医疗行业信息孤岛现象非常严重,那首先我们也要去解决这样的问题,从临床数据的角度出发,进行统一的编码存储。如果信息数据只是临时的堆在一起,编码不统一的话,那么这些数据的利用价值就大大降低了。从临床出身的人往往会习惯性的用临床思维来思考数据,那么怎么样用数据思维来看待手里的每一份数据呢?第一,我想给大家讲的数据及价值。
数据是最重要的带有价值的资产,做过科研的人都有对于科研数据处理的困惑,“一题一库”即做一个临床研究课题的时候,都会建立一个数据库,但如果要做多个课题,就要做多个库,尤其像肿瘤,分类标注。从做研究的流程来讲,医生都知道病例是一手数据源,然后把数据进行统计分析,最终完成一篇篇的论文或者研究成果。