如何确保数据湖安全
作为一家以心血管AI为主打产品的公司,科亚如何理解城市级医疗大数据体系在新形势下的建设内涵? 科亚医疗负责人向雷锋网表示,城市级医疗大数据体系的建设就是:一个使医疗大数据从医疗真实世界的数据变成证据和工具,发挥其价值,推动临床试验和精准诊疗的发展过程。 在医改和新基建的大背景下,实现城市级医疗大数据的有效应用成为医院管理、建设的重要工作之一,数据驱动医院精益运营升级将成为医院发展的重要战略方向,也成为价值医疗升级的基础保障。 但随着医疗大数据体系建设的逐渐深入,也陆续暴露出一些问题和难点。 首先,数据归属不明确 目前,我国没有明确的法律规定数据归属问题,医疗数据使用权到底是患者个人、医疗机构、还是参与建设的企业? 医疗行业内的共识是:数据是患者、医生、医院三方共同的资源,且不能直接用作盈利,一般来说数据可以找科研项目合作中使用,使用前必须经过患者同意、医生必须得到医院科研项目申请批复。 因此,大多数AI医疗公司仍是通过与医院或主任合作科研项目,获取数据训练模型。 其次,数据安全要求高 医疗数据涉及个人数据隐私方面的问题,因此要特别注意个人数据隐私保护,中国《网络安全法》规定“网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是经过处理无法识别特定个人且不能复原的除外” 所以,AI医疗公司在使用数据时要进行数据的无法识别特定个人处理,这在一定程度上能够帮助AI医疗公司规避数据安全问题。 第三,数据开放受限制 中国的医疗数据开放程度有限,主要体现两个方面:一是境内与境外的流通限制,二是医院与医院或医院与公司之间流通的限制。 境内与境外的限制其实很简单,这个各个国家都有相关规定,而且有的国家规定的更加严格,比如美国和欧洲。在医院与医院的流通限制方面,我国大部分的医院数据都是独立存在的,流通起来相对困难,更谈不上共享和数据交叉应用及数据变现。 2017年以来,国家通过立法逐步规范和开放数据的使用,同时陆续建立各类数据应用平台,通过国家力量和产业资本的结合,加快医疗数据的互联互通和数据共享机制,为医疗大数据的应用带来红利。 第四,数据标准不统一 我国人口众多,医疗数据丰富,但”数据大“不等于 “大数据“,临床数据不够统一和规范,不同地区、不同医院之间的数据没有建立起联系,也没有统一的标准,因此价值也得不到体现。 比如影像系统的数据标准问题,超过80%的医疗大数据为影像形式,但PACS系统的生产设备和数据标准是不一致的,数据交流存在诸多障碍。 第五,数据伦理有争议 尽管AI在医疗行业取得了令人瞩目的进展,但不可否认的是,AI的应用依然存在一系列的伦理问题,比如:AI造成了个人信息泄露,导致医疗事故,责任方是谁?AI的使用造成了医疗人员的失业,引发医疗产业结构的转型,社会应该如何应对?诸如此类的问题很多,都需要行业从业者去面对和解决。 第六,数据成本代价高 所有基于AI的医疗技术,都是以”数据“为基础的,目前AI医疗公司获得数据的渠道分为三种:第一种,与医院合作科研项目 第二种,从公开数据集下载数据,第三种,购买数据。
总体来说,AI公司获取数据的成本主要在数据获取和数据标注上,而且随着模型训练的逐步深入,数据吞吐量可能会是几何级数增长,代价也会水涨船高。这对于AI公司的运营来看,将是一笔不小的负担。 (编辑:宜春站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |