AWS推出生物科技、医疗产业用的资料湖服务

本周AWS在Re: Invent大会上针对医疗及制药业推出健康看护、生物科技业专用的资料湖服务Amazon HealthLake。

Amazon HealthLake为符合健康看护资料可携式规范HIPAA的资料湖服务,可集结医疗院所、药厂各个孤立资料源,以及不同格式的资料到AWS资料湖,并以机器学习自动完成资料范式(normallized)、加标注,以利用于资料分析及搜索,通过以资料湖集结各种医疗资料源,构建对病患的完整视角,找出过去看不到的关联和趋势。

随着机器学习技术的流行,许多医院或药厂也开始推动项目。医院搜集了从家族病史、临床观察到诊断与开药等大量资料,以便能借由机器学习和分析来促进看护品质、分析总体趋势或改善作业效率。但是临床资料种类复杂、存储在不同地方的不同系统中,且经常填写不齐全。要用于机器学习前,医院信息必须集结起来并以标准化FHIR(Fast Healthcare Interoperability)格式存储资料,但是前述资料往往是非结构化形式,还必须标注、加索引并以年份排列整理,资料才能为机器理解,并利用搜索。

医疗业也试图使用rule-based工具来标注资料,但碰到拼错字、打错字、文法错误,这些工具就无法使用,而光学扫描软件则缺乏医疗专业,无法有效处理资料。医院最后只好改回手动输入。这些工作外,医院还必须自己开发分析或机器学习应用,才能针对资料分析出关联、找出趋势或进行预测。

Amazon HealthLake方便让医院或药厂存储、标注及标准化这些资料。利用Amazon HealthLake,医院可将资料从本地系统复制一份到AWS上,它会自动范式,之后HealthLake利用训练过、能理解医学词汇的机器学习算法,来识别并为临床信息加上标注、为事件按时序加索引,再加入标准化标签(如医药、条件、诊断和疗程),以方便未来搜索。此外,这些信息会按FHIR产业格式架构,便于和其他单位或第三方应用互通、分享,也方便病患查询电子病历。

此外,AWS也计划,Amazon HealthLake客户再搭配其他AWS工具使用,像是交互报表Amazon QuickSight、机器学习模型训练平台SageMaker。例如在Amazon SageMaker中以Jupyter Notebook范本来分析,像是诊断预测、再入院几率、或是开刀房利用率预测等。

Amazon HealthLake目前客户包括电子病历软件大厂Cerner、医疗科技企业Ciox Health及医院Konica Minolta Healthcare等。