台大医院与微软合作,共同投入COVID-19患者基因分析研究

2020年以来新冠病毒肆虐全球,台大医院参与微软全球AI for Health计划,运用Azure HPC(高性能计算)在全球最大英国Bio Bank的基因素据库进行大规模运算,不仅大幅提升40倍以上运算效率,也成功完成亚洲第一大规模的基因插补程序,实质推动基因研究进展,为将来科学研究铺下基础,推动疾病预防落实。

台大医院智能医疗中心副主任李建璋表示,随着许多研究证实疾病和基因有密切关联,基因测序逐渐受到医疗界重视;既有的服务器不足以运算庞大的基因资料量,加上暴增的数据量难以即时扩大投资设备,是研究团队普遍面临的两大难题。

台大医院院此次参与微软AI for Health项目,接轨全球计算资源与技术专家,让台大医院不仅成功突破运算瓶颈,推进基因研究迈向新的里程碑。期盼未来可以持续携手科技创新力量,加速医疗产业研究历程,为全球医疗产业打开新扉页。

在疫情期间,台大医院即观察到许多非典型案例,如患有慢性病的长者虽得到新冠肺炎但却在短期内痊愈,或是不具有慢性病病史的年轻人得病后却很快地去世,若能通过交叉比对基因位点资料,找出关键基因并创建风险评分机制,将可防范疾病于未然,大幅提升国民健康。

每个人的基因皆是世上独一无二的组成,世界卫生组织研究显示,多数重大疾病是由先天基因体质与后天生活环境交互作用之下累计而成的结果。通过基因检测不仅可让人们充分了解先天体质,也能预知患疾病的风险。目前数据中每人会有大约73万个比较常见的基因变异位点,在基因采检时常有部分基因位点缺漏的状况发生,因此医疗团队在通过AI分析基因前,都需要花费至少数个月的时间,以机器学习方式预测遗失位点,补齐所有基因资料。

面对此次英国Bio Bank所提供50万笔的人体生物样本资料,台大医院现有的传统服务器在运行数个月后仍停留于插补程序运算,迟迟无法进展至分析阶段,因此去年九月开始与微软Azure专业技术团队合作。

台大医院智能医疗中心副主任李建璋表示,医院现有地端服务器不足以运算庞大基因资料运算量,也难以应对暴增的数据量而扩张,是研究团队面临的两大难题。

微软全球黑带专家,亚洲区HPC/AI解决方案副总经理冯立伟表示,面对现有研究环境在处理巨量资料的局限性,微软不仅顷注Azure HPC高速算力与技术团队,更寻求R程序组件海外创办者协助与Intel技术合作,共同进行算法的修正与优化,找出最佳云计算硬件规格及资料量大小切割方式,进行基因插补与分析,因此能在合规、安全的Azure云计算环境下,通过Azure HPC提升基因运算速度40倍以上,大幅缩短分析时间、推进研究进程并确保医学资料安全。

奠基在Azure HPC运算优势上,原需耗费数个月的1万8千名COVID-19患者基因资料插补与分析,成功缩短至仅仅5小时,双方团队更将原需要计算超过二年以上的50万笔基因,提前至四周内完成分析,下一步更预计将基因库内每笔人体生物样本近亿个基因位点资料运算完毕,成为未来精准医疗的基础。

微软与台大医院期望研究成果将可带动多基因风险分数等评估方式的创建,协助患病高风险群体提早预防与治疗,更促进学术研究正向发展,并将人类基因研究拓展到更多医疗领域上,推进医疗产业研究历程,实现以事前预防取代事后治疗的目标,赋能全世界医疗组织守护全球人民健康。