公卫考研-小卫智库 | 大数据时代,机器学习如何助力精准医疗?
在大数据时代
机器学习如何助力精准医疗呢?
和小卫一起来看看吧~

相关背景
精准医疗(precision medicine)自被提出以来,便引起了国际社会的广泛关注。基于基因测序技术实现精准诊断、用靶向药实施精准治疗、建立大数据预测健康风险并实现精准预防等实践应用中,精准医疗对提高疾病预防和诊治效益、改善人群健康所发挥的作用日益突显[1]。
今天,小卫就结合亚组分析,具体谈一谈机器学习如何助力精准医疗。
01
精准医疗
精准医疗起源于1960年被发现的费城染色体融合基因,针对该基因进行了靶向药物研究[2]。
2015年1月,奥巴马宣布“精准医疗计划”,使得精准医疗获得了世界范围的关注,并将精准医疗定义为一种新的、综合评估个体基因、环境和生活方式差异后,所采取的疾病防治方法[3]。核心内容为药物基因组学和大型队列研究。
精准医疗的组织框架有两种:1.为某疗法找到适合它的目标人群,例如,某药物三期临床试验虽失败,但希望找到试验药物中获益的亚组;2.为患者找到适合他们的治疗方式。
02
机器学习
随着计算机技术、信息技术和互联网技术的迅速发展,社会各个领域积累了海量的数据。如何在这些海量数据里挖掘出有用的信息是目前各行各业所面临的问题,而机器学习作为解决数据挖掘问题的主要方法之一,在医疗领域得到了广泛应用[4],例如,疾病预测、疾病辅助诊断、疾病预后评价、新药研发、健康管理、医学图像识别等。
机器学习是一种能自动构建出模型用来处理一些复杂关系的技术,它使用计算机模拟人类学习行为,通过学习现有知识,获取新经验与新知识,不断改善性能并实现自身完善。
机器学习一般根据处理的数据是否需要人为标记分为监督学习、半监督学习和无监督学习三类。其经典算法包括:决策树、贝叶斯网络、人工神经网络、支持向量机和深度学习等。
在公共卫生学领域,无监督学习已被用于空间和时空分析,暴发确认和监测等;利用半监督学习来构建基于社交媒体数据的不良药物反应的早期预警系统,根据智能手机的数据监测意外跌落情况,以及识别异常空气污染物以及其他应用;监督学习已被用于预测结核病的传播以及社交网站用户转向自杀意念的情况等[5]。
03
亚组分析利用机器学习算法助力精准医疗
奥巴马宣布“精确医学计划”后,FDA(美国食品药品监督管理局)对此在相关文件中强调了患者对于治疗方法反应的异质性对于药物研发是非常重要的,识别出对特定治疗手段有较好疗效的亚组人群,并证明这种获益对患者是客观存在的,是实现精准医学中个体化治疗的重要手段,而这也正是亚组分析的目的[6]。
亚组通常由患者的一个或多个内在和/或外在因素来定义,而且具有一定的临床意义,这些变量通常是基线变量,包括人口学特征(如年龄、性别等)、实验室检查指标、基因组相关标志物、疾病严重程度分型、临床状况(如合并症、伴随用药)、地区(如国家、试验中心)和环境因素等。
亚组分析根据研究角度具体可以分为设计驱动的亚组分析(guidance-driven)和数据驱动的亚组分析(data-driven)。其中数据驱动的亚组分析使用了机器学习算法,其主要思路是基于亚组人群产生的原因,即亚组人群的特征协变量与不同的处理产生了交互作用,利用机器学习算法寻找交互项就可以确定获益亚组。
数据驱动的亚组分析根据建模思路的不同,可以分为全局结局建模(globle outcome modeling methods)、全局处理效应建模(globle treatment effect modeling)、最佳治疗机制(optimal treatment regimes)和局部建模(local modeling methods)四类[6]。不同的建模思路也对应不同的算法。
目前关于数据驱动的亚组识别的研究已有很多,但其仍存在一些问题,例如,盲目的亚组探索和数据挖掘可能导致Ⅰ类错误膨胀;又如,由于模型空间大,过度探索会导致过拟合的问题,进而导致预测力变差。精准医疗的发展需要亚组分析的进步,期待在此方向更多的突破性研究。
参考文献:
[1]杨玉洁,毛阿燕,乔琛,都恩环,黄佳文,张旭,邱五七.精准医疗的概念内涵及其服务应用[J].中国医院管理,2020,40(01):5-8.
[2]范美玉,陈敏.基于大数据的精准医疗服务体系研究[J].中国医院管理,2016,36(1):10-11.
[3]田埂.“精准医疗”引发医学革命[J].中国经济报告,2015(6):112-114.
[4]兰欣,卫荣,蔡宏伟,郭佑民,侯梦薇,邢磊,那天,陆亮.机器学习算法在医疗领域中的应用[J].医疗卫生装备,2019,40(03):93-97.
[5]刘杨,李辉,曾新颖,董文兰,刘世炜.健康大数据在慢性病预防控制中的应用[J].中华流行病学杂志,2020,41(12):2163-2168.
[6]Lipkovich Ilya,Dmitrienko Alex,B Ralph. Tutorial in biostatistics: data-driven subgroup identification and analysis in clinical trials.[J]. Statistics in medicine,2017,36(1).
**注:本文仅供考研学子学习交流,欢迎大家分享自己的看法。
公卫考研er复试加油!
一战成硕!

合作作者
山心老师
西安交通大学 公共卫生硕士