独乐乐不如众乐乐,今天您分享了吗?
欣姐碎碎念
转眼间,2020年已经过了5个多月了。这小半年,除了疫情和见证历史,大家还做了些什么?不知道大家是已经习惯了家里蹲的状态,还是实在蹲不下去了呢?
随着各国开始解封,外出和聚集的人群越来越多,世界各地爆出不少解封后聚集性爆发的新闻。出门or不出门,这还真是个难题。以色列的一家医疗机构联合人工智能公司,为这个难题找到了一个可能的答案。
04
Covid-19个性化风险预测
核心问题:Covid-19爆发造成的医疗资源挤兑是一个世界性的问题。各国根据自己的医疗资源和执行能力,选择了不同的方案来平衡。总体来讲,高风险人群,也就是老年人、有基础疾病和免疫缺陷的人群,应受到额外的保护。但是,基于统计概率的粗略划分,总会漏掉一些情况,我们也听到许多年轻人甚至儿童重症甚至死亡的病例。因此,我们需要一个更个性化的模型来预测感染者的预后,而这一点正好人工智能可以帮忙。
以色列在这次新冠疫情中的表现可圈可点,两个月基本控制住了境内的疫情,已进入解封期。感染人数16000+,死亡不到300人,死亡率在1.7%左右,远低于世界平均水平。犹太民族经过了历史上漫长而惨痛的颠沛流离,却能在很大程度上握住世界经济的命门。以色列作为一个只有73年历史800多万人口的小国,又处在战乱区的边缘,国民幸福指数却一直在世界前10位左右,这与犹太民族的高度自觉,务实进取的公民意识密不可分。此外,以色列的人均科研投入,过去二十年一直稳居世界榜首,而特拉维夫更是近年来为数不多的仅次于硅谷的创新中心之一。这次新冠蔓延,有多家以色列的人工智能公司,从不同角度参与了帮助对抗新冠的斗争。本期我们来看看其中比较典型的一个应用。
Medial EarlySign是一家基于医疗大数据预测疾病风险的人工智能公司。该公司的核心技术,是从电子信息档案,医学数据和文献库中提取信息建模,为患者提供个性化的疾病(包括慢性病、传染病、和少数癌症)风险及预后评估。通俗的说,就是根据每个人的现病史、既往病史、住院史、家庭史、药物史、接触史、体格检查等多方面因素,有针对性的判断其患某种疾病的概率和可能造成的后果。虽然医生根据医学常识,也可以做一些判断,但医生是基于统计概率,无法准确考虑到个体的差异化,而人工智能可以深度挖掘个性化的数据,进行更精准的判断。
3月中旬,Medial EarlySign跟以色列最大的医院之一合作,开展了针对新冠感染预后的评估,评估的模型是结合27年的流感数据和来自中国的新冠特异性信息完成训练的。这项工作的主要意义,是辅助医院做出分诊的判断:针对预后风险评估低、中、高的患者,分别采取回家隔离、集中隔离、和收治住院的措施。这种分流的方法,既没有中国方舱方式的高投入,也没有美国放养方式的高死亡率,优化了医疗资源的合理利用率,对帮助以色列快速控制疫情,起到了重要作用。
那么,如何才能实现个性化疾病评估呢?
1
高质量多维度的海量数据
用高质量的数据进行模型训练,设计全方位的模型特征变量,从而有效捕捉这些特征和新冠病毒的内在联系。Medial EarlySign和合作医院获得了几百万真实病人的历史详细数据,并用到至少以下多种特征变量:
a. 年龄、性别
b. 主要生理指标的组合,如血浆葡萄糖水平,体重指数,血红蛋白,甘油三酸酯,转氨酶,高密度脂蛋白,白细胞水平等
c. 上述指标的平均值、最小值、最大值、倒数第二值和最近值,预测窗口和最近一次体检的时间差,3年内各种指标的差异值,预测窗口内各指标的增长斜率等
d. 过去若干年内的处方药史
e. 过去若干年的住院记录等
这保证了模型的鲁棒性,降低了过拟合的可能,提高了实际运用效果。
2
有效的标签
即被评估患者的准确信息。无论模型多么精准,如果被评估患者的个人信息不全或者不真实,也无法做出准确的预测。这就需要有标准化的医疗信息采集工具,协助确保临床数据的质量。
3
合适的模型
Medial EarlySign使用的是微软2017年推出的LightGBM,这是一个实现GBDT算法的框架,支持高效率的并行训练,具有训练速度快、内存消耗低、准确率高、支持分布式等优点。关于GBDT和LightGBM的细节比较复杂,不做详述,只稍微诠释一下基础概念,有兴趣的朋友可以参考雷哥的下面这篇做深入了解。

集成算法,随机森林和梯度增强机
Boosting算法概念
GBDT是机器学习中Boosting家族的一种重要算法。Boosting(增强/提升)是基于“三个臭皮匠顶个诸葛亮”的概念,直观的说,就是对于复杂问题,请多个不同的普通人共同判断,会跟请一个牛人得出的结论类似,甚至更好。在机器学习里,普通人就是“弱学习算法”,牛人就是“强学习算法”。普通人容易找到,牛人难请。Boosting就是从“弱学习算法”出发,让普通人互相学习、监督、组合、提升,直到接近牛人的决定方式,也就是“强学习算法”。这个过程里的关键,在于如何优化学习、提升的过程,可以采用像末位淘汰、赋予不同投票的权重,根据以往的表现实时调整权重等。 
总结:利用人工智能进行个性化的疾病预测,是一个近年来非常热门的领域。大到Google、腾讯,小到几个人的创业公司,都在这条赛道上竞争,寻找机会。以色列的Medial EarlySign在对抗新冠方面找到了一个切入点,通过个性化的预测,帮助医院进行感染者的合理分流,实现医疗资源的优化分配,对以色列快速控制新冠蔓延,起到了重要作用。
【对抗新冠新利器】人工智能来啦(一)
【对抗新冠新利器】人工智能来啦(二)
【对抗新冠新利器】人工智能来啦(三)
【展望】疫情过后,医疗行业会有什么变化(一)
【展望】疫情过后,医疗行业会有什么变化(二)
【展望】疫情过后,医疗行业会有什么变化(三)
【展望】疫情过后,医疗行业会有什么变化(四)
欣姐原是工科出身的PhD一枚,误打误撞进入了医疗行业,从此发现了新的人生意义。海漂十余年,曾游学于欧洲大陆几十个国家,近年定居于美利坚博士屯。混过医疗仪器,生物制药,现栖身于数字医疗领域,闲暇时顺便在查尔斯河畔的某不知名小学校修读医疗管理MBA。
有收获的话就点下“在看/WOW”呗
继续阅读
阅读原文