【对抗新冠新利器】人工智能来啦(四)
欣姐碎碎念
转眼间,2020年已经过了5个多月了。这小半年,除了疫情和见证历史,大家还做了些什么?不知道大家是已经习惯了家里蹲的状态,还是实在蹲不下去了呢?随着各国开始解封,外出和聚集的人群越来越多,世界各地爆出不少解封后聚集性爆发的新闻。出门or不出门,这还真是个难题。以色列的一家医疗机构联合人工智能公司,为这个难题找到了一个可能的答案。
Covid-19个性化风险预测
以色列在这次新冠疫情中的表现可圈可点,两个月基本控制住了境内的疫情,已进入解封期。感染人数16000+,死亡不到300人,死亡率在1.7%左右,远低于世界平均水平。犹太民族经过了历史上漫长而惨痛的颠沛流离,却能在很大程度上握住世界经济的命门。以色列作为一个只有73年历史800多万人口的小国,又处在战乱区的边缘,国民幸福指数却一直在世界前10位左右,这与犹太民族的高度自觉,务实进取的公民意识密不可分。此外,以色列的人均科研投入,过去二十年一直稳居世界榜首,而特拉维夫更是近年来为数不多的仅次于硅谷的创新中心之一。这次新冠蔓延,有多家以色列的人工智能公司,从不同角度参与了帮助对抗新冠的斗争。本期我们来看看其中比较典型的一个应用。
Medial EarlySign是一家基于医疗大数据预测疾病风险的人工智能公司。该公司的核心技术,是从电子信息档案,医学数据和文献库中提取信息建模,为患者提供个性化的疾病(包括慢性病、传染病、和少数癌症)风险及预后评估。通俗的说,就是根据每个人的现病史、既往病史、住院史、家庭史、药物史、接触史、体格检查等多方面因素,有针对性的判断其患某种疾病的概率和可能造成的后果。虽然医生根据医学常识,也可以做一些判断,但医生是基于统计概率,无法准确考虑到个体的差异化,而人工智能可以深度挖掘个性化的数据,进行更精准的判断。
3月中旬,Medial EarlySign跟以色列最大的医院之一合作,开展了针对新冠感染预后的评估,评估的模型是结合27年的流感数据和来自中国的新冠特异性信息完成训练的。这项工作的主要意义,是辅助医院做出分诊的判断:针对预后风险评估低、中、高的患者,分别采取回家隔离、集中隔离、和收治住院的措施。这种分流的方法,既没有中国方舱方式的高投入,也没有美国放养方式的高死亡率,优化了医疗资源的合理利用率,对帮助以色列快速控制疫情,起到了重要作用。
那么,如何才能实现个性化疾病评估呢?
用高质量的数据进行模型训练,设计全方位的模型特征变量,从而有效捕捉这些特征和新冠病毒的内在联系。Medial EarlySign和合作医院获得了几百万真实病人的历史详细数据,并用到至少以下多种特征变量:
a. 年龄、性别
b. 主要生理指标的组合,如血浆葡萄糖水平,体重指数,血红蛋白,甘油三酸酯,转氨酶,高密度脂蛋白,白细胞水平等
c. 上述指标的平均值、最小值、最大值、倒数第二值和最近值,预测窗口和最近一次体检的时间差,3年内各种指标的差异值,预测窗口内各指标的增长斜率等
d. 过去若干年内的处方药史
e. 过去若干年的住院记录等
这保证了模型的鲁棒性,降低了过拟合的可能,提高了实际运用效果。
即被评估患者的准确信息。无论模型多么精准,如果被评估患者的个人信息不全或者不真实,也无法做出准确的预测。这就需要有标准化的医疗信息采集工具,协助确保临床数据的质量。
Medial EarlySign使用的是微软2017年推出的LightGBM,这是一个实现GBDT算法的框架,支持高效率的并行训练,具有训练速度快、内存消耗低、准确率高、支持分布式等优点。关于GBDT和LightGBM的细节比较复杂,不做详述,只稍微诠释一下基础概念,有兴趣的朋友可以参考雷哥的下面这篇做深入了解。
Boosting算法概念
GBDT是机器学习中Boosting家族的一种重要算法。Boosting(增强/提升)是基于“三个臭皮匠顶个诸葛亮”的概念,直观的说,就是对于复杂问题,请多个不同的普通人共同判断,会跟请一个牛人得出的结论类似,甚至更好。在机器学习里,普通人就是“弱学习算法”,牛人就是“强学习算法”。普通人容易找到,牛人难请。Boosting就是从“弱学习算法”出发,让普通人互相学习、监督、组合、提升,直到接近牛人的决定方式,也就是“强学习算法”。这个过程里的关键,在于如何优化学习、提升的过程,可以采用像末位淘汰、赋予不同投票的权重,根据以往的表现实时调整权重等。
欣姐原是工科出身的PhD一枚,误打误撞进入了医疗行业,从此发现了新的人生意义。海漂十余年,曾游学于欧洲大陆几十个国家,近年定居于美利坚博士屯。混过医疗仪器,生物制药,现栖身于数字医疗领域,闲暇时顺便在查尔斯河畔的某不知名小学校修读医疗管理MBA。
关键词
算法
模型
数据
机器学习
一家
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。