独乐乐不如众乐乐,今天您分享了吗?
欣姐碎碎念
最近,欣姐请到了一名外援——深度学习和人工智能专家、来自卡耐基梅隆大学的雷哥。欣姐将与雷哥合作,为大家分享一系列利用人工智能(Artificial Intelligences)对抗新冠病毒的文章。我们旨在严肃的胡扯,帮您在调侃之余学知识。敬请关注
正式开始之前,先请雷哥跟大家见个面吧

👇围观雷哥👇
01
没有特效药怎么办——人工智能来帮忙!
核心问题:大家应该都已经知道了,从头研发一个对抗新冠的药物需要很久很久,等特效药可能黄花菜都凉了。临床上,医生只能根据经验和药物机理,从已有药物中选可能有效的碰运气。目前,多种药物已经被试过,欣姐之前总结过,最大的希望仍然是瑞德西韦。不过,经验再丰富的医生知识都是有限的,不可能深入了解所有的药物。会不会某些可能有效的药物被漏掉了呢?通过人工智能大数据挖掘,真的找到了一种。
位于英国剑桥大学的公司Benevolent AI,致力于用人工智能和机器学习,改变传统的药物研发过程。今年二月份,在新冠病毒爆发早期,Benevolent AI成立了一个特殊小组,利用公司的人工智能核心算法,试图在已上市的药物中,寻找阻断病毒攻击细胞的过程,或抑制细胞因子风暴的候选药。 幸运的是,算法果真找到了一个可能对病毒和细胞因子风暴有双重作用的药物Baricitinib,该药由巨头Eli Lily公司研发,此前用于类风湿性关节炎。这项研究被两次发表在柳叶刀和其子刊上。目前Eli Lily已经决定和美国国家传染病研究所合作,开展Baricitinib用于新冠肺炎的三期临床实验。如果实验结果有效,人类无疑要感谢人工智能。那么,人工智能算法,如何找到被医生们漏掉的可能药物呢?
这就要从知识图谱(Knowledge Graph)技术说起了。知识图谱是谷歌公司在2012年提出的一个新技术,直观的理解,就是把现实世界中的各种事物(人、地名、概念、药物、公司等)和他们之间存在的关系图形化。比如下面就是一个简单的知识图谱:圆圈代表不同的事物(知识图谱技术中称为“实体”),线和箭头表示“实体”之间存在的某种关系,可以是单向的,也可以是双向的。
知识图谱技术的核心,在于从已有数据中提取各种“实体”之间的关系,构建图谱的模型(称为“训练”)。训练模型用的数据分为两类,结构化数据非结构化数据
- 结构化数据:有固定格式,标签vs.值(例如:美国总统vs.特朗普)。处理结构化数据简单,适合训练图谱模型。但除表格、数据库等少数形式,结构化数据不多。
- 非结构化数据:无固定格式,一般的自然语言都是非结构化数据(例如:地球人都知道,特朗普是美国总统)。非结构化数据广泛存在,但处理难度较大,需要依赖深度学习和自然语言处理技术,来训练图谱模型。
图谱模型训练完成后,就可以用于在更大量的数据中提取有用信息。一个典型的例子就是谷歌搜索引擎。在谷歌中搜索关键词时,屏幕右侧常会出现类似下图的信息汇总框,这些内容并非来自某一个网页,而是从大量网页中,利用知识图谱模型,提取到的与“特朗普”有关系的高频“实体”。
回到Benevolent AI,公司的数据科学家们,用成千上万的医学论文进行训练,获得了大量有关药物机理的知识图谱库。就像谷歌利用知识图谱在大量网页中生成“特朗普”的信息汇总框一样。新冠疫情发生后,药理学家通过专业分析,认为研究的重点方向,是寻找可以阻截病毒攻击细胞过程,和抑制细胞因子风暴的药物。 基于这一目的,数据科学家用知识图谱库,结合相应的搜索条件,筛选出了Baricitinib。下面的图谱很清晰的反映出,Baricitinib是一种潜在的同时符合抑制病毒作用和细胞因子风暴的候选药。
总结:机器学习中的知识图谱技术,是谷歌高效率搜索引擎的一个秘密武器。最近,科学家们利用这项技术,寻找对抗新冠病毒的候选药物,并在药物机理的层面上,筛选出了Eli Lily公司的已有药物Baricitinib。目前,此药已进入针对新冠病毒的三期临床实验。我们期待在不久的将来获得实验结果。
欣姐原是工科出身的PhD一枚,误打误撞进入了医疗行业,从此发现了新的人生意义。海漂十余年,曾游学于欧洲大陆几十个国家,近年定居于美利坚博士屯。混过医疗仪器,生物制药,现栖身于数字医疗领域,闲暇时顺便在查尔斯河畔的某不知名小学校修读医疗管理MBA。
有收获的话就点下“在看/WOW”呗
继续阅读
阅读原文