生命科学领域也被视为 AI 的下一片 “星辰大海”。公开资料显示,不少 AI 公司已经相继在医疗健康领域展开探索,主要集中在医学影像、辅助诊断、健康管理、疾病预测四大应用方向,而药物研发则被认为是 AI + 医药健康领域的下一片蓝海。
继布局 AI 医疗影像产品之后,AI 平台公司商汤科技(以下简称 “商汤”)也开始进军新药研发领域。
近日,商汤公布了其将 AI 应用于新药研发和精准医学的四项最新成果,可以应用在新药研发的多个环节,从药物发现、临床前研究、临床试验到新药上市后评估。
官方表示,这些研究成果已经发表在 Nature Precision Oncology、Bioinformatics、国际人工智能联合会议(IJCAI)等国际知名期刊和相关会议上。值得一提的是,这些 AI 在新药研发领域的最新研究成果现已开源相关代码。
(来源:IJCAI)
商汤进军新药研发的底层逻辑是什么?优势有哪些?AI + 新药研发行业又面临着怎样的机遇和挑战?
日前,生辉联系到商汤副总裁、研究院副院长张少霆,在采访中他就这些问题一一作出解答。
张少霆是国内知名的医学影像分析专家,于 2018 年正式加入商汤并担任智慧健康团队负责人。他的主要研究方向是医学影像分析和人工智能,曾获 2010 年度 MICCAI 的 Young Scientist Award 和 2011 年度 MICCAI 的 finalist(注:MICCAI 是医学图像分析领域最高引用文章的会议)。
图 | 商汤副总裁、研究院副院长张少霆(来源:受访者提供)
张少霆告诉生辉,商汤其实早在 2018 年就已经开始为新药研发公司、知名药企和基因公司等生命科学领域机构提供 AI 技术服务,覆盖药物靶标相互作用、用药推荐、用药风险分析、基因自动分析与报告生成等方向。
原创 AI 从诊疗到新药发现
公开资料显示,商汤是一家成立 7 年的人工智能平台型公司,聚焦原创 AI 技术研究,主要方向集中在图像处理、面部识别、自动驾驶、增强现实、医疗影像分析等。
作为 AI “技术流” 和 “学院派” 的代表,商汤的特点之一在于开发原创 AI 底层算法平台,并将 AI 技术应用于不同的场景。
“商汤在基础 AI 技术方面,尤其是计算机视觉方向有着深厚的原创技术积累。因此,为了充分发挥技术优势,商汤智慧健康业务很自然地选择以医疗影像 AI 产品为起点。” 张少霆说。
2018 年,商汤的 AI 医疗平台级产品 “SenseCare®智慧诊疗平台” 首次亮相世界人工智能大会,并正式官宣进军医疗健康领域。时隔 3 年,商汤已推出多款 AI 医疗产品解决方案,覆盖了包括心脏、肝脏、肺部、头颈等在内的 10 余个人体部位和器官,并以 536 件公开专利申请数量位居 “2020 全球智慧医疗 — 人工智能(AI)医学影像辅助诊断发明专利排行榜” 第五。
(来源:商汤)
在医疗影像 AI 分析产品落地的过程中,商汤不断发现客户的一些延伸需求,包括通过病理图像延伸到基因数据的分析,从基因延伸到药物分析相关的需求,甚至有关于多模态数据分析的需求。这样 AI 落地的场景也就从临床医学逐渐延伸到基础医学。
“商汤拥有很多基础算法能力,包括计算机视觉、自然语言处理、知识图谱、数据挖掘等,这些在从临床医学向基础医学‘跨界’的过程中可以通用。因此,商汤形成了从临床医学影像分析、大数据分析到药物研发的业务布局和良性的业务循环微生态。” 张少霆补充道。
不过从 AI 诊疗过渡到新药研发并非易事,这个过程也是对商汤 AI 综合实力的考验。
张少霆告诉生辉,商汤的核心竞争力体现在三个层面:更快、更高、更强
具体来说,一是算力、算法和平台三者之间的有效联接。商汤的新型人工智能基础设施 SenseCore AI 大装置打通算力、算法和平台闭环,并以商汤智算中心为基础,能够支撑对海量数据和算法模型的分析、训练和推理。
图 | SenseCore 商汤 AI 大装置(来源:受访者提供)
公开资料显示,商汤智算中心在完全落成后的总算力可达 3,740 Petaflops,1 天内能处理时长 23,600 年的视频,能够提供足够的算力基础。
二是原创算法能力,过去六年时间内商汤在全球三大计算机视觉顶级会议上共发表了 440 多篇关于深度学习和计算机视觉的研究论文,排名全球第一,很多基础算法具有通用性,可以应用于新药研发。例如在进行基因组 AI 模型训练时,传统方法需要用十几个小时才能完成的计算,商汤表示可以将时间缩短到十几分钟,效率提升 27 倍。
三是复合型人才,拥有生物 + AI 交叉学科人才,包括生物学博士、药学 + AI 博士等复合型人才,以及曾就职于斯坦福大学生物医学信息实验室的资深科学家。
覆盖新药研发多个环节
张少霆表示,通过在原创 AI 技术能力上的多年沉淀以及深入对化合物、蛋白、细胞系和临床大数据中潜在规律的挖掘,商汤针对新药研发和精准医学发布了多项最新研究。
众所周知,AI 有潜力应用于新药研发领域中的多个场景,包括靶点发现、化合物合成、化合物筛选、晶型预测等。此次商汤发表的四项研究则瞄准了蛋白质相互作用、癌症药物反应、基于病理图像的基因突变预测、和药物重定向四个方向。覆盖药物发现、临床前研究、临床试验、新药上市后等多个新药研发环节。
例如,在药物发现环节,商汤提出了一种新的衡量指标,通过全新的数据划分方式评估模型在跨数据集、未知蛋白上的性能效果,同时训练了一套能够学习蛋白间关联关系的图神经网络模型,从而在跨数据集上表现更稳定。
图 | 高鲁棒性的基于 GNN 的 PPI 分析框架(来源:IJCAI)
针对临床前研究,商汤开发出了一种全新的混合图卷积网络模型 DeepCDR,该模型可以自动挖掘和建立药物化学结构特征,并高效处理细胞系里的多组学数据。在公开数据集上,该模型将预测精度指标皮尔森相关系数从 0.780 提升到了 0.923。(皮尔森相关系数绝对值越大,表示线性相关程度越高)
在临床研究方向,商汤还创新性地利用深度学习技术挖掘数字病理图像中的细胞特征信息,以此直接预测组织的基因突变类别和相关生物信号通路信息。
在上市后评估阶段,围绕 “老药新用” 商汤训练了一套药物、疾病、蛋白多个实体间相互作用关系的大规模 GCN 网络模型,并表示其无需人工干预,即可利用知识图谱寻找已有药物的新适应症。
行业发展还有多个难题有待解决
与 AI + 医学影像不同,在 AI + 新药研发领域,AI 需要解决的问题更具有前瞻性,往往是针对尚未经验或者尚未解决的问题,同时数据的复杂度也会随之上升。不过未知性和复杂度的背后,同样也预示着 AI 在该领域的潜力更大,可能性会更多。
“整体来看,AI 在药物研发领域已经开始起步,但尚未成熟。药物研发是一个非常大的长尾场景,环节众多,还有诸多环节待解决、待优化,未来还有非常大的发挥空间。” 张少霆说。
张少霆告诉生辉,药物研发细分方向庞杂,每个方向的 AI 研究都需要有足够的生物学知识,最大的难题是领域知识的获取,需要将领域知识和需求转化为可以用 AI 解决的技术思路。
(来源:businesskorea)
AI + 新药的突破很大程度上受制于 “数据之困”。一方面,当前行业的多数研究主要是基于公开数据集,药物研发多个环节缺少高质量数据。因此,与药企合作获得优质数据是一个重要解决方向;
另一方面,药物研发涉及分子、蛋白、药物等多种对象,以及这些医药实体间的相互关系,所以数据复杂程度也是一大难点。针对数据复杂性,商汤尝试了诸多算法思路,例如图神经网络,这是 2018 年以来非常火热的一个深度学习方向。
无论是对于商汤,还是对于整个行业而言,如何基于少量数据,训练出高性能且具有高度泛化性的 AI 模型也是一大挑战。
此外,AI + 药物研发兼具算法和医药双重属性,高端复合型人才比较稀缺,培养具备交叉学科的复合型人才绝非易事。
“商汤智慧健康从 2018 年就已经开始了相关准备和布局,目前我们已经和国内外多家新药研发公司、知名药企和基因公司开展了商业合作。未来,我们希望能与更多上下游企业、研究机构以及高校的合作,利用 AI 加速上游研发领域探索、同时为药物研究、精准医疗领域带来更多解决方案。” 张少霆说。
来源:DeepTech深科技   作者:宋冉
继续阅读
阅读原文