从硅谷一线VC投资版图，看AI+新药研发的挑战与前景

硅谷Live / 实地探访/ 热点探秘 / 深度探讨

《我不是药神》在今夏的火爆，恐怕反应出了很多人的心声：看病已然不易，买药更加艰难。

为什么药价这么贵？

新药研发成本非常高，就是其中一个重要原因。业内有种说法，新药研究需要 “两个十”：用十年，花十亿美金。如果再把失败尝试的成本也算进去，每种药物研发费用更是达到 27 亿美元。

但就算花了这 “两个十”，也无法保证研发一定成功 —— 药物研发的成功率并不高。《自然》杂志撰文称，从临床 I 期到获得审批的这段时间里，高达 90% 的项目以失败告终。

高投入、高风险，往往伴随着高回报。一旦新药过关斩将、成功上市，经济回报往往相当惊人，这也是资本、特别是硅谷一些诸如 Andreessen Horowitz、Khosla Ventures 等顶级 VC 比较青睐医药的原因。比如辉瑞制药旗下受专利保护的降血脂药物立普妥（Lipitor），仅 2010 年一年的全球销售额，就高达 107.33 亿美元，在辉瑞当年所有药品里取得最高营收，而当年广为人知的辉瑞小蓝片 “伟哥” 仅以 19.28 的营收屈居第六。看来降血脂和重振雄风相比，前者才是更刚的刚需。

可以说，巨大的经济回报既是药企研发新药的动力、也是新药价格昂贵的原因，更是有些市场小、规模有限的罕见病无药可医的部分原因。

新药研究道阻且长，因此，许多大型药厂和科研机构都在找用 AI 来提高效率、提高成功率的办法。与 AI和医疗结合的其他领域比，新药研发领域虽然潜力巨大，但也面临不少挑战。

在讨论 AI 如何加速新药研发之前，我们先来看看一款药是如何 “诞生” 的。

新药开发，万里挑一

一款药到底安不安全？有没有效？如何确定剂量？新药研发的所有流程和步骤，其实就是为了回答这三个问题。

以常见的小分子化合物药（比如青霉素）为例，新药开发可以分为：临床前研究、临床研究，药物批准上市及上市后监测这三个大步骤。

（图自硅谷密探，版权属于原作者）

用大白话说，“临床前研究” 阶段，就是寻找药里可以治病的化合物的阶段。具体可以细分为药物靶点确认、化合物合成、活性化合物的筛选、选定先导化合物、评估药物的药理作用、制剂开发等阶段。在这些小步骤中，药物靶点确认是一切后续工作的基础，而从 “化合物合成” 到 “选定先导化合物”，为了找到安全、有效的化合物，往往需要反复很多次。

这个阶段也是化合物的 “海选” 阶段，最开始的大几千、甚至 10000 个化合物，经过层层筛选和验证后，只有 5 ~ 10 个化合物可以进入临床试验阶段。

在临床研究阶段，还要进一步分为 I 期、II 期、III 期临床试验。如果说 “临床前研究” 阶段，基本回答了安不安全、有没有效的问题，这个阶段则要证明发生在人身上的实际结果，和理论结果是相吻合的。同时，剂量多少也在此阶段确定。

在临床 III 期，不仅试用药物的志愿者人数更多，同时也是治疗作用的确认阶段。接下来药品注册申请能否获得批准，临床 III 期提供的依据往往是关键。

如果在新闻里看到某款新药已经在 III 期临床阶段，往往意味着该款新药上架可期。不过如果临床研究阶段里的任何一个小阶段效果不好、或者不如市场上现有药物好，那款新药往往会胎死腹中。2017 年，美国 FDA 一共只批准了 46 款新药，可见批准难度之高。

经过临床研究洗礼后，依然被认为有效的最后一种化合物，在获得相关部门批准后，才会上市变成一款新药。上市后的后续监测，则要确保该款新药首次被大范围人群应用后的疗效，此外还要进行不良反应的监测。我们看到药物说明书里的增补、禁忌，和不良反应（比如：大多数人吃了这个药会怎样怎样，少数会有某种反应，如发生某种情况则需要就医），就是这一步的体现。

至少十年、至少十亿美元，万里挑一，才可能有一种新药。而目前的 AI 技术，则主要集中于解决 “新候选药物的生成（generate novel drug candidates）” 这个问题。

新候选药物的生成：最受资本青睐

过去十几年大数据集的可用性和先进算法的发展，推动了机器学习的重大改进，这使得实现狭义 AI 成为可能。“狭义 AI” 指的就是专注于特定任务、特定场景的 AI。换句话说，目前的 AI 只有在医疗、车载等特定场景下，才能努力像人一样思考。

想要思考，总得先听懂人家在讲什么吧！近两年很火热的自然语言处理（Natural Language Processing），指的就是机器能够用和我们人类相似的方式理解文本、找出规律，明白一个东西在讲什么。这种技术在计算机视觉（computer vision）、语音分析和路线选择领域已经得到了广泛应用。

药物研发领域也不例外。一方面，AI 具有 “从大量数据中找出隐藏的规律和线索” 的能力，另一方面，药物研发恰恰需要处理大量数据文献、进行大量试错，让新药研发耗时耗力耗钱。两者正好契合，也就不难理解为什么近几年 “AI+药物研发” 的初创公司大量出现。

以 Crunchbase 上的数据为准，小探整理的 115 家 AI+新药研发领域的公司里，有 40% 成立于 2014 到 2017 年间。

（图自硅谷密探，版权属于原作者）

那么，这些公司都是做什么的呢？

根据科技博客 BenchSci 的一篇文章，按照一款新药从一个灵感变成商品，我们按照流程，可以把这些公司分成以下十二大类：

其中，在 “产生新的候选药物（generate novel drug candidates）” 这个小领域的初创公司数量占比最大，115 家里足足占了 36 家：

（图自硅谷密探，版权属于原作者）

虽然药物研发成功率总体不高，但资本对这一类别的初创公司投钱并不手软：

（图自硅谷密探，版权属于原作者）

而在 CB Insights 上列出的 9 家有代表性的 AI+新药研发创业公司中，已有六家得到了 VC 的资本支持，而且均为硅谷一线 VC。

图自 CB Insights，版权属于 CB Insights

这其中，Andreessen Horowitz 最近种子投资了 DUMA 药物发现平台开发商 twoXAR；

Khosla Ventures 投资的 Atomwise，在去年发布了埃博拉治疗药物的首批研究结果；

Lightspeed Venture Partners 于 2013 年投资了 Numedii；

Foundation Capital 参与了 Numerate 的三轮股权融资。

因此，这个小领域的拔尖者，也可以被看做是整个 AI+新药研发的领头羊。

AI 新药研发：创业公司打头阵，老牌药厂择优合作

AI 的出现，或许能加快找寻 “解药” 的步伐。

举个例子：前两年流行的 “冰桶挑战” 让很多人第一次听说了 “渐冻症” 这种疾病。渐冻症的全名叫肌萎缩侧索硬化症，英文缩写是 ALS，很长时间来人们对它几乎束手无策。

总部位于伦敦的初创公司 BenevolentAI 拥有自己的人工智能平台，平台上的数据来自学术论文、专利、临床试验和患者们的医疗记录。这么多数据第一次汇聚到一个地方，就使得研究人员有可能发现各种生物实体之间 —— 生物实体就是症状、基因、疾病、蛋白质、候选药物等—— 直接有、或可能有的关系。更妙的是，这个系统还可以像谷歌或者百度一样，让研究人员用搜索引擎的方式查找资料，比如研究人员可以找某种疾病和某种基因之间的关系。

当 BenevolentAI 问系统有没有治疗渐冻症可能的药物时，系统就能找出 100 种现有的、有望治愈渐冻症的化合物，为研究人员极大地缩小了研究范围。研究人员可以在这 100 种化合物中进一步筛选出 5 种最有希望的化合物，而不用从 5000 ~ 10000 种化合物筛起。

今年，BenevolentAI 获强生公司旗下 Janssen Pharmaceutical 投资，这也使得前者成为 AI+新药研发领域获得投资最多的初创公司。21 亿美元的估值，也让它顺利挤进了独角兽俱乐部。

（图自 CB Insights，版权属于 CB Insights）

总部在美国犹他州盐湖城的初创公司 Recursion Pharmaceuticals（以下简称 Recursion），则用 AI 在数百种细胞疾病模型上并行测试数千种化合物，以大规模同时进行多种实验。旧药说不定有新用途，而 Recursion 在做的事情就是在尽可能短的时间内，找到这些新用途。

2016年，创立仅仅三年后，Recursion 宣布与制药巨头赛诺菲合作，帮助后者确定一些已经进行到临床阶段的分子在几十种遗传疾病中可能的新用途。此外，赛诺菲也与英国初创企业 Exscientia 签署了合作协议，计划使用后者的 AI 平台寻找代谢疾病治疗。

来自硅谷的 Atomwise，则运用超级计算机、AI和复杂的算法模拟制药过程，来预测新药品的效果，同时降低研发成本。与它合作的，则是老牌医药巨头默克药厂（Merck）。

随着 AI 在生物医药领域的兴起，传统制药公司近一年来，纷纷给主攻新药研发的 AI 创业公司抛出了橄榄枝：

葛兰素史克（GlaxoSmithKline）与主攻与年龄相关疾病的 Insilico Medicine 合作；

安进（Amgen）和解决医疗过程中数据共享问题的初创公司 Owkin 合作；

安斯泰来（Astellas）则比较关注重新利用现有化合物。2015年12月，安斯泰来和初创公司 Biovista 宣布合作，主攻药物再利用。略微尴尬的是，仅仅一个月后，安斯泰来又和另一家初创公司 NuMedii 宣布合作，做同样的事情。

随着这些制药巨头逐渐尝试在新药设计环节用 AI 提速，这样的 “大药厂+AI 新药研发创业公司” 的组合比比皆是。其实这种组合也很合理：大药厂资金再充足，也无法有足够的时间和资金同时进行多项研发。初创公司具有更大的灵活度、也更能找准问题，但需要资金支持研究的进行。这么看来，大药厂和初创公司的拍档，也就很好理解了。

大药厂的 “五指山”

作为初创公司，能和大药厂合作当然值得庆幸，但这个领域里的初创公司们也有自己的烦恼。

关于初创公司所面临的挑战，小探采访了在美国医疗领域有丰富投资经验的投资人、Fusion Fund 创始合伙人张璐。

张璐认为，制药行业本身的行业特点，决定了大牌药厂享有更大的话语权，在这种环境下的初创公司们，到底如何增加自身实力，有更高自由度，则是不小的挑战。

张璐进一步总结道，AI+新药研发领域的初创公司和大药厂主要有两种合作方式：

一种是初创公司当大药厂的 “合同工”，大药厂给一个项目，初创公司完成即可，按项目收钱。这种方式相对不稳定。

另一种是 Saas 模式：初创公司提供软件，大药厂用初创公司的软件分析数据。但我们知道，医疗数据极为敏感，因此很多大药厂把数据交给作为 “外人” 的初创公司，既不放心也不情愿。

在这种情况下，大药厂往往会提出诸多条件：比如让初创公司出技术、在药厂自己的数据库里使用，以保证数据的安全；或者要求初创公司只和自己独家合作、不允许初创公司和自己的竞争对对手合作 —— 当然，大药厂自己脚跨两条船是完全没有问题的，比如上文提到的安斯泰来同时和 Biovista 及 NuMedii 这两家竞争对手合作。未来，随着私有云等数据安全相关的技术发展，大药厂们或许才能更放心地和这些 AI 公司合作。

这并不是说初创公司完全依附于大药厂，大药厂也非常需要初创公司的技术，作为自己发展的引擎。这是一个双方彼此需要，而互相博弈、角力的过程。作为 AI+新药研发整个行业来讲，如何把双方利益一致化，恐怕还需要探索。

放在 AI+医疗的大领域里来看，AI+新药研发还是个非常新的领域。张璐告诉小探，她所在的 Fusion Fund 今年在 AI+医疗领域，比较关注的是医学成像（medical imaging）和深度学习（deep learning）。与AI+药物研发相比，后二者发展得更成熟。显然，这是年轻的 AI+药物研发领域暂时不具备的。

美国领先，中国发展迅速

如果以国家和地区为单位，来比较各自在 AI+新药研发领域的发展，可以说是美国领跑、中国发展迅速，而且是亚太地区发展最快的国家。小探统计的 115 家公司里，美国公司有 56家，占总数的 48.70%，几乎近半。

中美两国各有优势和劣势。张璐认为，中国的巨大优势是数据量很大、且数据获取成本相对较低。AI 说白了就是以数据训练机器，数据越多，机器越 “聪明”，因此 AI 在新药研发领域想有所发展的前提条件，就是有足够的数据让 AI 分析。

（张璐今年参加世界经济论坛讨论）

但另一方面，虽然数据量大，但中国有些数据的质量不够高。

什么叫数据质量不够高呢？有两种情况：一，数据不准确；二，数据没打标签。所谓打标签，就是我们把数据打上标签后，机器才能够把数据和意思联系起来，从而找出规律，比如把一个带有气球图案的图片打上 “气球” 的标签，机器才知道什么是气球。也就是说，没打标签的数据是需要进一步加工才能用的，非常不方便。

而美国的优劣势正好相反：美国医疗数据的信息化做得相对规范、打标签也做得比较好，但数据获取成本也比较高。另外，美国人口也决定了其数据量的上限。此外，美国大药厂在业内的垄断规模和极大的话语权，也或多或少影响了初创公司的发展。

看来不论中美，AI+药物研发这个年轻的领域，还有很长的一段路要走。而对于在这个领域的创业公司来说，如何找准商业模式、获取更多更高质量的数据、增强数据处理能力，恐怕还将是未来几年的重点。

本文参考：

From Virtual Nurses To Drug Discovery: 106 Artificial Intelligence Startups In Healthcare

https://www.cbinsights.com/research/artificial-intelligence-startups-healthcare/

How artificial intelligence is changing drug discovery

https://www.nature.com/articles/d41586-018-05267-x

https://blog.benchsci.com/startups-using-artificial-intelligence-in-drug-discovery

https://www.zhihu.com/question/20654032