请问你有什么证据？

智能手机的普及，显著降低了人们使用互联网的门槛，大大方便了人与人之间的交流，但这样的便捷也带来了另外一个问题，由于各方认知水平的巨大差异，相当一部分交流属于无效交流。

在这样效率低下的交流过后，非但互动双方都不会从对方的阐述中收获任何有益的见解，反而还有可能双双都强化了既有的立场和观点，变得更加顽固。（这可能也是「逆火效应」形成的基础，但「逆火效应」不是必然发生，人也不是绝对不可说服的，关于这点我们在文章的最后再说。）

所以有人不乏悲观地指出，而今的互联网上只有撕裂而无交流。

有人认为，所有的争论都是有关定义的争论，这一观点就算不够准确，至少也揭示了有关争论的部分真相，即很多时候我们对一些基本概念尚未达成共识。

一、

比如当有人提出一个医学建议时，我问：请问你有什么证据？

我们常见的一种回答是：亲测有效。

可此人的治疗经历，可以被当作证据吗？

如果刚刚接触这类话题的读者看到这里时稍微懵了一下，就说明有关证据的概念我们是有必要厘清的。

在前循证医学时代以前，或者再早一些在现代医学体系成熟以前，倘若一位医生因为某种疗法被人告上法庭，但有大量类似「亲测有效」的认证出现，这位医生很可能就会被判无罪，在法律上，如果证人没有撒谎，那么他所做的「亲测有效」的陈述，就是会被法庭采纳的证据（证人证言）。

但如果按照循证医学的要求，即使这个「亲测有效」并非谎言，也仍然不能被视为证据，因为在循证医学的语境里，证据有着更苛刻的定义。

毫不夸张地说，如果你理解了什么叫循证医学层面的证据，你可能从此以后看待世界的方式都会发生变化，而这样的蜕变一旦完成，你就再也不是从前的你了，就像在灵山脚下通过凌云渡后脱离了肉体凡胎的唐僧。

严格来说，「亲测有效」并非证据本身，但是这样粗糙的观察可以构成生产证据的原材料，循证医学创始人戈登·盖亚特认为：

任何经验性的观察都可以构成潜在的证据。

既然是潜在的证据，那么它们就面临着两种命运——

一种是经过系统收集和评价之后，登堂入室成为真正的证据；

另一种（这种更多）则是被排除到证据之外。

2000年，循证医学奠基人大卫·萨克特将临床证据定义为：

以患者为研究对象的各种临床研究所得到的结果和结论。

2005年，有学者用系统评价的方法来定义证据，结论为：

证据是最接近事实本身的一种信息

，高质量方法恰当的研究结果是最佳证据。由于研究常常不充分、自相矛盾或不可用，其他种类的信息就成为必要的补充或替代。

2008年，我国学者将卫生研究中的证据定义为：

证据是经过系统评价后的信息。

看到这里仍然很懵的读者一定会提出这样一些问题：

为什么构成医学证据的要求这么复杂？

不都说眼见为实么？

不都说实践是检验真理的唯一标准么？

不都说别管黑猫白猫逮住耗子就是好猫么？

二、

这是因为疗效并非如我们想象的那样一望可知。

人类医学的历史虽然长达数千年，所谓的名医数不胜数，但古代医生的治疗措施，几乎都是无效的，人类的各个种族所以能够繁衍生息至今，而没有被哪一种疾病或瘟疫灭族，靠的并不是古代医学的庇佑，而是几百万年甚至更长久的演化力量赋予人体的免疫及修复功能。

无论在多么险恶的环境下，总会有人可以活到性成熟的年纪。

刘夙老师的扑克牌，我建议各位全套收藏

疾病不治而愈是常有的情况，我们将这种情况称为疾病的自限性，最典型的比如普通感冒，即使你不使用任何药物，熬过症状最严重的几天，身体也就慢慢复原了，即使是有些比较凶险的疾病，比如大叶性肺炎，据估计，如未经治疗将导致 30% 的病例死亡，那么其余那 70% 还是死里逃生了。

假设在前抗生素时代，我们悬壶济世走街串巷治疗了一百个肺炎，那么在概率上，也有一多半会痊愈，在痊愈的这部分病人中，如果恰好有一位是当地的大人物，经他一宣扬，那咱就是名医了。

如果运气不好，最先治疗的几个都死掉了，那为了避免被村民打死，赶紧拎着药葫芦跑路，这就是古代悬壶济世的真相。

古代医生的水平虽然不高，但医患矛盾也不见得就很严重，因为公众的预期与当时的医疗水平是相适应的，本来也没太指望请医生管用。

比如我国古代的笑话集《笑林广记》就收集了这样的笑话：

一医药死人儿，主家诟之曰：「汝好好殡殓我儿罢了，否则讼之于官。」医许以带归处置，因匿儿于药箱中。中途又遇一家邀去，启箱用药，误露儿尸。主家惊问，对曰：「这是别人医杀了，我带去包活的。」

有医死人儿，许以袖归殡殓。其家恐见欺，命仆随之。至一桥上，忽取儿尸掷之河内。仆怒曰：「如何抛了我家小舍？」医曰：「非也。」因举左袖曰：「你家的在这里。」

这两则笑话大概是反映了当时较高的小儿病死率，古代人平均寿命一直不高，就是因为有许多夭折的孩子，把平均寿命拉了下去。

当然，古代不止是小儿科的医生水平不高，给成人看病的那些，水平也不咋地，看这个笑话：

大方脉采住小儿科痛打，旁人劝曰：「你两个同道中，何苦如此。」大方脉曰：「列位有所不知，这厮可恶得紧。我医的大人俱变成孩子与他医，谁想他医的孩子，一个也不放大来与我医。」

一个给大人看病的医生和一个小儿科医生不顾斯文扫地地一通乱打，旁边不解，给大人治病的医生解释说：「诸位有所不知，这家伙实在太可恶。我医治的大人都投胎转世成小儿让他医，可他医的小儿，一个也没活到成年来给我医。」

敢情这无论是给大人看病还是给小儿看病都是往死了治呢。

古代西方的情况也一样糟糕。

17 世纪的英国医学家西德纳姆对当时英国流行的繁杂草药配方持批评态度，对病人他主张尽量少用药物干预，他认为医生所能做的最好的事情就是给人体以能够发挥其自愈能力的机会，而服药放血或许只会阻碍这个过程。

18世纪的《穷查理年鉴》有这样一条箴言：「知道大多数药物毫无用处的医生才是最好的医生。」

美国 19 世纪的医学家霍姆斯（Oliver Wendell Holmes,1809-1894)曾说：「我坚决相信，要是将所有通行药物都沉入海底，那对全人类都有好处，鱼儿可就遭殃了。」

一些学养深厚的医学和研究者对疾病的自愈倾向和医药的局限早就有深刻的认识，实验医学先驱贝尔纳（Claude Bernard, 1813-1878)在反驳「医学只是一门艺术，注定不会成为一门科学」时曾说：

「艺术家是在艺术作品中实现他个人特有的思想或感情的人，如果说存在一位根据他个人特有的思想或感情来治病的医生，那么我们怎么评价他呢？

当一位伟大的画家或一位雕刻家创作了一幅美丽的图画或一尊卓越的雕像后，没有人会这样想：‘这尊雕像也许是从泥土里长出来的吧，或者这幅图画也许是自动绘成的吧……’

然而，在没有艺术家（医生）干预的情况下，疾病能够很好地自愈，证据比比皆是，那么，医术的标准又在哪里呢？

人们不会凭一位医生说他治好了多少病人来判断他的功绩，首先，他应该科学地证明，这些病人是他治好的，而不是病人自愈的。」

至于究竟应该如何科学地证明，贝尔纳并没有进一步阐释，因为在当时，循证医学的方法尚未完备，个别医学家灵光乍现的一闪念，尚不足以为这一问题提出完美的解决方案。

三、

那么，我们今天应该如何证明某种疾病是治好的，而不是病人自愈的呢？

这就涉及到疗效判定问题了。

除了前面提及的疾病自限性的问题，很多人之所以会对疗效判定产生极大误会（主要是把无效的认定为有效

）还可能是因为安慰剂效应或诊断错误。

比如有些神医宣称治愈了一些绝症，这其中除了有可能是癌症本身的自愈而外（按照严格的癌症自发消退的标准，曾有学者检索了1966年到1987年的文献，发现有504例癌症自愈的，实际发生的数量，应该远在这个数字之上

），还有可能是把某种良性病误诊成了癌症，那些原本就没有致命危险的良性病，胡乱怎么治疗都有可能获得长期存活。

曾有一个病人在某医院诊断为肝癌后，自服某种偏方又继续存活了十余年，76岁去世，死前他将偏方献出，希望能够造福他人，尸检结果发现，他得的根本不是肝癌，而是血管瘤。

安慰剂效应可能是医学史上最具迷惑性的现象，不但病人长期以来将这种效应归功于医生的治疗措施有效，就连很多医生也身陷其中当事者迷。

我在《心外传奇》中（163页）讲过这么一个故事，20 世纪 50 年代，一位意大利的外科医生将心绞痛病人的双侧乳内动脉结扎后，很多病人就自觉心绞痛的症状得到了好转。

把图片放大的话，还是能看清书名《心外传奇》的

这一手术虽然受到了部分病人的认可，但医学界却不买他的账。

美国华盛顿大学的研究者对此进行了一次双盲试验，他们将病人分成两组，其中一组行双侧乳内动脉结扎的手术，另外一组仅在皮肤上切开同样的切口，但两组病人对此并不知情，结果发现，两种手术在改善症状方面，没有差别。

结论：这位意呆利医生发明的手术对心绞痛无效。

这一历史教训有没有让你觉得脊背发凉？

如果不经严格的疗效判定程序就推广某种治疗方式或药物，那得让多少人深受其害啊？

事实上，仅在近百年以来，这样的悲剧就屡次发生过，更别说更久远的古代了。

安慰剂效应是指由于非活性的物质或无效的治疗所产生的医疗作用，包括任何医疗处理、手术、药物，甚至医生的语言态度和医疗环境本身都具有这种心理暗示作用。

大家有没有这样的经验：本来很难受的，可一见到医生就觉得缓解很多？

安慰剂效应一般不会被主流的医学界认为有很高的医疗价值，因为它没准，效果极不稳定，时灵时不灵，关键时刻肯定误事。

正因为安慰剂效应的这个特点，就被各种神秘主义钻了空子，他们用来辩解的话术就是：心诚则灵。

这一说法倒也不完全是谎言，有研究表明，那些无主见，缺少自信和容易受暗示的人，安慰剂效应容易起作用。

因为我们倾向于犯一种「证实性偏倚」的错误，即一个人所持的信念决定了他所能看到的事物。

对于现代医学研究者来说，我们要想找到真正有效的治疗，就必须将优于安慰剂效应的真正有价值的部分甄别出来，这是一个拨云见月的过程。

如果监管机构眉毛胡子一把抓，不做严格地验证就草率地承认任何宣称有效的治疗，那么很多真正有价值的医疗措施可能就会被长久地湮灭在一堆垃圾之中，而无效甚至有害的治疗也会危害到很多人的生命健康。

俗话说真金不怕火炼，确实有效的药物或治疗方法，一定是非常乐于接受严格的检验的，只有居心叵测的骗子才会千方百计地逃避这一验证过程，他们能找到的对自己有利的证据，只能是经过他们精心遴选的成功的个案，如果把他们的全部数据都公之于众，骗局也就无法维系了。

所以，一种新药或疗法在临床推广之前，必须经过医疗监管部门的严格审批，完成 3 期临床试验。

通常来说，判定疗效的原则是「无效推定」，即「疑‘效’从无」

，凡是未经过规范的临床试验证明有效者，应默认为无效。

而考虑到药物的毒副作用时，原则是「疑‘毒’从有」，凡是未经过规范临床试验证明其安全者，应默认为有毒性。

在完成安全性的验证之后，临床试验必须设可比的对照组，采用随机分组，明确疗效指标，双盲法观察效果。

我们稍微解释一下为什么要这么做。

为什么要强调可比的对照组呢？

比如我们要验证某种药物对某疾病的治疗效果，就必须保证治疗组和对照组的病情和身体状态是近似的，倘若用一组年轻人和老年人做对照，或者用轻症病人与危重病人做对照，那很可能会得出错误的结论。

为了避免偶然因素的影响，我们需要进行随机分组和较大的样本数量，为了避免主观因素对疗效判定的影响，我们必须采用盲法。

我们今天已经知道维生素 C 对普通感冒无效，但在设计试验验证时，也曾发生过一些令人啼笑皆非的趣事，本来试验组口服维生素 C 片，对照组口服乳糖片，受试者原本是不知道自己吃的哪种，可有一部分人咬碎了药片试图猜测自己吃的是什么药。

结果就导致在疗效判定时得出维生素 C 有效的结论，但如果只在未猜出药物成分的两组志愿者之间比较，就会发现两组没有差别。

经过了这样的临床试验验证之后，我们方能承认该试验得出的结论为支持某种药物或疗法的医学证据。

那么事情到此为止就结束了吗？

并没有。

证据金字塔

因为单独的一次试验，哪怕设计的再规范，也仍有可能由于偶然因素产生误差，为了最大程度地避免这些误差的影响，研究者就需要把不同国家、多个试验中心的数据进行合并，这一过程被称为「荟萃分析」（即Meta Analysis，系统评价）。

至此，我们再回头去看我国学者对证据的定义：证据是经过系统评价后的信息。

理解这一准确叙述背后的原理了吗？

所以——

为什么构成医学证据的要求这么复杂？

不都说眼见为实么？

不都说实践是检验真理的唯一标准么？

不都说别管黑猫白猫逮住耗子就是好猫么？

这些问题，读者诸君应该可以回答了吧：

1、眼见未必为实，你的所见可能被主观因素和你不理解的现象误导。

2、只有设计科学的实践才能检验真理，否则就是无效的实践。

3、只有通过严格验证的才算逮住了耗子的好猫，否则就有可能是逮住死耗子的瞎猫。

四、

老读者耐着性子读到这里可能会想说，那些原本就不理解医学证据含义的人，就不可能认真读完，而理解这一原理的人，也不需要读这篇文章。

对此，我想说，各位不必过于悲观，试想一下，我们当中有多少人是与生俱来就理解循证医学原理的呢？那为什么我们在反复多次接触过这类概念之后就想明白了呢？

虽然影响并说服他人非常不易，但为了我们希望的世界，这值得一试。

心理学上的「逆火效应」并不常见，很多人可能是把「反论偏倚」跟「逆火效应」弄混了——

「逆火效应」意味着人们会忽视与自己对立的观点，并强化现有的理念；

而「反论偏倚」则是说，人们倾向于忽略对他们而言论证不够有力的论点。

这就提示我们，如果有足够令人信服的论据，结合恰当的说理方法，人们的观点就有可能发生改变，即使是那些被很多人视为根深蒂固的传统观念，也仍有可能在条件成熟时逐渐土崩瓦解。

或许，我们已经处在这样一个不可逆的历史进程当中了。

继续阅读

阅读原文