
1831年,伦敦爆发了第一次霍乱大流行。小灾进城,大灾离城,在巨大死亡阴影的笼罩下,城市的居民都成群结队向乡村逃亡。这个时候,斯诺(John Snow,1813-1858)还是一名学徒,他目睹了出城的人流造成交通大拥塞,人走城空,正常的生活被传染病快速摧毁,这些场景令他心如刀割。
他是一名麻醉医生,这种传染病跟他关系不大,但医者仁心,他开始关注研究这种病。
当时的人们都传言,霍乱是经由空气传播的,城市里无处不在的臭味和瘴气是这种传染病的根源。
霍乱弧菌藏水中,人们却深信是空气传染
1848年,伦敦爆发了第三次霍乱大流行。斯诺发现,霍乱患者的最初症状都是腹泻呕吐,“如果真的是瘴气传播,为什么最先被感染的不是鼻子和肺,而是肠胃?又为什么一家人其中会有幸存者,接触病人的医生也不会被传染?”
斯诺断定,霍乱一定是经口腔进入肠胃的。他推测这极有可能是因为喝了不干净的水。但当时的科学设备看不到水里的微生物,被霍乱弧菌污染的水,看起来完全和正常的水一样,仍然纯净透明。斯诺无法说服身边的人相信他的判断。
斯诺需要的显然是更多的证据。他深入疫区,挨家挨户敲门询问患者和喝水有关的信息。他发现了一个惊人的事实,1848年至1849年霍乱爆发期间,伦敦市共有7,466人死亡,其中4,001人都居住在泰晤士河南岸,这意味着南岸的死亡率接近0.8%,是市中心区的3倍,而伦敦西边和北边的死亡率仅仅只有0.1%。
对此,瘴气论的流行解释是,泰晤士河南岸聚居了大量的劳工阶层,污浊的空气导致死亡率更高。
斯诺认为这个解释是错误的,他举出反证说,伦敦东区比泰晤士河南岸聚居了更多的民工,是全伦敦最贫穷、最拥挤的地方,但死亡率只有泰晤士河南岸的一半。斯诺认为真正的原因是,南岸的伦敦人都饮用泰晤士河的水,而北岸伦敦人的饮用水来源并不仅限于泰晤士河,而是有多个来源。他分析了各个来源,发现死亡的数据和供水的路线有高度相关性。
没有科学、他用统计数据找到病原
斯诺的调查数据表明,饮用A公司水的家庭有1,263人死于霍乱,而饮用B公司水的家庭只有98人死于霍乱。当然,单纯比较死亡的绝对人数是不公平的,因为有些地区的人多,有些地区的人少,斯诺又拿每一万户的死亡人数做对比,结论是饮用A公司水的家庭,每一万户死亡人数约是B公司的8.5倍(315除以37)。
饮用不同供水公司的水,每一万户死亡人数就会有高达8.5倍的差距,这究竟是什么原因?斯诺又进一步关注了两家公司的水源,他发现A公司在流经伦敦市中心的泰晤士河下游取水,B公司则在上游取水,而当时泰晤士河已经被霍乱患者的排泄物污染了。
伦敦市政府的户籍登记处有名统计学家,叫法尔(William Farr,1807-1883),他的职责就是记录人口的最新变化,例如出生、结婚和死亡。这个法尔非常了不起,他在户政部门工作30几年,创建了完善的伦敦出生和死亡人口记录体系。法尔对斯诺的观点半信半疑,他提出:要测定水源对霍乱的影响,必需要有两组居民,这两组人生活在同一海拔高度、活动于同一空间、吃的东西一样、日常活动也要相同,仅仅一方面不同,那就是喝的水,但在现实中的伦敦,显然找不到这样的实验条件。
然而,斯诺认为,实验已经摆在眼前。两家公司的渠道都通向所有的街道,进入几乎所有的院落和小巷,无论贫富,无论房子大小,两家公司都等而视之地提供自来水服务,而接受不同公司服务的客户,他们在生活条件或职业方面也无明显的区别,特别是他们都被同样的“瘴气”围绕,为什么有的生病,有的没事呢?
大规模统计30万名霍乱病患传播途径
1849年,斯诺把这些调查和发现编写成一本小册子《霍乱的传播方式》,正式提出水污染是霍乱流行的真正原因:“再也设计不出比这更好的实验方式,让我们澈底地检测水对霍乱的影响,整套实验设计已现成地摆在研究者面前,而且这一实验的规模相当大,多达30万名不同性别、年龄、职业阶层和地位的人,从上流人士到底层穷人,被分成了两组,他们不仅不能主动选择,而且在大多数情况下对这种选择毫不知情。”一组得到干净的水,而另一组得到被污染的水,所以斯诺得出结论:水源不干净,才是霍乱传播的真正原因。
斯诺的论断是天才式的。他在“随机对照实验”的概念远远尚未产生的时代,就在现实中发现了一次科学实验。科学的实验机制要到20世纪初才被统计学家确立。但斯诺的这些论述只获得极少数的人相信,这本小册子总共才卖出去几十本。大众对瘴气论深信不疑,毕竟,嗅觉是人类一种最原始的感觉,我们相信自己的感觉,就像哥白尼时代的人相信地球是静止的一样。人类对感官的迷信可谓根深蒂固,只有一流脑袋才能将数据当作“感觉的替代品”,通过数据来感知我们自己的身体和外部环境。
斯诺告诉法尔,为什么光看死亡人数,瘴气论好像很正确?那是因为在海拔高的地方,人口密度往往较低,因此死亡人口总数更少;但真正的原因不是这些地方远离瘴气,而是居民远离了泰晤士河下游,水源较为干净。他甚至得出结论说,如果A公司将其取水口移到泰晤士河上游,就可以挽救1,000多人的生命!斯诺最终说服了法尔,在他的统计其中增加一个新的变量:死亡者的饮用水源。
同样是数据分析,为什么只有斯诺才能洞察真正的因果关系?
我想这源自于他对事实和规律持之以恒的细密关注。很多时候,流于表面的观察都无济于事,最高水准的成就来自一步一脚印的关注和不罢休。 “实事求是”,事,就是事实;是,则是规律。实事求是即通过事实分析并发现事物的规律。斯诺的方法,可以总结为实“数”求是:把事实记录下来,再通过全面细密的数据来寻找规律。
霍乱再次席卷,污染水源成关键
1854年秋天,霍乱第4次席卷英国,8月31日爆发,3天内就有127人丧生,10天之后,死亡人数攀升到500多人,其中一个名为宽街(Broad Street)的区域,居民死亡案例最多、最集中。
这时候的斯诺,于每周第一时间阅读法尔的死亡报表,关注死者的饮用水源,希望在表格和数据中找到线索。
虽然法尔收集了供水的来源,但斯诺根据这部分数据做不出任何判断。为什么呢?这是因为整个伦敦有10几家大公司供水给城市的不同地区,各家公司的地盘互相交错,供水管杂乱无章地交织在一起,仅凭地址无法准确判断供水公司。
斯诺左思右想,无计可施之下,为了得到这些数据,他最后决定一家一家上门走访。斯诺走了多少路,我们今天已不得而知。但他很快又碰到新的困难──即使挨家挨户去敲开每一位患者的门,得到的数据也还是不完整、不准确,因为很多住户根本不知道自家的用水是哪个公司提供的,房子可能是租的,水费可能是由房东缴交的,即便是自己付的,也找不到公司的收据,名称还是不清楚。
皇天不负苦心人,斯诺又想出新办法解决这个问题。他在走访中发现,某一家公司的水中,盐分含量是另外一家公司的4倍,根据这个差别就能判断水的来源,如此一来,他碰到不知道自家供水公司的住户时,就取一小瓶水样,在瓶上注明地址,然后带回去检测。
数据的搜集需要毅力与勇气,但更需清晰的脑袋
斯诺搜集数据的执着让人感佩。在大多数情况下,数据都没有现成的。
搜集数据太难了,就像在风中奔跑,搜集随风飞散的柳絮一样,你需要逐风而行,东奔西走。但对高数商的人而言,这一点是共性:他们都愿意展开搜集数据的行动,都愿意付出极大的努力,包括精力和时间。
搜集数据所用的精力、体力和时间,可能是分析数据的数倍之多。第谷和克卜勒就是最好的例子。
在死亡案例高度集中的宽街,斯诺发现,“几乎所有的死亡案例都发生在某街头的一口水井附近。只有10名死者的住所靠近另一个街头的水井,而其中有5名死者的家属确认,他们一直使用那个水泵,有3户距离这口水井远一点,但死亡的孩子所在的学校就在这口水井附近”。
在这条街上,他还发现有一家啤酒厂和一家感化院没有任何人死亡。他实地走访了这两个地方,发现啤酒厂和感化院都有自己独立的水井,而且啤酒厂的工人平常只喝啤酒不喝水,斯诺因此更加确定,水就是人们感染霍乱的最终原因。
现在,让我们试想一下,一个社区爆发了有史以来最为凶险的传染病,惊恐的居民在一片混乱中成群出逃,用马车拉着家当往一个方向走,但一名皇家医生选择逆人流而上,挨家挨户去敲门了解死者的生活细节,他走进的每一间屋子,都还笼罩在葬礼的阴影和哀号其中。
斯诺不仅关注每一起霍乱死亡的病例,还创新了记录的方法。他将死者的地址当地图上标注成一个一个的点,当所有代表死亡的点都标注上去之后,地图呈现的信息立刻清晰起来:霍乱绝不是像空气一样平均分布在这个地区的,死神的阴影有浓云密布之处,它是从一个点发散出去的,这个点就是水井!相较于数据,人类的大脑更愿意接受图表,当面对人群,高数商的人一定得想办法将数据转化为图表。
强大的数据说服当局,阻断霍乱根源
9月8日这一天晚上,是新一轮霍乱爆发的第10天,在政府组织的紧急会议上,斯诺展示了自己的数据和发现,并建议立即封闭宽街上的水井,以此切断霍乱的传播。
这在当时是一个异常艰难的决定。因为如果斯诺搞错了,那些备受死神折磨的家庭还将无水可喝、无水可用,这无异于雪上加霜;但如果他是对的,这个举措就能挽救无数的家庭和生命。斯诺在会议上发言并展示他的图表,这张图表发挥了巨大的作用,市政理事会最后经过投票采纳了斯诺的建议,当局立即拆除了宽街水井的水泵手柄,以控制水井的使用。
宽街霍乱引发的死亡,由此慢慢地平息下来。
后续调查证明,1854年这一场霍乱起源于宽街40号的一名女婴,她被确认感染了霍乱,她的母亲把她的尿直接倒进家门口的化粪池,化粪池的秽物渗透到土里,而距离这个化粪池不到三英尺的地方,就有一口公用水井。
女婴的父亲随后也感染了霍乱,并于9月19日去世。在丈夫病倒后,这位母亲又开始朝化粪池中倾倒污水,如果当局没有拆除宽街上的水泵手柄,后果将不堪设想。
也就是说,斯诺的判断有效地阻止了霍乱的再一次爆发。
在我看来,斯诺是敢于逆行的英雄,更是一名有头脑的英雄。
所谓数据英雄,就是一个人有足够的勇气和专业的判断,为真正解决问题起到关键性、压倒一切的作用。
如果没有斯诺的行动,伦敦霍乱的局面和后果将会完全不同。