疫情地图 霍普金斯大学疫情地图背后:核心团队是两位中国年轻人
绘制全球流行病实时地图的中国学生
美国约翰·霍普金斯大学的新冠肺炎疫情追踪地图每天在全球平均有10亿次点击。它的核心团队是两位风华正茂的中国年轻人和他们年轻的女导师。董恩生,30岁;25岁的杜宏儒是去年秋天进入约翰·霍普金斯大学的一年级博士生
作为中国学生,董恩生和杜宏如比大多数美国科学家更早地对新冠肺炎疫情感到担忧和担忧。正是这种职业敏感性和对疫情信息敏感性的叠加,让他们更早地认识到制作世界疫情地图的意义和价值
美国东部时间5月7日,美国约翰斯·霍普金斯大学疫情追踪图显示,全球新冠肺炎感染确诊病例超过375万例,死亡病例超过26万例;美国确诊病例超过122万,死亡病例超过7.3万。地图背景是黑色的,疫情是红色的。数字简单抽象,每一刻钟更新一次,不断变大,大到让人不知所措。它们是沉重、刺痛的眼睛。
新冠肺炎已经造成了超过26万人死亡,其中大部分是沉默和孤独的。在垂死的病房里,病人见不到亲人,死后没有葬礼,他们的生活故事也不会出现在报纸上。死亡人数太多就像一个黑洞,让死者失去姓名和面容。
然而,数字仍然很重要。它不仅对政府和公共卫生机构的决策者很重要,而且对制定风险评估和疫情趋势预测模型、进行社会人口分析和其他领域的研究人员也很重要,对疫情阴影下的所有人也很重要。
这份仍在丰富和提炼中的疫情地图,全球日均点击量为10亿次,日最高点击量为45亿次。这是各国政府、研究人员和主流媒体引用最多的疫情数据来源。这张疫情地图也带动了美国各州以及世界上很多国家的政府或者非政府组织制作类似的疫情地图,提高数据的准确性,从而增强了人民的知情权。
在地图后面
然而,很多人直到最近才得知,这张风靡全球的疫情追踪图的核心团队,是两位风华正茂的中国年轻人和他们的年轻导师。
董恩生,30岁;杜鸿儒,25岁。他们都是去年秋天进入约翰霍普金斯大学的一年级博士生。两人的名字里都有儒家文化。
他们的导师是劳伦·加德纳,副教授,才35岁,学的是建筑学。去年在约翰霍普金斯大学任教之前,她是澳大利亚悉尼新南威尔士大学土木工程专业的高级讲师。目前,她只从中国带了这两个学生。
他们的部门,叫做土木工程和系统工程部门,似乎与流行病学和病毒学无关。但是没有什么事情是突然发生的。
董恩生说,这是全球首个实时更新的疫情地图,创意的正式创作来自1月21日上午,他和导师在图书馆喝咖啡,这是师生见面交流的常规方式。两个人的想法都一样,“一拍即合”。
在和导师见面之前,他已经开始收集资料,做准备。“一开始是为了学术研究的目的,很简单。”
那天晚上,董恩生花了七八个小时输入数据,制作描图,一直到凌晨三四点。经过审阅、修改等程序,导师于1月22日首次在社交媒体推特上发布了第一版疫情世界地图,正好赶上北京时间1月23日武汉宣布“封城”。
董恩生说,刚开始几乎没有现成的模板可以申请,他一直在输入数据和坐标。当数据在世界地图上一一呈现时,他逐渐意识到这是第一次在全球范围内实时更新疫情地图。
和导师喝一杯咖啡,开七八个小时的夜车,开始一项世界倡议。有这么简单吗?
在美国总统选举中,当政客们为一个候选人背书时,他们有一个共同的说法,那就是他们称赞候选人“为此准备了一辈子”。董恩生和杜宏如都很年轻,但以他们的学习和工作经历来看,确实可以套用这句话。
董恩生说,他毕业于重庆西南大学地理系,2012年赴美留学。获得硕士学位后,曾在美国地方政府的IT和卫生部门、软件公司、电力公司和电信公司实习。
他接受过正规的地理学和统计学的学术培训,目前的研究领域包括网络科学、移动性建模、机器学习、空分析和可视化,以及传染病的跨学科研究。在新冠肺炎疫情爆发前,他曾参与预测美国和太平洋岛国和地区的麻疹风险以及斯里兰卡的登革热。
杜宏如也有跨学科背景。他是天津大学化学工程学院2017届毕业生。他在爱丁堡大学学习化学材料科学,在威斯康星大学麦迪逊分校学习工业工程和运筹学。
擅长数学建模和路径优化,主要研究兴趣包括流行病学大数据处理、网络优化以及研究和预测全球流行病发展的数学建模。他在2月1日加入了疫情地图团队,并编写了自动数据更新的代码。
他说,病毒传播不妨认为是一种网络,所有的县都是网络节点,每个节点之间的人口流动构成了连接。无论是通过数学建模预测疫情趋势,还是分析人口社会学,系统科学都非常重要。
作为中国学生,董恩生和杜宏如比大多数美国科学家更早地对新冠肺炎疫情感到担忧和担忧。正是这种职业敏感性和对疫情信息敏感性的叠加,让他们更早地认识到制作世界疫情地图的意义和价值。有了之前的学术训练和经验积累,他们不仅能在大脑中“思考”,还能自然地拥有“做”的能力。
但是“做”并不比“想”容易。从1月下旬到现在,董恩生和杜宏儒为疫情地图的升级、完善和维护以及疫情数据的相关研究投入了大量的精力和劳动。
在人工输入阶段,他们每天工作大约10个小时。3月中旬过渡到自动数据更新期间,每天的工作量达到了十五六个小时,导师和他们一起工作到凌晨三四点。即使团队扩大到50人左右,数据实时自动更新,每天也只需要五六个小时,十几个小时就可以对数据进行审核和修正。
恶魔经常隐藏在细节中。4月13日,约翰斯·霍普金斯大学新冠肺炎疫情统计网站制造了一起乌龙事件,误报全球确诊病例超过200万。原因是佛罗里达州的实际病例数被误填为123,019例,导致误差超过100,000例。但不久之后,他们将数字调整回190万左右。
在疫情图的维护中,检查数据以确保其准确性非常重要。杜宏如表示,由于美国疾控中心的数据比较滞后,他们主要依靠在推特上捕捉美国当地媒体和各州卫生官员报道的数据,而其他国家和地区的疫情则是基于Worldometers等网站和当地媒体。由于更新时间早于官方数据,团队会在电脑自动更新后的第二天,将美国疫情数据与各州疾控中心的数据进行核对,其他国家和地区的数据将与世卫组织的数据进行核对。
董恩生说,为了保证数据的准确性,他们还采取了四项措施,一是保留数据的原始记录,并且每次更新都有追溯记录,二是汇总时间序列表,三是列出所有的更正记录,四是组织人工核查。
值得一提的是,在约翰霍普金斯大学疫情地图的背后,活跃着更多的中国年轻人。
据董恩生、杜宏儒介绍,目前运营团队约50人,其中数据核查团队的志愿者主要是来自各个部门的中国留学生。中国提供的疫情数据为国际研究做出了不可磨灭的贡献。应对新冠肺炎疫情为中国开展跨学科国际传染病研究、加强全球公共卫生参与、提升政府部门和研究机构疫情数据可视化和国际化水平提供了新机遇。
突出
在董恩生、杜宏儒看来,约翰霍普金斯大学的疫情地图之所以脱颖而出,得益于多方面因素,主要有以下八点原因:
一是时间早,在世界上领先一步,与后来出现的其他疫情地图相比,数据更准确、更快捷;二是在流行病学方面更专业。美国疫情精确到县级,对科研人员和公众大有用处;三是地图绘制的专业性;四是数据公开透明,所有数据上传至GitHub,为全球所有政府决策部门和研究人员提供开源数据;五是保证及时更新,用户参与度高。德国、法国、意大利等非英语国家的很多用户会主动报告当地媒体报道的最新疫情,这比等待官方审核渠道的确认数量要快得多;第六,疫情地图的设计有很高的黑红对比,构成了很强的视觉冲击力;第七,约翰霍普金斯大学在全球医学和公共卫生领域享有很高的声誉,使得疫情地图从一开始就具有权威性,这是普通大学仅靠学校声誉难以获得的;第八,从最初的导师推特到各国媒体报道,社交网络和媒体传播的滚雪球效应已经产生。
从日内瓦的世界卫生组织总部,到纽约的联合国总部,到华盛顿白宫的疫情会议,甚至《纽约时报》等美国主流媒体,大部分也都使用了他们的统计数据。
不过,董恩生指出,疫情地图和数据并不能完全反映一个国家抗击疫情的能力。目前,国际社会缺乏疫情报告的全球指导文件和统一的报告标准。各国各地区的统计标准不同,病毒检测水平不同,人们对疫情的看法也不同。
在欧洲和美国,也有许多统计混乱、缺失和重叠的现象。例如,美国的监狱系统分为联邦监狱和地方监狱。联邦监狱的疫情是否纳入各州县的统计,不得而知。由于囚犯的隐私和相关法律,许多地方不愿意公布监狱的疫情。在州县交界地区,出院或转院患者经常会跨州,如何统计也是一个难题。此外,考虑到可能出现的重复计算,美军疫情在疫情地图中并未统计。
在世界范围内,有时会有一个“数据参考周期”,即相关网站的数据可能来自约翰霍普金斯大学的疫情地图,因此需要仔细筛选,不断提高直接获取数据的能力。
董恩生认为,虽然美国疫情严重,但从科研和大数据创新的角度来看,很多做法值得借鉴。
比如各种疫情预测模型的分析层出不穷,相关研究可谓“八仙过海,各显神通”。无论是面对学术界还是公众,这种数学模型分析都是非政治化的。无论预测是对是错,都可以创造出公共卫生对策的讨论空,催生出许多新的思路和新的对策。
追求多学科智能融合,“跨界”特征突出。在美国,本科课程可以跨专业选择。董恩生在美国获得理学硕士并攻读工学博士并不少见。为了避免疫情地图的单一呈现,我们需要地理、计算机和疾病传播的学术背景。
事实上,约翰·霍普金斯大学系统科学与工程中心在去年就已经更名,这一举动本身就凸显了“跨界”的色彩。董恩生说,系统工程本身在美国是一个新领域。除了疾病传播,它还与公共卫生学院和美国医院系统合作,包括CT扫描、人工智能等项目。
另外,在科研领域,我们不讨论资历,这样有能力的人才能相对顺利地脱颖而出。培养科研创新的氛围也很重要。董恩生、杜宏如和他们的导师加德纳都是去年进入约翰霍普金斯大学的“新人”。他们推出的疫情地图在资金、服务器维护、图书馆资源、运营团队建设等多方面得到了学校的快速支持。
约翰斯·霍普金斯大学在全球公共卫生领域的声誉给了他们优越的平台,但他们作为“新鲜血液”所带来的朝气、活力和干劲反过来又为学校品牌增添了黄金。
董恩生和杜宏儒都对他们的导师加德纳副教授既敬佩又称赞。据他们介绍,这位年轻的女导师经常在凌晨两三点工作,审查和指导学生的工作,处理错误的反馈邮件,与有关方面协调,向政府和国会报告...虽然她有很高的学术热情和专业敏锐度,但加德纳并不否认学生的工作和贡献,为学生提供很多机会,注重帮助和保护学生。
更值得称道的是,他们“很有原则”,坚持数据公开,拒绝疫情地图商业化。一些美国一流公司提供高额资本和优厚的合作条件,看似“双赢”,但团队依然拒绝,坚持开放共享,反对与业务过度联动。正是这一原则,使得约翰霍普金斯大学的疫情追踪图获得了更广泛的公众影响力。
五月转眼就到了。如今,约翰斯·霍普金斯大学的疫情追踪图已经升级了好几个版本,数据分类更丰富、更细致。在世界疫情地图上,不仅有180多个国家和地区的确诊人数,还有各州、各省的确诊人数。除了累计确诊病例数外,还有未康复患者数、发病率、确诊病例死亡率、检出率、住院率等重要数据。在美国的疫情地图上,不仅有各州的确诊人数、人口比例和死亡率,还有美国确诊人数最多的50个县和死亡人数最多的20个县。
此外,还有专门的章节分析判断疫情的一系列重要数据,包括美国各州疫情的种族分布;每10万人口中确诊病例和死亡人数的全球比较;在全球疫情最严重的10个国家中,决定疫情曲线如何拉平的每日新增病例数据等...
杜宏儒说,可靠的数据是研究和决策的基础。从约翰斯·霍普金斯大学疫情追踪图的海量访问中,我们可以看到对可靠客观信息的巨大需求。随着疫情地图影响力的扩大,他感受到了更多的压力,对数据的更新和核对也更加谨慎。这是全世界面临的重大公共卫生事件,疫情地图的意义超越了学术研究本身。
董恩生说,疫情发生以来,他一直忙于更新数据、升级疫情地图,“忘记了生活是什么样子”。“对我来说,工作从来没有停止过,越来越多,而且越来越重。有时候突然抬头看到疫情就在身边,世界真的变化这么快。”
相信董恩生和杜宏儒一定会对疫情中的青年印象深刻。疫情终将过去,世界变化的步伐不会放缓。祝福两位中国年轻人越走越远。