Jeff Leek 是约翰·霍普金斯大学布隆博格公共卫生学院(Johns Hopkins Bloomberg School of Public Health)助理教授。他与另外两位教授共同打理的 Simply Statistics (http://simplystatistics.org/) 是最受欢迎的统计学博客之一。本文是小编对 Jeff Leek 采访的录音稿。
1. 教育背景
我叫 Jeff Leek, 我是美国约翰·霍普金斯大学的一名助理教授,方向是生物统计。我在犹他州立大学念的本科,方向是应用数学。然后是在西雅图华盛顿大学读的生物统计博士学位。之后我又在 Mount Sinai School of Medicine 做了博士后,然后又去约翰·霍普金斯大学做了博士后,方向是计算生物学。我的研究方向主要是基因组相关问题和下一代序列分析。我正在维护一个叫 Simply Statistics 的博客,里面有很多有趣的统计问题。
2.为什么选择统计专业?
当我还是一个本科生的时候,我和一个教授做一个关于甲壳虫的研究。我收集数据,然后用微分方程模型研究甲壳虫灾害的爆发。那时候在分析数据的过程,我觉得需要学习更多的统计学知识。所以当我申请研究生项目的时候,申了一半的数学,申了一半的统计。但是当我去各个学校访问的时候,觉得还是统计系的人们更有意思点。最后我就去了生物统计专业了。在读研究生的时候,我的博士导师,同是也是我的研究助理导师引导我进入了基因学,而我自己也觉得基因学很酷很令人兴奋。总之,就是我的导师让我觉得基因学很有意思,然后我就进入了这个领域。
3. 你最常用的模型或软件。
R, Python, C.
4. 你最自豪的一项研究成果。
我对我自己的每一项研究都很自豪。其中有一个是我们从很多发表在主流医药学期刊上的学术文章爬数据,收集它们的p值数据,然后估计医药学研究结果中 False Positive 的比例。我以这个结果很自豪,首先是这是我和我妻子合写的第一篇文章——我妻子也是一位统计学家;其次是我们亲手完成了从收集数据、创建新的统计方法、然后分析数据的整个过程,做一个科学家而不仅仅是统计学家的感觉很爽。
附加问题:
你最喜欢的课程。
我上的诸多课程里最喜欢的是博士生的方法系列课程。因为 Jon Wakefile 教授很有趣。还有一个是 Brian Leroux 教授教的函数型数据分析。
我教的课程里我最喜欢的是实用数据分析。因为这门课不仅仅是我一个人讲,我们还有很多数据分析实验。我给学生很多很难的数据,然后让他们自己想出分析的方法。我喜欢这门课是因为课上有很多的互动,可以和学生去讨论问题,就算猜迷一样,而不仅仅是授课。
你认为很多传统的统计方法像线性模型、方差分析之类的还重要吗?
基础当然是很重要的,但是我认为其它的东西也很重要,比如可重复研究领域和学生计算能力——我们现在研究的很多问题都需要大量的计算。还有,课程之外的展示能力、交流能力也很重要。所以有时候,我揣摩着我们是不是可以适当压缩一下那些传统的东西,增加一些新的内容。总之,那些东西是重要的,但是因为现在想做好研究已经越来越难了,学生必须知道很多很多的东西, 所以我们可以做出适当调整。
统计学如何面对来自数据科学的挑战?
我认为吧,对学生来说,这不是挑战,对教授们才是。这对学生们绝对是机遇啊,如果你懂点计算懂点数据可视化,再加上统计学的背景,你绝对是 Google,微软等公司的抢手货。我就有个学生,本来我希望她去申请教职的,结果一家技术公司看上她,她就去那家技术公司。所以对学生来说这些都是机遇。
对教授们这是挑战,因为更需要想方设法的吸引优秀学生了。应对方法就是统计专业需要增加更多的新内容,例如数据可视化,计算和可重复研究,并且更专注于实际问题。做统计的人,比如像我就会偶尔离开数据去思考一些理论问题。至少对我来说,我所在系是偏重应用的,所以我们需要专注于要研究的问题本身和数据本身。如果我们能做到这些,那就没有什么问题。毕竟人们开始重视数据对大家都有好处。
采访原文,可点击 {阅读原文} 查看。

继续阅读
阅读原文