前面小编采访了微软的数据科学家谢梁,当时同小编一同吃酒的还有微软的另一位数据科学家张健,巧在张健兄乃小编的师兄,毕业于 Ames 村办大学(又名爱荷华州立大学),当年我前脚到村,他后脚离村,所以之前也不认识。敝村可能名气不大,张健兄在统计界可能也不会有太多人知晓,但俗话说(好吧,我承认我瞎编的)“村长亦干部,凡夫即圣人”,小编很好奇一个物理博士在统计行当里捣鼓什么,于是发去这次采访,希望对外专业的同行们有所启示。
1. 请介绍一下你自己。
我叫张健,目前在微软公司担任 data scientist。我有很长一段时间的物理学习经历。本科期间在复旦大学物理系学习,接着又拿到 Iowa State University 的物理博士学位,博士期间主要从事理论与计算凝聚态物理的研究,涉及到一些算法比如进化遗传算法的应用。博士期间同时拿到了统计的硕士学位,工作之后也开始主要涉及统计相关的方向。
我第一份工作是在 3M 公司进行数据挖掘与算法相关的项目研究,之后转到微软公司做 Internet 上的数据挖掘与处理。我个人比较喜欢注意并且研究一些比较新潮的技术发展与潮流,并且深刻相信这些新兴技术最终会导致世界与人们生活方式的更新。最近二十年各种技术的发展已经达到了日新月异的程度,人们的生活与使用的工具也在发生巨大的改变。我想在未来的几十年变化只会越来越迅速,我希望我们这些统计的学习者和实践者也能在时代的潮流中做出我们自己的贡献。
2. 作为长期物理控,当初为什么选择进入统计或数据分析领域?
和当初选专业一样,进入统计领域也有点误打误撞的感觉。那时候学校的统计系比较出名,因此有机会选修几门课程,并且最终拿到了统计硕士学位。我觉得统计最吸引我的是它的广泛性,既有深厚的理论基础,又有广阔的应用前景,在金融、保险、市场、生物、制药、制造、互联网等等各个方向都有非常多的统计从业者。我个人更喜欢把统计看作是一门处理信息的学问:只要有数据的地方,需要从数据取得并处理信息的地方,就会需要统计。
3. 请谈谈你的研究成果、贡献。
我个人觉得比较有趣的是在 3M 公司做的一个项目。3M 公司是一个有着很深的创新传统的一家公司,很多项目都有很高的创新性。我做的项目是一个涉及到户外电子显示的项目,想法是运用 3M 已有的电子显示的硬件设备(Digital Display)及相关软件,把它们放到商用场所比如餐馆或超市里面,通过设计与安排屏幕上显示的内容来达到收入最大化的目的。这其中包含了很多统计以及优化的方法,我设计出结合统计实验以及动态优化同时进行的算法来为客户创造出更大的利益,它可以通过用户实时反馈的数据流来验证结果以及同时动态优化系统的算法。应该说这个项目的理念非常的先进,我个人相信在未来 Digital Everywhere 的时代一定会得到更大的运用,那时候会伴随产生一个真正的由电子显示代替传统显示的新时代。
4. 你常用什么模型以及软件?
我用过 R 和 SAS,也经常用 C++ 和 Python 来处理数据。Tableau 是一个很好的数据图形软件。模型中当然回归模型是比较基本的,也是很多高级一些算法的基础。我还广泛接触过一些神经元网络、SVM、Random Forest 等等机器学习的模型以及各种 cluster 的模型。我觉得模型本身各有用途,主要是看我们研究的问题以及所有的数据适合怎样的方法。
5. 对统计之都有什么意见/建议?
统计之都是一个很好的地方,提供统计人士互相交流。我希望并且祝愿统计之都未来能够成为一个引领时代潮流的地方、一个能够吸引大量人才的地方。在目前比较热门的领域比如 cloud、mobility、social 和 big data 统计之都能有更多、更深的涉足,将来可以成为一个提供学者和开发者交流合作发展的一个平台。
6. 牛排你通常要几分熟的?
五成熟,我觉得最好。
欢迎大家加我的 Linkedin http://www.linkedin.com/profile/view?id=57165019
或者 email 我 [email protected]
谢谢!
继续阅读
阅读原文