编辑部按:金勇进老师是中国人民大学统计学院教授、博士生导师,中国商业统计学会会长,曾任中国人民大学统计学院院长等职。他于1979年考入中国人民大学,专攻统计学,并于1995年在该校获得博士学位。在此期间,他曾去加拿大和美国的多所大学进行访学,在多个国家和地区参加学术会议与交流。金老师的主要从事抽样调查研究,以及非抽样误差问题研究,其研究成果得到了国内外同行的广泛认可。本次访谈由统计之都组织,王小宁、张育铭、聂宇舟、张喆于 2023年3月26日在中国人民大学明德主楼对金勇进老师进行面对面采访,随后由聂宇舟、王小宁进行文字转录、校正、整理和精简。文中图片由金勇进老师提供,下面是访谈正文。
金勇进老师接受统计之都的采访

一、个人经历

Q: 金老师,您能给我们讲讲您的个人经历吗?
金勇进教授: 我是1969年去黑龙江生产建设兵团的,那个时候正是文化大革命后不久。后来,1979年我考入中国人民大学,专攻统计学,读完了本科和研究生。1986年我毕业后留校工作,一直到退休。这段时间里,我还在1991年读了博士(在职),当时我校有一个中国-加拿大政府联合培养博士项目。我也曾去加拿大麦吉尔大学一年,拿够了学分,然后回国完成学位论文写作和答辩,1995年获得博士学位。之后,我还分别于1998年和2007年去美国芝加哥大学,密歇根大学和威斯康辛大学做访问学者。此外,我还去过许多国家和地区参加学术会议和交流。
课程结束后金老师与学生合影
Q: 那么,您认为自己的经历对您的学术研究有什么影响?
金勇进教授: 我最深的感受是,做事要有持之以恒的精神,不轻言放弃。我刚开始工作时,经历了很多的艰辛,写毕业论文时也是煎熬。但是,如果你以积极的态度,勇敢地面对,脚踏实地的努力奋斗,成功就会与你如影随形。我从来不轻易放弃,因为我知道打开门的可能是最后一把钥匙。不放弃,就是最管用的钥匙。
金老师在做学术报告

二、抽样研究

Q: 您的主要研究领域是抽样研究,请谈一下您是如何选择这个领域的?
金勇进教授: 我选择抽样调查作为研究领域可以追溯到我读博期间在加拿大的学习经历。当时,我的导师G.A.Witemore从事抽样研究,他讲的抽样课程让我如痴如醉,一下就把我吸引过去。当时我国抽样调查刚刚兴起,许多问题有待研究,G.A.Witemore就与我说,抽样调查有广阔的应用空间,虽然你是刚起步,但坚持5年会有成效,坚持10年就会成为专家,坚持15年就会成为大牌专家。于是我就把博士学位论文确定为“非抽样误差分析”。后来经修改后这篇博士论文变成一本书,名字就是“非抽样误差分析”,1996年出版,这是我的第一部学术著作,该书在1998年全国第四届统计科学技术进步奖评选中被评为专著类二等奖。那两年我在外文期刊、统计研究等统计学期刊上发表了近10篇有关抽样问题的文章,奠定了一个良好的学术起点。
金老师在做学术报告
Q: 那您在研究中,除了抽样问题之外,还涉及到哪些方面呢?
金勇进教授: 我的研究的内容还涉及到如满意度模型分析,与学生梁燕、张宗芳合作写过一本书“满意度评估系统应用研究”(获北京市第九届优秀哲学社会科学一等奖,2006),研究过统计数据质量问题;与学生王华合作,出版《统计数据质量评估:误差效应分析与用户满意度测评》著作,获第十届全国统计科学研究优秀成果奖专著类二等奖,2010;与学生陶然合作的论文“中国经济普查数据质量评估的改进与完善”获第十届全国统计科学研究优秀成果奖论文类二等奖;与美国威斯康辛麦迪逊分校的邵军教授合作写的“缺失数据的统计处理”获第十届全国统计科学研究优秀成果奖专著类一等奖。有关抽样问题研究获得的各类奖项就更多。细算起来,获得的省部级以上教学科研成果奖有20多项。
金老师科研成果获北京市哲学社会科学优秀成果一等奖
同时还承接过大量的各类抽样方案设计,数据处理,权数调整和评估项目。比较有影响的包括:我国劳动力抽样调查方案的设计,规下工业抽样方案,住户调查抽样方案的研讨,公众生态环境满意度抽样方案设计,非国家贫困县建档立卡户抽样方案设计(以上均为国家统计局),公众科学素养抽样调查方案设计(中国科协),中国妇女社会地位抽样调查方案设计(中国妇联),我国老龄人口生活状况抽样方案设计(老龄委),经济社会用水抽样调查方案设计(水利部),PISA项目抽样方案设计(教育部考试中心),中国儿童青少年心理发育特征调查抽样方案设计(北京师范大学),CGSS调查抽样方案设计(中国人民大学)等等,有关抽样调查方案设计,调查数据权数处理等各类项目几十项。
金老师专著获全国统计科学研究成果一等奖
Q: 网络调查对传统调查带来新的挑战,您是如何看待这一新兴调查方法,以及您认为接下来可以做的研究方向有哪些?
金勇进教授: 网络调查的具体实现方式有多种,但大多属于非概率样本,无法进行统计学意义上的推断。这也是抽样调查在大数据背景下面临的挑战。目前带领学生研究的路径主要有:非概率样本的统计推断,我曾主持的社科项目“非概率样本统计推断”是第一个研究非概率样本的国家级项目,“大数据背景下非概率抽样的统计推断问题”(与刘展合作),2016年发表在《统计研究》的文章也是在我国率先讨论非概率样本推断的文章,被引用次数很多,被评为首届《统计研究》优秀论文二等奖。在此路径下进一步推演是数据整合推断,属于大数据背景下抽样问题的应用性研究,如指导王俊的博士学位论文“非概率网络样本的统计推断问题研究”,刘晓宇的博士学位论文“抽样调查中的权数问题研究”等,此外还有无抽样框的抽样问题,如邢杨阳的“大数据背景下基于数据流的抽样方法研究”,孟珠峰的“RDS抽样问题研究”等。总之,这些都是有发展前景的研究内容。
科学研究是一项坐冷板凳的艰苦事情,这中间会面临许多挑战。生命中的挑战并不是让你陷入停顿,而是要帮助你发现自我,我们要感谢每一个新的挑战,它会锻造你的意志,品格和能力。
2023年5月金老师在全国大学生市场调查与分析大赛研究生总决赛致辞

三、统计学发展和教育指导

Q: 金教授,您认为统计学和抽样调查在大数据时代面临哪些挑战?
金勇进教授: 统计学作为一级学科,在学科体系中还属于小学科,在大数据时代也面临许多挑战。例如,许多数据类型(如非概率样本)难以依靠传统统计理论解决。此外,新组建的机构“国家数据局”归属发改委而不是统计局,这表明随着互联网、通讯、以及人工智能技术发展,数据建设已经上升到了战略高度,各学科在不断蚕食统计学领域。在这个背景下作为传统数据分析强势学科的统计学也要走出去,与其他学科结合,发挥寻找事物数量规律的强项。这当中抽样调查有着特殊的地位。
最近中央办公厅发文《关于在全党大兴调查研究的工作方案》,其中提到要“综合运用座谈访谈、随机走访、问卷调查、专家调查、抽样调查、统计分析等方式”,这些调查有些属于定性社会调查方法,抽样调查则属于传统经典的统计调查,即便在有大量数据源的大数据背景下,抽样调查仍然充当中流砥柱的作用。抽样理论的核心是样本的抽选和数据的推断,这两者相互联系,互为依存,成功的抽样调查要使两者很好地、高效、高质量地融为一体。
2004年金老师作为中国人民大学统计学院首任院长,在统计学院成立大会时发言
Q: 您在统计教学领域有什么心得,您的教学理念是什么呢?
金勇进教授: 自1986年入职,2020年退休,我已经当了34年教师,开过的各种课程算下来有10多门,带过的硕士、博士研究生加起来有100多名。每次上课前,即便是讲过多次的课,我都是要精心备课。统计学最大特点在于应用,抽样课程中有大量公式,但公式本身是对社会现象的抽象化描述,所以我更侧重将它们拓展到实际问题上,解读它们在实际应用中蕴藏的深意。为了将晦涩的原理讲得清晰生动,我在课上总是结合许多做过的实际课题,凭借现实案例与故事情节,力图将抽象的统计概念和社会生活联系起来,很多学生在和我反馈时说,抽样这门课程内容挺难的,但老师讲得这么通俗,逻辑线索清晰,我们一听就能明白了。我觉得这其实是对我教学的最高评价。
我的教学理念是,在传授知识的同时,注重学习能力的提高。我曾多次对不同学生说过,“你如果想造一座高楼大厦,就得沉住气先打好地基,一些基本能力包括:注意力、观察力、意志力、自制力、专注力。任何一根“桩”打得不扎实,都将影响大厦的高度”。教育的本质就是,当你把一切的知识都忘光的时候,剩下来的那些东西。那些东西是什么?就是学习的能力。 同时,教师在传授知识的同时,不要忘了要向被教育者学习,我带的学生都非常优秀,在和学生们一起做课题,一起写文章的时候都是我最幸福的时光,在他们身上我也学到了许多,收获了许多,在此向他们表示深深的感谢!
教育的最终使命是“育人”,作为社会人,教师或许有几种面孔,但面对学生教育者只能是唯一的面孔,那就是“真诚”,真诚只能用真诚来唤起,正直也只能用正直来塑造。
Q: 您对统计之都的发展有什么期待和指导意见?
金勇进教授: 统计之都是一个由统计学院的大学生发起的,进行统计学术研究和学科领域信息交流的平台,我认为随着时间推移,统计之都的社会影响力会越来越大,希望统计之都继续发挥民间社团优势,越办越好。
金老师与学生滑雪时照片
统计之都编辑部祝愿金老师身体健康、诸事顺意!
——全文完——
统计之都访谈
第1期:吕晓玲
第2期:约翰·霍普金斯大学 Jeff Leek
第3期:易丹辉
第4期:谢梁(微软)
第5期:黄帅
第6期:张健(微软)
第7期:Scott Iverson(杜邦先锋)
第8期:北大光华王汉生教授
第9期:Hadley Wickham
第10期:子豹(淘宝)、授武(聚划算)
第11期:郁彬教授
第12期:Terry Speed 教授,2013 年总理科学奖得主
第13期:逄伟 (eBay)
第14期:北大张俊妮老师
第15期:Rob J. Hyndman
第16期:加州大学戴维斯分校蔡知令教授
第17期:人大统院青年教师褚挺进
第18期:陈天奇
第19期:张志华教授
第20期:千秋邈矣独留我,百战归来再读书:谢益辉
第21期:史建军:饱学致用育桃李,锦袍换酒傲江湖
第22期:李丰老师
第23期:尹建鑫老师
第24期:郭绍俊老师
第25期:李东老师
第26期:寇强
第27期:出国申请经验分享(上)
第28期:陈松蹊教授
第29期:出国申请经验分享(下)
第30期:宗福季老师
第31期:Charles Stein
第32期:合肥R会议主席—林枫
第33期:刘三震老师
第34期:刘霁老师
第35期:Roger Peng
第36期:邵军老师
第37期:俞声老师 —— 践行医学信息学的统计人
第38期:黄建华老师
第39期:吴建福教授
第40期:Breiman
第41期:统计大师Donald B. Rubin
第42期:袁卫教授 
第43期:孤峰顶上求大道,红尘浪里取乾坤--张志华访谈 
第44期:统计遗传学之路—西湖大学杨剑老师 
第45期:统计大师Bradley Efron
第46期:数据科学先驱John Tukey
第47期:斯坦福大学青椒——雷理骅访谈
王汉生:作者访谈 |《数据资产论》王汉生 
吴喜之:在疑问中生存(COStudy数据科学讲座第一期文字记录} 
林希虹:踏踏实实做好一件事的生物统计科学家林希虹教授访谈 
J.J.Allaire:RStudio的前世今生——RStudio创始人专访 
Leo Breiman:Leo Breiman 访谈实录 
Breiman:Breiman访谈录 |《统计建模:两种文化》20周年纪念 
Terry:我们为什么要做研究? 
继续阅读
阅读原文