周三好,这里是学长LEO的好文分享频道
近日,一位职高生一路“求学逆袭”成博士的故事受到了广泛关注。
从初中毕业打工一年后,“职校生”周信静意识到了读书的重要性,随后的11年里,他从职高起步,读到大专、本科、硕士,最后凭借在数据库顶级会议的一作文章,成功申请到麻省理工学院的计算机博士,更成为了数据库领域图灵奖获得者Mike Stonebeaker的学生。
物欲横流的时代,周信静身上所体现的“一分耕耘一分收获”的坚持似乎已经很少被践行,“职高”这个并不被看好的故事起点,并没有削弱他持续学习、专注科研的斗志。在“寒门学子”的出路被不断探讨的今天,社会的精细化教育正扩大“成功与否”的边界。但幸运的是,人生是一片旷野,而非一条轨道——周信静用实践证明了:只要有目的地,怎么走,都能为人生踏出一片广阔的天地。
周信静的“逆袭”路上,来自科研、生活、家庭的压力并不小,他如何平衡科研与工作的关系?出身职校,他为什么能带着多篇论文登上顶刊?在进行项目研究期间,他有怎样的坚持,又是否做出了妥协?一起来看看今天这篇文章吧。
来源:新智元(ID:AI_era)
编辑:Aeneas 好困

PART  01
职高逆袭MIT计算机博士生
翻开周信静的主页可以看到,他现在是MIT的一名博二学生,师从数据库领域现存的唯一图灵奖获得者Mike Stonebraker。
据说,在周信静之前,Mike Stonebraker已经好几年没有招过学生了。
在这之前,他曾在杭电取得本科学位,在浙大取得硕士学位。
如果仅看到这里,大多数人会觉得他和许多AI研究者的学业轨迹并无不同。
我们恐怕很难想象到,周信静的学术生涯起点是职校。
出生寒门的他,早年对读书没有任何兴趣。初中毕业后,他经过一年的打工生涯,进入了龙湾区职业技术学校计算机职专班。
在职高的第三年里,他发生了「顿悟」,觉得不该虚度此生,然后开始发奋学习,考上浙江经贸职业技术学院。
这期间,周信静被老师带着参加省内的编程竞赛,受到了启蒙。同时,他靠着网上高质量的公开课,始终没有停下学习的脚步
在大专二年级时,他写的项目就体现出了很高的代码水平,用C++实现了一个raft core。
项目地址:https://github.com/zxjcarrot/raftcore
在就读大三时,raft协议的文章刚出来不久,他对于系统领域产生了浓厚的兴趣,决定对此继续深耕。
周信静通过专升本考试,考入杭电就读本科。在杭电期间,计算机学院有600多人,而他的专业成绩排名第一,拿到了国奖。
本科毕业后,周信静通过考研进入浙大就读研究生。期间,他以一作身份,在数据库顶会VLDB 2020上发表了DPTree的工作。
论文地址:https://dl.acm.org/doi/10.14778/3372716.3372717
完成这项工作期间,周信静遇到了不少困难。
数据库、系统方面的论文极其复杂,很多工作都没有开放源代码。而他凭借极强的工作能力,竟把所有需要对比的工作都复现了出来。
此后,他还克服了许多障碍。第一次review结果不理想,他就想办法创造条件,把NVM模拟器上的实验,搬到了真实的硬件上,成果才终于得以发表在顶会。
随后,周信静入职腾讯。即使在大厂搬砖,他也始终坚持在晚上和周末挤时间做科研
最终,他在此期间参与的工作SpitFire被顶会SIGMOD 2021接收。
论文地址:https://dl.acm.org/doi/10.1145/3448016.3452819
离开腾讯之后,周信静又来到了知名数据库公司DolphinDB。
相关回答地址:https://zhuanlan.zhihu.com/p/360390223
要知道,国内做数据库内核研发的人并不多,公司的要求一般就是有数据结构和C++功底,人很聪明就可以了。
而周信静在面试时,展现出的对raft协议原理和实现细节的熟悉程度,甚至让面试官惊掉了下巴:
在30分钟的对话过程中,基本上捋了一遍如何使用raft协议实现一个分布式数据库,从客户端到服务端的框架设计。
对于这样不可多得的人才,公司非常重视。在入职之后,便直接让他以实习生的身份参与到了DolphinDB分布式时序数据库的内核研发当中。
期间,团队在用哈希方法来改进SQL引擎分组计算的性能时,遇到了瓶颈。
在经过讨论之后发现,标准库的HashMap平衡了key在删除、新增和查询各方面的性能,但在SQL计算引擎中,却基本上用不到删除功能。因此,可以尝试从这个角度进行优化。
于是,周信静差不多用了一个周末的时间,做出了一个Irremovable FlatHashmap的原型,一试果然有效。
凭借着过硬的学术水平和实践能力,周信静最终成功申请到了MIT的计算机博士,并于2021年9月正式入学。

回顾这段经历时,周信静总结道:在DolphinDB实习时,自己发现了Andy的DB课程,被深深吸引。
他希望能将经典的idea应用到DB系统里,甚至创造一些idea。因此,他研究生入坑了DB。
研究生快毕业时,周信静认识了Joy Arulraj老师,在远程交流中,他给了周信静很多帮助,也帮忙写了推荐信。
同一领域深耕多年的勤奋,加上老师、前辈、同学的交流和帮助,让周信静把人生写出了一段逆袭的传奇。
PART  02
多篇论文登上顶会顶刊

现在,周信静不仅已经有5篇论文被各大顶会、顶刊接收。
而且还曾担任数据库顶会SIGMOD 2021、VLDB 2021和VLDBJ 2022的外审。
就在今年1月举办的数据库顶会CIDR 2023上,周信静还做了现场的演讲。
视频地址:https://www.youtube.com/watch?v=8e8KMnGKHwE
从视频中可以看出,他的英文口语水平也是极佳。
在这项工作中,来自MIT、威斯康星大学麦迪逊分校和谷歌的团队提出了一种2-Tree结构,从而解决现有方法在管理大于内存的索引时存在的局限性。
论文地址:https://www.cidrdb.org/cidr2023/papers/p57-zhou.pdf
其中,热索引记录位于一个树中,冷记录位于另一个树中。热索引树块经常被访问,并可能保留在主内存中,从而提高了主内存利用率。
同时,作者还提出了一种高效的轻量级通用记录迁移协议,可在任意两个树结构之间双向运行。这两个树可以针对硬件差异进行单独配置。一个树为主内存进行优化,而另一个则利用二级存储。
此外,2-Tree的思想也可以推广到多个存储层和/或设备。
结果显示,将2-Tree应用到B+树和LSM树上时,可以显著提高它们在高度偏斜工作负载下的内存利用率(分别提高15倍和20倍)。
与使用相同量级主内存的传统单一B+tree 或LSM-tree相比,在Zipfian偏斜的IO受限工作负载上,吞吐量提高了高达1.7倍。
而与现有的以降低范围扫描性能为代价来提高内存利用率的解决方案不同,2-Tree拒绝做出这样的妥协。
PART  03
努力,也是一种天赋

周信静的经历一经曝出,也迅速掀起了广大网友讨论的热潮。
比如经久不衰的话题「第一学历重要还是硕士学历重要?」
此前的这类传奇经历,还是从不知名三本逆袭到耶鲁大学博士全奖。
而周信静则是以职高、大专为起点,目前可以说是前无古人。
也有网友提出,这个励志故事也说明,目前的中考淘汰制对于某些晚熟的学生来说,也有漏洞。
也有人说,努力,其实也是一种极强的天赋。
《了不起的盖茨比》中说:「每当你想批评别人时,记住,并不是世界上所有人都有和你一样的优越条件。
而周信静的故事告诉我们,开局拿到哪副牌,并不是你人生现状的借口。
参考资料:
https://www.zhihu.com/question/625797647
https://zxjcarrot.github.io/
欢迎大家关注视频号「学长LEO」,学长会在工作之余直播分享更多学习干货,下一场直播将在10月19日12:30左右开始。朋友们现在就点击链接一键预约吧!
继续阅读
阅读原文