本文首发微信公众号:飞总聊IT

2022年过得真快,12月了,我还有几个技术相关的话题一直想写却没写。今天本来是写其中一个技术话题的,结果,查资料发现,还是先写写八卦吧。
我要写的技术话题是Trino Summit,查资料查到的公司是Trino背后的大数据创业公司Starburst。
Starburst是一家2017年成立的大数据公司,总部在波士顿,它是现在Trino这个项目背后商业化的主要公司。最新一轮融资是serial D,估值在3.35B,今年2月完成,融资额度是250M。总融资额在414M。
打开这家公司网站:https://www.starburst.io/about/leadership/,我们可以看到非常奇葩的地方。
公司的CTO有4个:Martin Traverso, David Phillips, Dain Sundstrom,KamilBajda-Pawlikowski。
这几个CTO当然不是一路人,我们这样拆一下,Martin Traverso, David Phillips,Dain Sundstrom,这几个人算是一路的。他们就是Facebook当年创立Trino这个项目的人,也就是赫赫有名的Presto三巨头。
我们还记得三巨头跳出来谴责Facebook,搞Presto分家的故事吧。不记得的话,飞总帮大家复习一下,我几年前写的文章:惊闻Facebook开源大数据引擎Presto团队正在分裂具体的情况,我就不在这里重复了。
所以,这几位是Facebook的Presto团队来的。Starburst成立于2017年,但是这三位是2018年底脱离Facebook,成立了Trino Software Foundation,并于2019年下半年入职Starburst,成为了co-founder外加CTO。
当然,硬要在这几个CTO里面称一下分量的话,Martin还是更牛逼一点,因为Martin加入了董事会,后两者没有。当然也可能是Martin作为他们三个人的代理进入了董事会。
那么另外一个CTO和Starburst的背景来路到底是什么呢?其实从另外一个CTO KamilBajda-Pawlikowsk的Linkedin网站看一下就知道了。

如果要深挖的话,这就要好好扒一扒学术圈里一段狗血八卦了。
我们知道MapReduce出来以后,谷歌一度很得意洋洋。但是当时database的大佬们却跳出来写了一篇著名的文章, MapReduce a major step backward。有关这个八卦,在我写的大数据相关的文章里,有过不只一次说了,我这里就不展开了。
这里我要提的是写这篇文章的除了有大佬Michael Stonebraker以外,还有刚毕业去MIT做教授的Samual Madden。而他带的第一个学生,叫做Daniel Abadi。我绕了那么久,终于进入正题了。

Daniel Abadi毕业以后去了耶鲁大学做教授。在VLDB2009年的时候,他的团队发表了一篇论文HadoopDB:http://www.cs.umd.edu/~abadi/papers/hadoopdb.pdf
这篇论文当年在我看来是无数蹭Hadoop和MapReduce的论文之一。想法非常的简单,就是用MapReduce做骨架,然后底层的计算节点放的是一个又一个的PostgreSQL的实例。这样就把MapReduce和数据库给绑起来了,项目名字就叫HadoopDB。
我当年觉得这篇论文是蹭MapReduce的热闹的。VLDB学术圈似乎有不一样的观点。2019年的10-year best paper给了HadoopDB。
为什么会给这篇论文,我说不清楚也不敢乱说。总之我个人没啥学术成就,曾经不理解HadoopDB的牛逼,到今天依然理解不了HadoopDB的牛逼。
这个HadoopDB的项目,主力之一就是这个CTO KamilBajda-Pawlikowsk。这个项目最终被创业公司化,开了一个公司叫Hadapt。Kamil后来忙于公司事务,拿了一个Master就退出PhD了。发了论文,拿了大奖,开了公司,却没有拿到PhD。
Starburst还有一个CEO叫Justin Borgman,之前也是Hadapt公司的CEO。所以,这另外一派人,就是Hadapt公司来的。
但是新的疑问来了,Hadapt公司不是做HadoopDB的吗?怎么现在变成Starburst了呢?开始做Trino了呢?
这又是另外一段故事了。这段故事要从一个冤大头叫Teradata说起来。Teradata也发现了bigdata对他们的生意侵蚀严重,需要进入这个圈子了。
只不过,Teradata选择进入这个圈子的方式有点奇葩,通过收购了这家叫做Hadapt的公司,却废弃了这个公司的产品,转而让这些人进入当时还是叫做Presto的项目里面去添砖加瓦的方式进入。
也就是说,Teradata把Hadapt买了,然后让Hadpat的人去抢Presto项目的主导权,和为Presto做贡献。

后来的结果呢?Presto这个项目被Facebook和三巨头把控的非常的厉害,Teradata高调进入贡献,也没贡献出个什么东西出来。于是Teradata又整体把这个收购来的部门给裁掉了。
这些人2017年又出来搞了一个新的公司Starburst,目标就是要以Presto商业化为己任。可见Teradata是多么的傻逼,一开始买公司的时候不知道买啥,后来选项目的时候不知道选啥,最后又把自己整块资产当做投资失败给处理掉了。
所以梳理一下,Starburst里面有两套人马:

1.早年跟着Daniel Abadi做HadoopDB,商业化成Hadapt,被Teradata收购去进军Presto项目,最后又被Teradata整体裁掉的人。
2.Facebook里面最开始搞Presto的三巨头,2019年的时候从Facebook里出来和Facebook决裂,带着新的Trino加入Starburst的。
这背后当然有更多的狗血的事情,无论是Hadapt和Teradata的故事,还是Starburst最后怎么吸引到3巨头,还是3巨头怎么和自己的领导开干仗分裂社区的,每个事情深挖下去都是大坑。
飞总今天做功课想要好好写Trino summit,就浅浅的挖了一下背后的Starburst公司,然后,大家就看了这篇文章。
那么问题来了,这个公司做Trino有前途吗?好问题,今天篇幅已经有点多了,我挖的写的也够累了,写不下去了。如果这篇文章有让我满意的阅读点赞赞赏,我再开一篇写写这个问题吧。
继续阅读
阅读原文