新粉请关注我的公众号
最近网易数帆宣布自己要发布一个Hadoop的发行版,准备进军Hadoop发行商的市场。
Hadoop三大发行商Cloudera,Hortonworks和MapR,现在都已经是过去时了。当年Cloudera有多风光,现在就有多惨烈。Cloudera以一己之力证明了Hadoop发行商不是个好生意,是个火坑。

可是在2022的今天,在Cloudera已经私有化并停止更新它的Hadoop发行版的今天,网易却毫不犹豫跳进来了。难道网易的领导层发疯了?

我和网易做大数据的那群人有过一些接触,在国内所有做大数据的人里面,这群人给我的感觉是脑子聪明,比较靠谱的那种。一点都不像不知道这不是个好生意。那么为什么网易选择在这个时候成为Hadoop发行商呢?我也试着去解读一下。
据说国内曾经最大的Hadoop发行商是某知名大厂,以“私有云”的名义,一边卖X86的服务器,一边卖(送)Hadoop发行版很多年,但是这两年这个生意不做了。主要有三个原因:

第一,Hadoop发行版卖起来简单,后续的维护很难。大厂搞了很多个不同的版本,最后自己都不知道怎么维护才是最好的。

第二,Hadoop发行版的“私有云”生意和自己家的公有云生意打架。两个不同的团队,资源浪费。后来大厂就把这两个团队合并了,统一只卖“混合云”。所谓混合云就是公有云的软件,但是硬件部署在买家那里,别的人不可见这个节点。软件版本随公有云一起更新。
第三,X86服务器本身也不是利润很高的生意,而国内又流行卖硬件送软件,Hadoop发行版更不赚钱。遭遇某帝国降维打击以后,干脆把X86服务器都卖掉了。
总之大厂的离开确实留下了一部分市场。而还有一件事情,今年Cloudera也停止更新自己的CDP了。网易的科技树选择上,恰好又有它的优势,可以接下Cloudera的老客户,主要优势有两点:
第一,网易是少数选择了Impala作为技术栈的企业。工业界大部分人还是用Trino/Presto,但是Cloudera的用户多多少少也被Cloudera给忽悠上了Impala。所以网易接盘Cloudera客户就有别人家没有的优势。
第二,网易开源项目Kyuubi,使得它的发行版可以使用SparkSQL轻易取代HIVESQL,但是保持HIVE的数仓正常运行。具体可以看我早先写的这篇文章:Apache Kyuubi:一个有趣的大数据开源项目。
网易的Hadoop发行版,针对Cloudera的用户转换过来有比较明显的优势。所以短期内冲一下业绩应该没什么问题。
但是一个烂生意,长期来看,不会因为短期的便利,就成为好生意。Hadoop发行商是个烂生意,这一点,不会因为短期的利好而改变。
网易的领导们显然不是傻子,肯定也知道Hadoop发行商不是个好生意。但是他们还是毫不犹豫做了。这里有什么玄机?
我们可以从两件事情结合起来看一下。首先是星环上市了,科创板。星环这个魔改的Hadoop发行版,年年亏钱,但是在自主可控的大时代需求下,依然可以上市圈钱,这显然是个有资本追逐的点,尤其是在自主可控的旗帜下。网易也可以自主可控。
另外一个事情是罗永浩还清了债务。罗永浩还债,并不是像很多人想象的那样卖货赚了6个亿,卖货赚6个亿可太难了。而是因为罗永浩卖货流量好,所以他手里的“交个朋友”的股票就涨价了。他就可以通过这些股权去给债主还债。本质上这就是个资本的游戏。
所以我看大概率网易在这里也是玩的资本的游戏。网易数帆可以剥离出来单独融资,上市。这个时候做Hadoop发行商,可以冲业绩,估值就不一样了。

继续阅读
阅读原文