关注飞总聊IT,了解IT行业的方方面面。
这两天有件大事。
Databricks开源了它家的大模型DBRX。这是一款有1320亿参数的混合专家模型。
根据公布的信息,DBRX在语言理解,编程,数学和逻辑等很多多方面都轻松击败了目前的开源大模型,比如Meta的LLama-2和马斯克开源的Grok-1。
另外据说Databricks也能够beat GPT 3.5。上次我听说beat GPT 3.5还是从李彦宏嘴里说出来的。
此外DBRX据说推理速度很快。总之很多人都在讨论DBRX。
这个大模型是Databricks收购的团队MosaicML团队训练出来的,训练这个模型消耗了3000多块H100,花费了大概1000万美元,训练时间3个月。

那么问题来了,Databricks这次公布开源大模型到底是为了什么,这对Databricks公司的商业,估值,以及上市等方面有什么影响。
下面飞总聊聊自己的看法。
继续阅读
阅读原文