本文首发微信公众号:飞总聊IT
自从去年底ChatGPT火起来以后,大模型就热闹起来了。
看到一个非常有意思的统计,到现在为止还不到一年时间,国产大模型就至少有188个了。不信你看下面的统计:
我前段时间写过一篇关于国产数据库的文章:国产数据库们,卷死在沙滩上。。。
国产数据库够卷了吧,前后奋斗有20年不止了吧。大厂小厂创业公司全算上,撑死了也就200-300个国产数据库。
国产大模型真的很厉害,一年就188,再给一年就可以超越国产数据库了。

用两年的时间,走完别人20年的路,真的是很神奇。所以难怪李开复创业的公司被抓包了呢?前段时间阿里前副总裁贾扬清揭发--李开复公司的开源大模型,隐瞒用了Meta的LLaMA
当然,大模型能够这么快发展起来,需要感谢Meta,感谢开源。如果不是Meta开源了大模型的话,那么我估计国内可以搞大模型的也就文心一言,通义千问这些大公司搞出来的了。
之前不是还有某AI小龙公司开发布会,被指出来用文字画图的“自研”大模型,应该就是用了开源的Stable Diffusion嘛。
我们确实生在一个很好的时代,这个时代开源蓬勃发展。
这绝对不是20年前数据库创业的人能够经历和想象的,那个时候,某国产公司,用了PostgreSQL的代码套壳,却到处说是自研的。但是那家公司的开发人员还是有羞耻感的,觉得这样做有愧,所以很多事情就慢慢流出来了。
现在不一样了,开源如此蓬勃发展,用了开源,然后掐头去尾,说是自己的产品,这绝对没毛病。更谈不上羞耻感。要大胆的说出来,自己就是自研,自主可控。
所以,我们一下子就有了那么多大模型,这些大模型里面到底有几个和ChatGPT一样能打的呢?

文心一言已经说了,它们的4.0版本,媲美GPT-4,就是有些人不相信。文心一言应该是自研的吧。虽然说,在文心一言上让它给画一只爱国的猫,会给你画出美国的国旗来。毕竟,这只能说明爱国等于爱美国,不能说明文心一言不是自研的。
那么其他的大模型呢?肯定也都是自研的吧。毕竟,懂的都懂,不自研的大模型就不是好的大模型。

我就非常的好奇,如果我们把大模型都揭开来看看,到底有多少是自研的,自研到了什么程度。
可能很多人还是会困惑,为什么会有那么多的大模型呢?
团购的时候我们经历过百团大战。共享单车的时候我们经历过五颜六色的共享单车。为什么大模型时代,我们就可以不经历百模大战呢?为什么?
继续阅读
阅读原文