关注飞总聊IT,了解IT行业的方方面面。
最近外媒一篇文章写了字节跳动在干的事情:偷偷利用OpenAI的技术,来构建自己的大语言模型。
具体来说,就是字节跳动在开发自己大语言模型的时候通过调用OpenAI的API来获取OpenAI的输入输出数据。
然后字节跳动再把获得的数据,洗白了喂给自己的大语言模型。
外媒报道说,该外媒记者看到了字节跳动内部的飞书文件显示,字节跳动开发大语言模型的每个阶段,都通过调用OpenAI的API来训练自己的模型,和对自己的模型进行评测。
而接受外媒采访的字节跳动员工也给记者展示了内部员工的飞书平台上的一些对话,这些对话的内容是如何通过数据脱敏来洗白字节跳动窃取OpenAI的数据训练自己模型的事实。
这篇文章报道之后,OpenAI看到了。然后,OpenAI就把字节跳动的账号给封了。
OpenAI的发言人Niko Felix发表了回复,回复表示,所有的API用户都必须遵循我们的使用政策,以确保我们的技术被正当使用。虽然字节跳动使用我们的API不多,我们还是停了他们的账号,同时我们会进一步调查。如果我们发现字节跳动的使用没有遵循这些政策,我们会要求字节跳动做出必要的改变,或者完全终止其账号。
据说,字节跳动直接使用OpenAI这种事情做得并不是特别的多,更多的,字节跳动是通过微软的Azure平台的AI服务来调用OpenAI的API。
所以,写了这篇报道的记者也联系了微软,记者问微软,是不是也会和OpenAI一样,对字节跳动采取行动。
这个事情被外媒报道出来,如果这一切都是真的,我是非常失望的。
我一直都觉得字节跳动这个公司很牛很厉害。厉害的不仅仅是在国内互联网生态圈里所向披靡,更重要的是极少数可以在国际市场上打过国际巨头,比如Facebook,灰头土脸的公司。
中国牛逼的互联网公司看起来很多,但是说句不客气的,大部分只能在窝里横,没办法杀出去赚全世界的钱。
不是它们不想,是它们尝试了,但是并不是很成功。而字节跳动就是这么个例外。
所以这件事情如果是真的,我对字节跳动的观感就很不一样了。

OpenAI的服务条款里面写得很清楚,OpenAI的模型输出结果,不能够用于开发任何和OpenAI的产品和服务竞争的AI模型。

但是按照外媒这篇报道,字节跳动明明同意了这样的服务条款,却还是偷偷摸摸用OpenAI来训练自己的大语言模型。不但还训练自己的大语言模型,内部还讨论怎么洗白自己偷偷使用OpenAI的数据的事情。
所以,从披露的信息上看,字节跳动的员工知道自己在干什么,知道自己违反了OpenAI的使用协议,知道这么做事不对的,知道这件事情被发现了会很麻烦,还主动想办法去掩盖。
如果外媒披露的事情是真的,我只能说,字节跳动,我对你很失望。
当然,也许外媒披露的是假的。字节跳动确实是用了OpenAI的API,但是并不是为了获取信息训练自己的大模型。
要是字节跳动被冤枉了,我希望字节跳动赶紧出来说一声,把被冤枉的事说清楚。
毕竟这种事情,时间久了,又一声不吭,恐怕不是什么好兆头。
我建了个星球,聚焦讨论职场发展和裁员应对的问题,有兴趣的朋友可以加入,向我提问,和我一起讨论这方面的问题。
继续阅读
阅读原文