本文首发微信公众号:飞总聊IT
大语言模型这两年受到热捧,国内也有很多创业公司。李开复也创立了大语言模型创业公司“零一万物”。
零一万物最近发布了开源模型Yi-34B,这个模型在Hugging Face上收到了很多关注。
阿里巴巴的前副总裁贾扬清在创业,他的公司要适配各种大语言模型。他最近指出,有客户找他的公司去适配一家国内的公司的新模型,贾扬清自己的公司太忙了,还没来得及适配。
结果最近有朋友告诉他,这家公司用的是LLaMA的架构,但是为了表示自己的不一样,就把代码里面的名字给改了,然后换了几个变量的名字。

贾扬清表示,有海外工程师直接指出了这一点,还有人在HuggingFace上放了一个把名字改回去的checkpoint,说现在大家可以直接用LLaMA的代码来加载了。
贾扬清表示自己是小公司,得罪不起大佬,所以不敢直接把名字说出来,但是大佬如果用的就是开源的模型架构,那么就还是用原来开源模型的名字吧,免得小公司还要做一堆额外的工作就是为了适配改了名字以后的开源模型。
贾扬清不敢得罪的这个大佬就是李开复。有国外的开发者在Y Combinator网站上发帖指出,李开复旗下的零一万物的开源模型Yi-34B采用的就是LLaMA的架构,只是重命名了两个张量。
这种明明用了对方开源架构却故意改名字的事情,就很恶心了。有人指出,如果零一万物完全使用了Meta的结构,代码库和相关资源,也就必须遵守LLaMA许可协议。不然的话,它们的开源项目就是有问题的。
李开复成立的大模型公司“零一万物”已经完成了一轮融资,由阿里云领头,目前估值10亿美元,是名副其实的独角兽。
零一万物很快就回复了贾扬清的指责。回复中表示:

GPT 是一个业内公认的成熟架构,Llama 在 GPT 上做了总结。零一万物研发大模型的结构设计基于 GPT 成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。
这个回复,很多人并不买账,觉得零一万物模糊了很多东西,就是不肯承认自己套壳了。
在Hugging Face上,零一万物的团队成员Richar Lin回应承认了更改张量名称一事,表示在实验的时候,对代码进行了多次重命名,但是发表模型前忘记改回来了,他同时表示会将张量改回原LLaMA的命名。
至于实际上改名是不是因为做实验改了名字又在发表之前忘记改回来了,这个事情,我只能呵呵了。

一家独角兽公司,由名人李开复创立,居然被另外一个AI名人贾扬清指出套壳了Meta开源的LLaMA,然后又不遵循开源协议,改了改变量名,就说是自己的开源项目。这事情看起挺恶劣的。
而零一万物的回复又不痛不痒的,不愿意承认自己的错误。我本人一直对李开复很尊重,但是李开复旗下零一万物的表现,让我失望了。而李开复本人在事情中到底扮演了什么角色,我们不知道,但是事情发生以后,他个人的态度,也让我觉得,很多东西,盛名之下其实难副。
有句话总结的好:努力,不要脸,努力不要脸。。。
我建了个星球,聚焦讨论职场发展和裁员应对的问题,有兴趣的朋友可以加入,向我提问,和我一起讨论这方面的问题。
继续阅读
阅读原文