「00后狠人计划」持续招募中!自我们发布计划一个月以来,已和数百位伙伴建立了联系。他们中有从 9 岁就开始编程的技术小天才,有 B 站上最早的百大学习 up 主,也有从高中就设计研发测试各类火箭炸药的超级发明家……
当然我们也知道,或许 20 岁的你还没有一个成型的创业想法,因此我们找来了比你年纪稍长几岁的学长学姐,请他们聊聊自己在 20 岁时的困惑与选择。
第三集,我们请到了右脑科技创始人 & CEO 梁健。他生于 1998 年,2021 年在微软实习时提出了 NÜWA 女娲模型,是国内最早一批从事生成式 AI 工作的研究者。在女娲收获了巨大的关注后,梁健也坚定了创业想法,与室友周呈华、史杰一同成立了右脑科技。这一集,梁健讲述了作为一位学生创业者的旅程,与他是如何带领团队「让想象变成具象」。
真格,你的创业第一站!「00 后狠人计划」仍在滚动招募中,欢迎一切有想法的年轻人来投递,无论羽翼是否丰满!
观看视频,了解梁健的故事
2 月 16 日早上醒来,梁健看了眼手机。满屏的消息提醒。微信里、飞书工作群里,甚至很久没有联系的同学也发消息,「Sora 发布了,对你们影响是不是很大?」
作为右脑科技的创始人兼 CEO,梁健前一天睡得很早。他赶紧打开 Sora 官网,技术报告还没有发布。视频里在东京街头漫步的女生,她身边的光影、行人、遮挡,都让他感到「震惊」。
彼时,成立于 2022 年 9 月的右脑科技作为一家专注研发 AI 图像和视频生成的初创公司,已自主研发了百亿级参数量的图像生成模型架构。旗下产品 Vega 上线近一年,用户量达数百万。
出现的时间太早了。他知道 Sora 会降临,但 OpenAI 领先了他的预期整整一年。在技术报告公布前,他甚至怀疑,这是不是纯用生成模型来实现?是不是有新的 3D 技术出现?
随后发布的技术报告证实,Sora 完全基于生成模型。Diffusion、Transformer、对空间和时间的编码都已经存在了一段时间,但 OpenAI 组合了一切。数据、规模、编码,当细节加和在一起,质变就诞生了。
梁健很喜欢这种简单而直接的方式。Sora 为他带来的信息也很清晰——之前还觉得巨头在做的事甚至可以自己做,现在会越来越难。视频生成行业的格局已然发生改变,行业的落地进一步加速。
Sora 的出现催促着右脑科技去思考,如何用现有的技术、甚至是未来的技术去解决用户需求。「反而在思路上帮助我们更坚定地去找场景、去把需求产品化。」
另一位创始人史杰提起《华尔街之狼》——如果我要向你推销一根钢笔,不要说这支钢笔很不错,而要请你帮我在纸上签一个字。
「现在容不得你停下来。」刚开完董事会,又在公司内部开动员会,主题就是如何寻找产品市场契合点(PMF)。采访发生晚上十点的会议室,梁健说,「我不可能现在就躺着回家睡觉了,待会还有事要做。」从 22 年底创业至今,他平均每天要工作到凌晨 12 点才往回走。
01
出北大南门向南步行十分钟,是海淀中关村西区的街心公园「中关村广场公园」。公园是一个四分之一扇形,北端是中关村 SOHO,拥有万花筒般的穹顶。再向南穿过公园,就来到了微软大厦。
在过去的三年里,右脑科技三位创始人,梁健、史杰、周呈华的生活,全然浓缩于这个街心公园四周。
三人相识于北大拐角的一间宿舍,是舍友。2021 年,梁健和周呈华进入北大读研,史杰大他们一届,是院里的学长。
梁健留着柔顺的波浪长发,「就是头发就自然生长,胡子也自然生长」。但除了长得像艺术家,「其实一点都不艺术家」。他执行力强,理性,喜欢学术研究,虽然为公司取名「右脑」,却惯用左脑思维。研一的第二学期,梁健走出北大教室,来到微软自然语言计算组做实习。
周呈华高瘦,语速很快,重庆人。在来到北大读计算机之前,他本科的专业是金融。再往前,他在大一时为了体验生活,在重庆一个楼盘卖过别墅。这两段经历让他知道,金融和销售,「真不喜欢。算了,没必要。」
读研的第一份实习,周呈华在京东金融做开发。在大厂的规章制度下,他觉得自己的性格不太合适,「还是想再看一看」,就来到了微软工程院。
在微软,他再次遇到了梁健。当时,只有主管研究员才有独立办公室,他们俩一人占了一个相邻的会议室包间,自封「实习生主管研究员」。没过多久,梁健把史杰的简历推给了组里的导师,三人在微软碰头了。
那是一段被周呈华称为「美妙」的经历。包间变成了自习室。在完成组内工作之余,全然是兴趣驱动的研究。他从规则驱动的视频生成,转向自学 AI,又在梁健和史杰的影响下,投身了 AIGC。
有时,他们会在靠北的窗边一起打台球。从透明的窗户看过去,梁健也会瞥见对面的中关村 SOHO,「这栋楼怎么这么矮?」
一年后,他们在这栋矮楼的三楼靠南,租下了右脑科技的第一间办公室。他们还在同一家超市买可乐喝,在同一个小窗口买煎饼吃。采访当天,梁健身着一件印着微软 Logo 的黑色 T 恤,「衣服都洗了,我找了半天,结果发现我有十几件这个衣服。」
2021 年 8 月,同在微软实习的他们想,既然都大家都在这附近实习,不然在这附近一起租个房子。他们在离微软大厦步行十分钟的地方租下了一间 40 平米的公寓,只有两个房间。梁健和周呈华住一间,史杰另一间。
三个人晚上下了班,凑在房间里,搬出一张折叠桌。桌子不大,只够面对面放下三台电脑。他们就在这里讨论 AI 技术、讨论研究方向。11 月,梁健在微软主导提出了通用图像视频生成框架 NÜWA 女娲模型。这是国内最早一批的生成式 AI 工作,基于自回归和 Transformer 技术,支持多种模态的图像和视频生成。
他们意识到,AI 能做到这种程度,下一步一定会爆发。「那我们需要做的,就是在这一波浪潮里面,做我们自己能做的事情——那就创业嘛,对吧?」
在这张折叠桌上,三个人开始讨论:要不要创业?什么时间点创业?先从协同软件开始想,以后创业了,要用微信,钉钉,还是飞书?还没有下定创业的决心,飞书群就先建起来了,取名「问天」。在另一个同名文档里,他们又一家一家列出投资机构,比对各家的优势。
他们踩中了时点。工程化的问题,必须有训过模型的实践经验。但在 2021 年,中国能提供 AI 实践经验的地方相对有限——微软、智源、阿里达摩院、字节 AI Lab 等——其中再分出一批来做视觉,人就更少。
在周呈华看来,很多时候决定做某件事情,虽然是唯物主义,「但总有一些细节巧合到让你觉得有一种宿命的存在。像被雷劈中了一样。」
很多投资人问他们,你们为什么要创业?三个人就会反问,你应该问的是为什么不去创业?「那么多巧合都发生在你身上,你就觉得,不干的话一定会亏。」
2022 年 9 月 30 日,右脑科技正式成立。出租屋里的折叠桌成为了他们的第一个工区。设计右脑第一款产品 Vega 时,他们仨就头碰头地在这张桌子上想产品。不会 Figma,就用 PPT 画出了第一版原型图。
有人问过他们,如果你们现在选择创业,目的是什么?三人不约而同地说,现在自己还很年轻,想在 30 岁之前成一件大事。「目标很清晰,那你还等什么呢?」
后来右脑成立,自己的大模型先训出来,第一个 prompt 就是「梅西高举大力神杯」。之前很多模型,梅西出来不像梅西,大力神杯也不像神杯,还有两只手。梁健把图发给朋友,「看,我们成功了。」
02
2023 年 2 月,右脑科技第一款产品 Vega 正式开启内测。
从开发到上线,右脑只有五个人。三个创始人加两个开发,花了两周时间。公众号文章一发,群里「噌噌噌」一直在进人。
一开始,一天能涨一千个用户。「当时就觉得,也不用做增长,做产品怎么这么简单?」还没来得及小小庆祝,他们紧接着就收到了短信,「服务器被 DDoS 攻击」——Vega 崩了。
与黑客的攻防拉锯持续了一整个星期。刚紧急修复完,开发人员在用户群里喊了一声,「我们已经修复了!」,新一波攻击接连而至。团队没有安全经验,就四处去问做安全的朋友,再把安全措施慢慢补进来。「到最后也不知道谁干的。」
紧迫感是具象的。训大模型时,银行账户上的数字,「一下就少了四分之一」。他们开始算,「三个人不要工资的话,一个月能少花多少钱?」那段时间,大家每天都睡在办公室。靠墙的地方没有桌椅,地上摆着一排床垫。凌晨两三点,三个人捂着心脏,说「心脏有点疼」,爬上床垫躺几分钟,再起来接着干。
一周一迭代,对 Vega 来说,每周四都是「疯狂星期四」。为了不影响用户使用,Vega 的上线时间设置在半夜 12 点。一上线,bug 冒出来,团队就又马不停蹄地接着修 bug,总要折腾到大半夜才能停歇。
但持续地抢跑为他们赢得了领先身位。Vega 上线时,国内在视频生成领域的产品几乎是空白。用户一两千地涨。快到一万时,右脑还没有正式的用户数据系统,一堆人就守在数据库面前,盯着屏幕不停地点,点一次,返还一次数据。点了一次,发现九千多,「接近一万了」,再点了一次,到了一万零几。正好一万的图没截下来。
梁健挺开心,他决定涨到十万的时候,「我要发个朋友圈。」等到真涨到十万了,「突然发现好像涨得挺快,我要涨到一百万再发。」
上线不到两个月,Vega 靠着自然增长,用户量正式突破百万。梁健的朋友圈没发出去。「每个阶段,都有很期待的事情,达到之后,又在期待下一件事情。」
一百万用户,没有任何推广。他们试着找了几个 KOL,给了几百块钱,「没什么用」。
后来回想,其中一个关键决策是「野生代言人」。早期用户中,他们发现有几个用户粘性很高,会自发地提出你的一系列缺点,「喷你」,但他又天天在用,还在群里说你的优点。主管运营的史杰想,能不能做一个「野生代言人」活动,让这批用户帮忙在公域,例如小红书和抖音上做宣传。
作为激励,Vega 会提供加速包。但更重要的是,这些用户的的意见会获得创始团队的「倾听」,他们提出的意见都会进入 Vega 的下一版迭代计划。「野生代言人」计划推出后,用户新增以翻倍的速度上涨。
天下武功,唯快不破。三个北大毕业生在风起云涌的 AIGC 江湖里,「快」是他们唯一仰仗的剑法。「你是一直在流血的,所以如果跑的不够快,就会被自己拖死。」
在第一轮融资尚未交割前,因为着急训大模型,三个人分开找朋友和家里借钱,东拼西凑了几十万先投了进去。
租房时,他们也只花了一个晚上。看了五六套房,他们决定租下位于中关村 SOHO 的一间办公室。原因一是「当时挺便宜的」,但更让他们心动的是,进门后发现「所有的东西都是现成的」。打包价两千块钱,他们留下了上一家公司所有的家具。又从楼上另一家倒闭公司淘来了一张大桌子,扛进了会议室。
在招人的思路上,是一定要少,一定要精,「打造一个 10 人左右的特种兵团队」。2023 年 9 月,右脑海外版产品 LensGo 上线,开发周期仅有七天。国庆海外不放假,「我们又不想浪费这十天的时间」,史杰决定,自己国庆不回家了。借来了两个实习生,人力同学转来帮忙做运营,一个还在面试流程中的运营同学,在接到电话的当天就决定回上海收拾行李,坐高铁来北京。十五天内,冷启动目标达成,平均获客成本不到一美元。
融资也要快。2023 年,他们意识到开源的速度越来越迅速,自己在做的产品「相当于在跟整个开源的生态去比拼」。如果连续创业者下场,右脑的优势将不复存在。那么至少要在优势仍然明显的情况下,快速拿到融资。23 年下半年,真格基金投资右脑科技。成立一年的时间里,右脑融了三轮。
产品上线后,公司的重点转向了寻找用户需求。产品上线的那段时间很急,希望能够快速看到 PMF,「没有想清楚产品终局」。从外部看起来,右脑产品迭代的速度好像变慢了。「很多东西也在思考的过程中,没法真的笃定。」
内部迭代不能慢下来。每一天,梁健都要写七八个小时代码,阅读新的论文、技术博客,还要大量找行业内用户聊需求,包括独立动画创作者、独立导演、室内设计师等。史杰则有一张定期联系的名单,在周中就和他们约好时间,周末重点交流。上周末,他约了一位创业的前辈、一个增长大牛、还有一位在做建筑设计师的高中同学。
但与此同时,在 AI 大爆炸的时代,他们意识到自己需要静下心来做一些更长期的思考。「没有(之前)那么慌了,这是一个循序渐进的过程。我们能做到的是,尽可能保证我们在正反馈的路上往前走。」周呈华说。
他提起深度学习里的一个核心算法——梯度下降。「我不知道最优的解法,但只能说在 100 米以内,往这边走是最快的。那我先走一步,看一看。这也是创业的常态。」
「00 后狠人计划」仍在持续招募中

扫描二维码,和我们聊一聊!
欢迎一切有想法的年轻人
无论羽翼是否丰满
监制|Jiafen
编导|Tammy
拍摄|Chushi
剪辑|Matthew
文|Wendi
推荐阅读
继续阅读
阅读原文