仅有四人的初创公司,已经融资5500万美元,投资者名单几乎集齐了硅谷的半壁江山,半年用户超50万……
这几天,这家名为Pika的AI公司频繁刷爆网络,而更为人津津乐道的是,公司的创始人郭文景(Demi Guo)的超级学霸背景——
郭文景曾就读于杭州二中,高中毕业后被哈佛大学录取;从哈佛大学本科毕业后,她进入了斯坦福大学攻读人工智能专业博士,而在今年,她从斯坦福大学退学,开始了创业之路!
Pika是由郭文景(Demi Guo)和联合创始人兼CTO Chenlin Meng,共同创立的,他们都是斯坦福大学AI Lab博士生生
公司目前已经获得了5500万美元融资(估值近2亿美元),几乎所有AI领域的知名公司都参与了此轮融资,名单包括但不限于——
前Github CEO Nat Friedman、Quora创始人Adam D'Angelo、OpenAI创始成员Karpathy、Perplexity CEO等等,堪称是集齐了硅谷的半壁江山。
Pika CEO Demi Guo(左)从小喜欢诗歌和创意写作,联合创始人兼首席技术官Chenlin Meng(右)希望成为一名动画师
 天才少女 
2015年,郭文景就被报道过。当时就读于杭州二中的她,是
浙江第一个被哈佛本科提前录取的学生

据悉,郭文景的母亲是MIT毕业的高材生,而父亲则是上市公司信雅达科技实控人郭华强。
信雅达成立于1996年,总部位于杭州滨江,是浙江首家在国内主板上市的软件公司。
郭文景被哈佛提前录取的背后,少不了自身丰富的履历:
高一时就获得了全国青少年信息学奥林匹克联赛(浙江省赛区)一等奖
曾受麻省理工邀请参加比赛,获得北美编程邀请赛第二名,超过了绝大多数来自哈佛、斯坦福、卡内基梅隆的大学代表队
2014年、2015年连续两年参加美国国家信息学奥林匹克竞赛,都夺得冠军,其中2014年还获得了唯一的满分
她参加过中国和美国的数学竞赛,在美国数学奥林匹克夏令营中获得了最高分
在高中三年,郭文景尝试了各种不同的有意义的事情。
比如学帆船,学滑雪,学救生员,参加二中的辩论社,去上海参加全英文的辩论赛;喜欢研究社会问题,积极参加各种夏令营,比如“哈佛校园行”。
而哈佛大学本科校友面试官、哈佛大学中国秘书长汤玫婕面试了郭文景,对她赞不绝口。
我在中国区面试6年,她是最优秀的学生之一。她的计算机水平,放在美国同年龄的女程序员中,也是最顶尖的。她在美国大学预科考试中5门满分,英语非常流利,颜值还高,简直是近乎完美。”
 退学斯坦福,成为CEO 
Pika成立于今年4月。创始人郭文景和联合创始人兼CTO Chenlin Meng,都是斯坦福大学AI Lab博士生一位专注于NLP(自然语言处理)和图形学,另一位主攻计算机视觉方向(2020年在斯坦福大学获得数学本科学位),都有生成式AI的学术经历。
郭文景曾透露公司还有一位创始人Karli Chen,“他是我的高中同学,高中信息竞赛获得过国家前十二名,是物理竞赛国际集训队成员,他主要做engineering方面的工作。”如此说来,Pika四人的创业团队,有两人来自杭二。
郭文景在大二间隔年期间,成为Meta AI Research的全职员工,又先后在微软、谷歌大脑(Google Brain)、Epic Games等公司和团队实习。进入斯坦佛大学读博前,她已在哈佛大学取得计算机硕士和数学本科学位。
根据福布斯的报道,去年冬天,郭文景和同几位斯坦福的计算机博士同学一起,打算利用寒假的时间,用生成式AI制作一部电影。

当时,估值已达5亿美元的初创公司Runway,举办了首届AI电影节,奖金高达10000美元。而他们对获奖很有信心。
出乎意料的是,郭文景团队的作品并没有入选。他们的团队技术含量很高,但制作电影的过程并不顺利。
虽然当时AI技术有了许多突破,但将它们应用于视频制作的过程十分繁琐 。即便团队在Gen-2和Adobe Photoshop上投入了大量的时间,效果却并不理想。
最终,Runway的大奖颁发给了专业的创意团队。这让郭文景很沮丧。
今年四月,郭文景和Chenlin Meng从斯坦福辍学,创办了Pika,目的是构建更易使用的的AI视频生成工具。
Pika成立后,到现在为止已经有了50万用户,他们每周都会制作数百万个视频。
这种爆炸式增长,引起了硅谷投资人的兴趣,让Pika在三轮融资中筹集到了5500万美元
前两轮融资由前 GitHub 首席执行官CEO Nat Friedman领投,而最新一轮的3500万美元A轮融资由Lightspeed Venture Partners领投。
随着新一轮资金的到位,郭计划在明年将Pika的团队扩展到大约20人,大部分是工程师和研究人员。
Friedman表示,自己对Pika团队使用单GPU就制作出的初期demo,印象非常深刻。
Friedman与投资人Daniel Gross共同拥有一个包含2500多个GPU的超级计算集群,名为Andromeda(仙女座)。他们投资的初创公司,都会得到这个资源的支持。
得到仙女座超算集群的助力,Pika的AI视频模型飞速地进步。
 电影质感,动画级特效,Pika 1.0效果炸裂 
大佬们的天使投资只是可能成功的背书,而真正引起全网轰动的,还是它官方放出的效果视频:
一句话,「elon musk in a space suit,3d animation」,马斯克瞬间进入二次元。
炸裂的是,3D动画版的马老板不但神形兼备,而且背景和动作都非常合理连贯,面部一致性也惊人的完美!
对比Gen-2和Pika Labs之前的视频效果,Pika 1.0简直不是一个时代的产品。
真·每个人都能成为自己的视频导演。
观众也许还没从3D马斯克惊艳的效果中回过神来,下一段视频中官方马上秀出了Pika 1.0生成其他风格的视频效果。
从普通的2D动画,到实拍感十足的电影场景,生成的视频呈现出了完美的光影,精致的细节,多样化的镜头控制。
不知道传统电影人看到这里是什么心情。
而真正引发全网欢呼的,是Pika Labs 1.0能够支持对于视频实时编辑和修改。
这些连AI生图领域都才刚刚获得的能力,Pika Labs就能把它们扩展到AI视频中来。
可见他们团队的技术和工程能力真是强得的令人发指。
类似于Midjourney对于图片的「外画」功能,Pika 1.0可以根据已有的素材直接扩展视频,生成不同高宽比的内容。
更为夸张的是,Pika 1.0可以直接在视频中添加想要的素材。
只要用鼠标框一下,输入「一副酷酷的太阳镜」,马上就能给视频中的狒狒精确地带上墨镜,和原视频完美契合。
而对于视频中人物的着装,也只要简单框一个范围,文字输入想要的效果,就能一键换装。
这简直就是魔法!
支持三种模态的提示输入,让Pika Labs 1.0直接「对齐」了runway家族的几乎所有的功能。
文生视频,所有人物,动物的面部表情都非常完美,加上好莱坞动画级别的细节和光影效果,很难想象这个公司成立仅仅半年。
图片配合提示词生成动画,图片为第一帧,文字控制动画变化效果和镜头。
而根据用户提供的视频素材,配合提示词来制作不同风格的动画,更是手到擒来。
从像素风到到黑白幻灯片效果,演示出的5种风格转化,几乎涵盖了现有电影和动画大部分风格。
总结一下,全新的模型Pika 1.0的新功能包括:
- 文本生成视频/图像生成视频:输入几行文本或上传图像,就可以通过AI创建简短、高质量的视频。
- 视频-视频不同风格转换:将现有视频转换为不同的风格,包括不同的角色和对象,同时保持视频的结构。
- 扩展(expand):扩展视频的画布或宽高比。将视频从TikTok 9:16格式更改为宽屏16:9格式,AI模型将预测超出原始视频边界的内容。
- 更改:使用 AI 编辑视频内容,比如更换衣服、添加另一个角色、更改环境或添加道具。
- 扩展(Extend):使用 AI 扩展现有视频剪辑的长度。
- 全新Web界面:Pika 将在https://pika.art的Discord和Web(移动和桌面)上提供。
从现在Pika Labs 1.0能实现的功能来看,两位创始人说他们因为觉得Runway不好用才来创业,看来是一点都不夸张。
他们几乎是在
6个月的时间里做出了Runway家族现有的所有功能
,还针对Runway产品中现有的几大短板做了全面的升级。

精准的语义理解,能准确生成神形兼备的马斯克。
几乎完美的人物面部一致性,让动画中人物的脸部特征不会发生畸变。
准确的提示词编辑能力,能让用户自由添加和修改视频中的各种元素。
周二,Pika把这一体验带到了网页上,面向更广泛的主流群体,让他们可以在编辑视频、自定义物体。
这里还有一段,Pika创意总监前几天放出的,用Pika文本转视频AI功能制作的「3D动画预告片」,效果萌到爆,供大家欣赏。
注:本文综合网络报道
继续阅读
阅读原文