2022年4月1日晚,“哥哥”张国荣,带着《热·情》回来了。一切如旧,却又崭新动人。
宝丽金唱片在预告片中提到,这次演唱会的经典重现,是由腾讯顶尖算法团队对尘封了21年的母带进行了“像素级修复”。这个团队,就来自腾讯多媒体实验室。 
腾讯多媒体实验室,专注于多媒体技术及相关领域前沿技术的探索、研发、应用和落地。研究领域及研发方向包含音视频编解码、多媒体数据传输与压缩,智慧融合媒体,互动沉浸式媒体,同时负责国际国内行业标准制定。
实验室负责人刘杉,是世界著名的多媒体技术专家,在多媒体、信号和信息处理等领域有杰出贡献。
以下,让我们走近她的故事。
刘杉博士生活在中国和美国,横跨东八时区和西八时区,工作形式是线下加线上。
采访定在北京时间中午时分,大洋彼岸已是深夜,她准时出现在腾讯会议的线上会议室——感冒未愈的她,刚开完6个小时的连轴会议,讨论“沉浸式媒体”方面的深入算法。“没关系,我们开始就好。”刘杉语气热情,音色和悦,没有透出疲惫或不耐,传达出一种可感知的真诚与感染力,不同于大家对女科学家“冷峻而理性”的固有印象。
刘杉是腾讯多媒体实验室(Tencent Media Lab)的负责人,也是腾讯杰出科学家群体中唯一的女性。这样“双国记”的工作与生活,她已经持续了5年。
1. 一位喜爱音乐的“理工同学”
刘杉出生在一个知识分子家庭,成长所处在的时代大氛围和家庭小环境,让她从小就很热爱科学。从事于大学教授的父母对于女孩子能否学好理工科曾有过些许担忧,而刘杉则用自己优异的成绩打消了父母这份犹疑。
1991年,刘杉以优异的成绩考入大名鼎鼎的清华大学电子工程系——这里拥有“电子科学与技术”、“信息与通信工程”两个一级学科,排名全国并列第一。建系的70年间,培养了20多位“两院”院士,还走出了李健、水木年华等大众非常熟悉的流行音乐人。
“科学研究表明,音乐和数学有很强的关联性,我觉得音乐的音符、音阶是有数学规律的,这也能解释为什么那么多理工科同学喜欢音乐。”刘杉说。
实际上,刘杉自己也是喜爱音乐的“理工同学”之一。她曾在清华大学学生艺术团民乐队担任过二胡手,还跟同学一起写歌,参加清华大学校园歌手大赛。后来在美国南加州大学电气工程系攻读博士期间,还在课余时间里自学了两年钢琴。
正是出于对音乐的热爱,在选择博士研究方向时,刘杉首先选择了与音频相关课题作为研究方向。然而课题研究刚开展不久,因为项目调整,她被导师安排转向视频研究。虽然音频、视频同属于多媒体领域,但在细分领域的跨度实在不小,困难和挑战显而易见,但好奇心强、热爱研究的刘杉,在短暂适应期后,克服了困难与挑战,并且坚持了下来。从图片检索,到视频压缩和处理技术,到网络传输系统,再到VR/XR等更广泛的多媒体技术领域;从前沿技术研究,到产品研发和行业标准制定......一做就是20多年。
“科学研究过程中很少有一帆风顺的,必然会遇上停滞期,会很苦闷,对自己产生怀疑,这时候能坚持一下,冲出来,回头看,就会有一种豁然开朗的感觉。”刘杉说。
后来她继续在南加州大学读博,做博士论文期间,有次被导师严厉批评,一度被打击到开始怀疑自己是不是不适合读博士、不适合做研究,她想,要不就先参加工作?——千禧年初,美国经济一片繁荣,拿着南加州大学的工学硕士学位,找个好工作不是问题。
此时,她的导师郭宗杰(Jay Kuo)教授及时给予了她诸多帮助和鼓励。郭教授现任南加州大学多媒体通信实验室主任,亦是在多媒体计算技术、系统和应用领域中全球有名望的技术领导者、华人科学家,在视频压缩、多媒体信号处理等领域做出过开创性的贡献,他作为全球通用的视频质量评价模型VMAF的主创发明人之一获得第72届工程艾美奖。
“郭老师专门找到我,先是安慰我,又摆事实讲道理鼓励我,讲了很多他认为我适合做研究的理由,分析我遇到的瓶颈,帮我沉下心来在科研的道路上走下去,”刘杉说,“就这样,我留下来继续研究,渐入佳境,顺利完成了博士论文。”
受父母的影响,刘杉给自己最初的职业规划,是打算博士毕业去大学教书,“没想到还没开始找工作,一家国际知名企业看到了我在博士期间的一篇论文,邀请我去加入他们的团队”。就这样,刘杉开启了自己在多媒体领域的职业生涯,先后在索尼、三菱电子、联发科等多家企业担任高级技术和管理职务。从业20年,她深耕多媒体数据压缩、传输协议和系统、无线网络、loT等行业标准领域,多次担任国际标准专家小组主席和联席主席,并受邀在国际顶级学术会议做主题演讲,她是超过100篇国际知名学术期刊和会议论文的作者、发表一部专著,是超过500个全球专利的发明人。她也是两代视频编解码国际标准的联合主编。作为主要贡献人的项目团体荣获Lumiere奖(2022)。
刘杉对于研究的热情没有随着阅历和资历的增长而下降,即便在周末或短暂的休息时间,她都用来阅读手头积累的论文和技术文章,做一些自我补充和学习。她坦言,导师对于科研的态度一直激励和鞭策着自己:“郭老师到60岁的时候还自己去钻研算法,写了一篇非常有分量的论文——而他是论文的唯一的作者。”所以,“我会常常督促自己,有意识地精进自己的技术”。
 2. 一次跨越大洋的奔赴
来腾讯之前,久居国外的她对这家中国的互联网公司了解并不多,甚至没用过QQ。她对腾讯的第一印象,来自于在腾讯硅谷办公室和腾讯高级执行副总裁汤道生的一次面对面交流,“通过和Dowson聊天,我看到了他身上的‘腾讯气质’——低调务实、勤奋谦虚、接纳包容,这和我本人的性格蛮相符的”。
初步的了解之后,腾讯业务涉足的广度、业务场景的丰富程度吸引了刘杉。腾讯云、腾讯会议、腾讯影业、腾讯视频、腾讯音乐、腾讯游戏、腾讯文旅、QQ以及企鹅FM……十几条业务线、上百种产品,像一片肥沃的土壤,可以将她多年的专业技能和技术积累落地实践,同时催生出新的技术方向。
而最打动刘杉的是,是当时Dowson谈到科研的时间问题,他说,“请你们多给公司一些耐心”。
“之前我听到的话大多是相反的,毕竟现在整个社会节奏快,企业有时候也难免希望尽快看到成果。但是技术确实是需要积累的,不管是社会还是企业内部,要给予技术创新多些时间,让科研人员在技术上更多些沉淀。”刘杉说。
在2017年底,没有反复思量和纠结,性格果决的刘杉放弃了在美国稳定的生活与工作,受邀加入腾讯,开启了“中美两头跑”的生活。
那时腾讯多媒体实验室还叫做“音视频实验室”,使用的视频引擎主要服务于QQ实时音视频的应用,当时使用的可伸缩性编码优化、针对屏幕分享的编码优化等一些技术都没有太多的技术积累,刘杉要做的第一件事,就是打造一个真正的多媒体实验室和技术研究团队。
与以往服务过的公司相比,腾讯是刘杉入职的第一家真正意义上的互联网公司,她很快就感受到了这个公司的年轻化,“(跟之前的公司比)腾讯给我的感觉更加地朝气蓬勃,在工作中,常有一种热火朝天的感觉”。其中一个让她感叹的细节是,之前在其他公司工作,大部分交流是使用电子邮件,到了腾讯之后,工作沟通则主要通过微信,相比而言,无论是上下级还是部门同事之间,沟通变得更快速、更高效、更灵活。“腾讯工作节奏非常快、迭代非常快,有了一些新的概念,就像小步快跑,转动非常迅速,与我之前工作的公司不同”。
刘杉很快适应并喜欢上了这种“热火朝天”的感觉。2018年4月,在美国圣地亚哥举行的MPEG 122会议上,刚刚整合后的腾讯多媒体实验室提交了10个高质量的标准提案,并在CFP质量评测中超过很多国际知名公司和研究机构,立时获得了业界的高度关注——彼时,距离刘杉加入腾讯还不到半年,在提案截稿时,团队总共只有6名成员。
“之前中国互联网公司在国际标准舞台上是没有声音和身影的,我们非常迅速地就把它做到了国际领先。在很短的时间里,无论你是在国际上还是在国内各个场合,只要在多媒体领域,‘腾讯多媒体实验室’或者‘Tencent Media Lab’这个品牌已被人熟知;我们团队在跟业内头部公司站一起时,也做到了‘比肩交流’的状态,这是值得骄傲的事情。”刘杉说。
不止是中国互联网企业的迅速崛起,整个中国的发展趋势都是让人非常激动和向往。“不光是我,包括后来我们在美国招的一些华人同事,大家长期在海外学习工作,都非常希望能为祖国企业的发展贡献一份力量的。这不是喊口号,大家真真正正都是这么想的”。
到腾讯之后,为了照顾到深圳和美国两地团队的工作时间,除去一些周末,刘杉几乎没休过假:“我的工作比较特别,圣诞节美国团队休假,但国内并不休假;春节时国内团队休假,美国不休假,所以我基本上是处于一个全年无休的状态。”新加入腾讯多媒体实验室的同事们也常常感慨说,“杉姐几乎24小时在线”。
来到腾讯后的第一个圣诞节、元旦、春节,她没有休息,因为要赶着去“做标准”;第二个圣诞节和元旦也没有休假,因为当时在赶一个“无线投屏”的项目——也就是后来“腾讯会议”这个产品的前身。
“当时有一个技术点要攻关,中美两地的工程师‘两班倒’,国内的工程师晚上下班时,正好美国同事起床了,把代码交接一下,然后美国这边干一天,下班的时候再交接给国内的同事,效率倒是蛮高的。”刘杉笑着说。
2019年12月底,“腾讯会议”上线。2020年疫情期间,这款产品向用户免费开放了300人的会议协同能力,还紧急研发上线了“国际版”,不到3个月,产品日活就超过千万。“腾讯会议”集合了腾讯在AI、云计算、安全等方面的能力,进行了突破创新,让用户足不出户就能实现高效沟通与专业协同,这背后也包含了刘杉带领的腾讯多媒体实验室的全力付出。
“没有哪一个项目是容易的,所有的项目都是大家一起打拼来的,回忆起来,每一个瞬间都清晰可见。”刘杉感叹。
3. 一种类似“雪花”的多媒体生态
2018年,刘杉荣获“亚太信号与信息处理协会工业领袖”的桂冠,并于2020年荣登福布斯中国科技女性榜。2021年11月,国际电气和电子工程师协会(IEEE)公布了“2022年新晋会士”名单,刘杉和18位清华校友一同当选。
金光闪闪的荣誉下,刘杉仍然没有忘记初心。
2021年10月,刘杉开启了自己在腾讯工作的第五个年头。24日“程序员节”,刘杉在团队内部举办了一个打字比赛,一段中文、一段英文、加一段C++代码,看谁敲得快。
“这算是我自己的一个小创意。一个好的程序员,他的打字速度一定不会慢。”刘杉从内心喜欢、认同腾讯的“工程师文化传统”。
目前,腾讯多媒体实验室的成员中既有国内有冲劲的年轻人,又有硅谷资历很深的科研大腕,同事们交融共生,组成了一支国际化的团队。刘杉说:“我们两地异国办公,确实不如同一间办公室那么方便,但这些不同的文化背景和工作方式,在交流融合中,也相互会给对方带来很多新的启发。”
身为实验室的带头人,刘杉以自己多年来对待科学的精神,影响着团队里的每个人。面对年轻的团队成员,她愿意与他们分享经验:“我经常会去想,我20多岁的时候遇到了怎样的帮助,同样也要尽可能地将帮助给予年轻人。”
在刘杉看来,腾讯对有潜力的年轻人才,培养力度很大,激励也更强,可以帮助他们迅速成长。而她则愿意自己承担风险,把机会给那些有潜力的年轻人:“小孩子学走路的时候,最容易的是你一直牵着他走,最难的是放开手、一直要弯着腰跟着他,在他要跌倒的时候你拉他一把,对不对?对团队里的年轻人我也是这样子,虽然是自己会辛苦一点,但对他们是好的。”
在为团队招聘的人才的时候,除了一些基本技能、职业素质、过往经验,刘杉刚更关注的是应聘者有没有热情:“我一直坚信,长长久久可以激励你全身心投入工作的,一定是你的热情。”正如她自己,把所有的热情用在工作中,不功利、不挑活儿,“无论是什么项目,只要到我手上,我不允许自己把一个不太好的东西交出去,我会非常认真地做到自己能做到的最好。”
“我们给很多业务部门支持,像‘云基础产品’,包括腾讯云音视频、存储云、中台云,腾讯文旅、腾讯教育,还有QQ、腾讯云、Start云游戏、全民K歌、微视、腾讯视频、腾讯影业,多的我都数不清楚了,跟那么多部门交流以后,我收获了广泛的友谊,各位同事给予我们的支持和帮助,是非常大的一笔财富。”刘杉说道。
刘杉于2018年提出“未来多媒体将更沉浸更互动”,并带领腾讯多媒体实验室打造多项核心技术。
近年来,诸如数字故宫展、“云共赏”故宫冬日、“云”游国家公园、一部手机游云南、迪拜世博会“沉浸式数字水墨画”、故宫老照片修复、1949年上海国庆大游行老片修复等话题频频出圈,让大众津津乐道,背后都是腾讯多媒体实验室领先的“黑科技”。
“作为管理者,要看的更宽更广,抓大放小,熟悉公司的流程规范,对团队成员保持人文关怀;而科学家或者研究员看的是专注,深入研究方向,关注细节。这两个角色并不排斥,相互之间还有帮助,当然就是要多花一些时间。” 刘杉强调说,“但是无论多忙,我都会保持有一两个的技术方向,是自己深入和一线工程师一起去探索研究算法的。既然是技术管理者,更不能跟技术脱节的,一定要持续的学习。”
在多媒体技术领域,“沉浸式媒体技术”和“深度学习”毫无疑问是未来方向,尤其是前者,通过实现物理世界和虚拟世界的融合,被认为是改变未来生活和工作方式的颠覆性趋势之一。刘杉自进入腾讯就开始在这两个方向布局,她直接管理并参与团队的研究,带领手下的工程师们搭建了VR、AR、点云等相关系统。
作为高阶技术管理领域少见的女性面孔,刘杉希望更多有实力的女性被看见:“无论是我在腾讯的团队,还是之前别的公司的团队,我的团队里都是女工程师或者研究员占比例比较高的地方。我有一个原则,会给女性机会,但不会给她们特权。我要让有能力的、具备资格的女性能够更多被行业看到、被挖掘。
她引用了苹果创始人乔布斯的比喻来阐释自己的专业和职业:“在我前半个职业生涯中,其实画了很多点。现在来到腾讯,广阔的业务场景让我有机会把那些针对不同业务的点连成不同的线。”
刘杉解释说,这些点可以理解成一些技术元素,通过具体业务把其中相关联的点连成一条线;之后把一些相关业务打通,可以更好地把这些线段再连接起来,形成一个“六边形”或“雪花”,这就是一种多媒体生态。
“未来希望可以有机会,让我把这些线画成一幅画。” 
继续阅读
阅读原文