大约1400多天前,LiveVideoStackCon首次来到深圳。和今年一样,那一年我们也交付了三场大会,只不过今年的第一场北京站其实是2022年延期而来。那一年非常疲惫,也非常幸运。如果不是2019年有过第一次,大概率今年也不会来深圳了,这可能是无法弥补的遗憾。
正如大家感受到的一样,多媒体生态的困局投射在每一名从业者身上。你不可能改变行业的急转直下,正如不可能改变当初千播大战、疫情点燃整个行业一样。你可以随口抱怨几句,继续行动。今天的LiveVideoStackCon正是在这样的局面下交付给大家的,算不上最精彩的一次,但同样是付出了团队心血的,诚意满满。
接下来推荐一些个人认为有独创性的议题,这种从经验和统计学出发筛选的推荐内容,对于单个读者的价值非常不稳定,建议大家直接参考大会官网的讲师信息和议题描述,根据个人需求自行判断。免责声明完成,那我们开始。
主题演讲:
《概述AVM的编码工具》 陈诚/Google
推荐这个话题的理由有二。首先,这是过去四年间唯一一名来自海外(线下参与)的讲师。其次,AVM就是AOMedia的下一代视频编码标准,大概率会在2024年发布。尽管国内多媒体生态依然被ITU和ISO/IEC这些传统老牌组织的标准牢牢统治,但AV1已经在海外成为新的共识,受到空前的关注和应用。随着苹果在AV1/AVM上投入不断加大,也为AV1/AVM成为行业事实标准做好了铺垫。
专场:
《抖音背后的体验增长实战揭秘》
无论在国内还是在全球,字节是少数几个还在增长的重度应用视频的巨头,他们的一举一动当然值得关注,他们的经验也值得参考。本专场会围绕业务增长、体验、成本等关键维度,涉及直播、RTC、网络优化、后端流媒体流水线架构、AIGC等。你可以通过以上海报的二维码报名。
数字化与行业案例:
《突破边界:低延时视频技术的应用场景与挑战》 扶凯/秒点科技 
作为老朋友,扶凯早在2017年就在第一届LiveVideoStackCon做了分享。如今作为一名创业者,他和他的团队正在探索将流媒体技术应用于企业协同、远程导播台、云电脑等SaaS场景,他所面临的各种挑战与思考可能正是你需要的。
降本增效:
《希沃智能语音的低成本落地实践》 李波/希沃 
李波是希沃AI团队的leader,也是智能语音技术的研发主力,目测内容会非常干。
网络优化实践:
《元象RTC云网端协同技术的演进》 涂承杰/元象   
《端到端Low Latency HLS低延时方案》 汪立民/微帧科技
涂承杰和汪立民都是我们非常期待合作的技术专家,而他们也非常低调,能够邀请他们来输出内容实属幸运。涂承杰此前是腾讯、Uber、高通、微软等公司视频编码专家。汪立民可能是我接触了唯二最低调的技术专家(另一位是爱奇艺的王志航),2017年就与他相识,足足用了6年时间邀请他出山。
AI与多媒体:
《芒果TV长视频内容理解检索与应用创新》 郑孝直/芒果TV
芒果TV可能是在国内的同行中拥有最大规模的技术团队,历来重视技术、尊重人才,他们在媒体内容制播、商业化等方面处在领先地位。郑孝直这个话题也是所有长视频平台无法绕过去的挑战,直接关系到降本与效率。
音频新体验:
《座舱音频系统的架构设计和音频体验》 高林/蔚来
音频创新的场景很多,但很难有另外一个场景的潜力超过智能座舱吧。作为造车新势力中的一员,蔚来在智能座舱音频应用的探索和经验应该值得关注。
元宇宙:
《AR协作的思考与实践》 唐荣兴/亮风台
唐荣兴是国内首批AR创业技术人,一走来已经超过了10年。由他来总结AR协作这个话题是非常适合的。唐荣兴经历了传统通信、移动通信、互联网通信的过程,他的这些经历也让他对协作有更深的认识。
QoE与数据驱动:
《水下图像质量评价与画质增强研究》 赵铁松/福州大学
我选择了一个看上去非常冷门的场景——水下图像的质量与增强,但是个人认为这将是一个很有前景的领域,毕竟我们对水下世界的了解还非常有限。
视频编解码与AI:
《面向内容感知的超高清视频实时编解码技术》 孟现东/鹏城实验室 
《JPEG AI图像编码标准进展和应用》 赵寅/华为
《端到端图像视频编码及其标准化》  李礼/中国科学技术大学
这是一个神仙打架的专题,推荐起来非常困难,推荐这三位只是因为议题中的某个细节打动了我,并不代表其他议题不够出色。这三个话题分别从AI端到端视频编码工具与传统编码框架融合的混合编码方式、AI图片端到端编码以及AI编码的标准化三个角度切入,非常有代表性。
多媒体商业探索:
《未来音频》
《AIGC商业化落地》
《音视频通讯协作的过去、现在和未来》
多媒体商业探索是圆桌形式的自由讨论,你可以与嘉宾直接提问互动。设立这个专题的初衷就是为了探索多媒体的未来场景和商业化机会,而这正是我们这个领域十分欠缺的。
AIGC与内容生产:
《美图AI动漫功能的落地探索》 李骈臻/美图
《XMusic:多模态可控的高质量通用作曲框架》  田思达/腾讯
AIGC被认为是可以帮助多媒体领域很好的解决内容生产的瓶颈,可以大规模低成本的输出内容,但当下最大的挑战在于将AIGC应用在具体的商业场景上,这就对技术的鲁棒性、成本提出了更高的要求。以上两个话题都是具体应用场景下的AIGC探索,值得学习。
浏览器:
《WebCodecs 开启 Web 音视频新篇章》 刘俊/哔哩哔哩
WebCodec是浏览器上与流媒体相关的非常重要的能力更新,有望彻底解决编解码这种高算力场景需求,从而替代传统的WebAssembly方案。
IoT与多媒体:
《混合现实影像在音视频会议领域的应用实践》 陈宇/视熙科技
《万物云RTC技术演进的关键时刻》 张自豪/万物云 
《在嵌入式低资源系统中实现高效音视频播放》 张丙儒/RT-Thread
这三个话题都来自创业团队,都在通过自己的方式探索流媒体与IoT结合的创新机会。
另一个足够幸运的是,我们完成了首次音视频技术发展报告发布,这是一份酝酿了5年多的报告,感谢团队的坚持,几百位参与了报告调研的行业用户,几十位技术专家为报告输出了关键信息与专业审校。
在这份《2024音视频技术发展报告》中,主要讨论了2个问题:当下国内的音视频技术生态的现状,以及未来的发展方向。
现在你可以扫码或者点击阅读原文获取这份报告,如果你发现报告中有任何错误或欠妥之处,请联系我们 [email protected]
云相册二维码
最后,预祝大家有两天充实的参会之旅,上面是本次大会的相册地址,扫码可以实时获取大会精彩瞬间。
继续阅读
阅读原文