一个令人兴奋的机会正在到来,移动互联网十年发展,即将迎来下一波升级,我们称之为全真互联网。
2020 年 12 月,马化腾在腾讯年度特刊《三观》中首次提出了「全真互联网」概念,意味着随着技术不断成熟和落地,互联网不再只是虚拟世界的连接,将更加全面、更加真实地与现实相融合。
就在这近一年时间里,我们能强烈感受到全真互联网的「向实」进程正被快速推动,新技术和实体产业结合变得深入,尤其是作为新型基础设施之一的音视频,此前已在社交娱乐、在线教育、互动电商等热门领域得到广泛应用,疫情期间因众多线下业务往线上迁移,进而又快速渗透到了金融、IoT、医疗等更多领域,覆盖了 VR 看房、云展会、云文创等垂直场景,呈现出一种爆发式扩增状态。
这在我国尤为突出,据 IDC 8 月发布的《中国视频云市场跟踪》报告,中国视频云解决方案市场保持高速增长,2020 年下半年同比增长达到 75% 以上,放眼全球也「最为亮眼」——而在众多云厂商中,腾讯云连续三次排名第一。
加速的领跑者
作为领跑者,腾讯云仍在奋力狂奔,敏锐捕捉着技术发展趋势,并快速做出前瞻性的布局。
11 月 4 日召开的 2021 腾讯数字生态大会 Techo Day 上,继 5 月推出三合一 RT-ONE™ 音视频通信网络后,腾讯云音视频进行了应用整合,再次重磅上线「腾讯云视立方」音视频终端引擎 RT-Cube™,助力开发者一键获取众多腾讯云音视频能力,更为便捷地打造相关应用。
腾讯云副总裁李郁韬发布「腾讯云视立方」音视频终端引擎
其中三合一 RT-ONE™ 指的是 TRTC + IM + CDN,即融合 TRTC 实时音视频通信网络、IM 即时通信网络与 CDN 流媒体分发网络,以提升海量调度、就近接入、传输优化效率,用高质量、低成本、快速便捷的接入方式满足开发者需求。
而「腾讯云视立方」让开发者能够一站式接入 SDK,集成了视频采集/推流、移动直播、互动直播、短视频编辑、视频通话、即时通信、美颜动效等多套 SDK,并提供 iOS、Android 原生以及 Web 端、小程序、Flutter、Electron、ReactNative 等跨平台多端接入。可通过授权解锁所有内容,显著节省集成的时间。
部分「腾讯云视立方」中包含的 SDK
这两套产品的接连发布,意味着腾讯云音视频将构建起业界最完整的音视频通信 PaaS 产品家族,在「云 + 端」的产品体系上,把移动直播、短视频、快直播、IM、小程序插件等 SDK 终端产品一次性提供给到开发者。
举个直观的例子,往常开发者要打造直播间,会首选移动直播 SDK,后期新增「连麦」的需求后,又不得不添加支持多人互动的 SDK,再有录制回放等别的需求也是同理,这个渐进式过程非常繁复。如果改用「腾讯云视立方」,就能一次性整合所有 SDK 接口,同时利用预设的解决方案,既拥有了高质量的视频云服务,又极大地减轻开发者的接入门槛,从而提高生产力。
「腾讯云视立方」特性
通信、社交视频化正成为常态,「腾讯云视立方」便是顺应时代发展的必需品,是构建「全真互联网」基础中的基础。
从去年快速推出支持 300 百方通话的腾讯会议新版;到如今在线上能开支持 100 万人同时在线的超大规模发布会;假以时日新技术和实体产业结合变得深入,人们还能配合全息投影进行面对面分享,可见真实且沉浸的体验已成为市场迫切需求。
随着人工智能、边缘计算的发展以及 5G 的大规模普及,音视频更广阔的应用场景和商业空间将被进一步激活,把腾讯云从 QQ 时代以来的技术积累和优化方案共享给开发者,开发者将精力集中在创新而不是常规搭建上,双方共同加快数实融合的效率,从而带给用户全方位、多模态的新体验。
创新与进化
今年 8 月,英伟达公开 GTC 发布会的幕后纪录片,展示了技术人员制作现场各种 3D 仿真特效以及对厨房进行建模的过程,并揭示了发布会视频里最大的彩蛋——创始人黄仁勋出现的片段内有 14 秒为合成的「数字人」,由专业演员学习模仿黄仁勋的肢体语言,再进行长达 8 小时的动作捕捉完成。
为了这场发布会,英伟达团队做出了 21 个版本的黄仁勋「数字人」
现阶段来看,这还是一件费时费力成本高昂的事情,但腾讯云副总裁李郁韬表示,「未来我们线上化的生活可能会存在越来越多这样的『数字人』、虚拟的场景和交互,会跟我们的现实世界存在一个融合到真假难辨的程度。」
不仅是人,把越来越多的线下场景,通过数字化的建模、音视频处理的技术还原到线上,依托于如今云计算丰富的算力,以及实时的音视频编解码和串流的传输技术,将现实世界还原后的虚拟世界,通过音视频的方式,以沉浸式的体验呈现在用户的面前,这也是腾讯云音视频团队目前在做的事。
相关案例不少,微信小程序「云上南头古城」就做了一个旅游场景示范。腾讯云团队通过游戏建模技术,把深圳的历史文化景点南头古城进行了 1:1 还原,转变成了一个线上可以体验的沉浸式的视频场景,再通过云游戏的技术搬到了小程序上,让用户能够自行规划路线,体验古迹风情。
在「云上南头古城」小程序旅游
在微信小程序「2021 腾讯数字生态大会」的「云展厅」中,用户同样能不受时间地点限制,自由参观虚拟展厅,通过图文、音频、视频了解展品,用一种类似游戏的新模式获得新体验。仅仅是腾讯数字生态大会两日,「云展厅」内已经有超过 10 万分钟的体验时长,相当于一个人在线下展厅连续待了 70 多天。
在「2021 腾讯数字生态大会」小程序逛展
医疗场景下,腾讯云与西门子医疗合作,打造了业内首个与私有化部署流畅程度相当的「云化」医疗影像工作站,利用实时图像渲染、显卡虚拟化、实时音视频交互等技术,「云化」了医疗影像软件,医生只需通过给定的接口便能直接访问软件,上传或者导入已存储在云端的数据,方便流畅地完成诊断工作。用更低的成本带来先进的诊疗和检查手段,这对于中小医院和社区诊所来说尤其利好。
云环境的影像处理软件演示
「云考古」方面也有突破,与央视频合作的云上三星堆考古挖掘现场十分具有代表性。打开「我来找国宝」活动页面,用户可以进入数字化还原的三星堆挖掘现场,转动屏幕摇杆模拟游览,寻找青铜神树、扭头跪坐人像、戴金面罩、铜鸡陶猪、神树纹玉琮、朱砂彩绘觚型尊等古物。活动仅上线两天,参与玩家总在线分钟数便破万,人均体验停留时间达到了 3 分钟以上。
在「我来找国宝」网页云考古三星堆
实体产业与新技术的结合日益紧密,腾讯云音视频在大会上还发布了与三一智矿合作的 5G 远程操控解决方案,即在矿山、港口等艰苦工作环境中,实现对工业设备的远程实时操纵,把传统安防监控摄像头 250-600 毫秒长时延传回视频的问题化解,为车辆设备自动驾驶或人为干预场景解决隐患,提高生产效率和安全性。
此外,与飞虎互动合作线上投资讲解、基金销售业务,与贝壳如视合作的 VR 看房……得益于腾讯云音视频团队坚实的技术积累和多项能力支持,传统行业被「云化」的革新案例比比皆是,众所周知的娱乐社交情景更是不必多说。
在贝壳通过如视 VR 看房
当然,无论场景如何,所有开发者主要考量的内容都是一致的:时延、成本、品质。在合唱场景下,TRTC 端到端延时最低能缩短至 65 毫秒,在国内处于明显领先水平,对不敏感的用户来说几乎感受不到延迟。
以开发一款多人 K 歌 aPaaS 产品为例,接入「腾讯云视立方」后,整个应用的功能满足度可以达到 90% 以上,既能轻松接入播放组件、歌词组件、点歌组件、麦位管理,满足双声道立体声变声、混响、3D 语音等特殊要求,还不必担心曲库和音乐版权问题。
事实上,65 毫秒都只是保守估计。据了解,腾讯云音视频团队曾在武汉发布的腾讯云咖方案中做过测试,网吧场景下通过边缘计算 + TRTC 已经可以将时延控制在 20 毫秒内,和本地机器对比没有太大差别,当跨过 10 毫秒的分界线,再结合 5G 网络支撑,也许就真正迎来了「全真互联网」。
「腾讯云咖」解决方案发布现场
值得一提的是,当概述腾讯云音视频主要在做的事时,李郁韬特别用了「简化外功」与「修炼内功」两个词,「腾讯云视立方」的发布对应了前者,将复杂的产品变得简洁,实现「开箱即用」;后者指的是在视频编码领域与多个 AI 实验室的投入。
不久前,腾讯的视频编解码技术斩获了 2021 年 MSU 世界视频编码器大赛中多个冠军,据称相同画质下可降低 45% 以上带宽/存储成本;在全息技术、虚拟人、机器人、实时交互等技术上,腾讯也早已为「全真互联网」进行了广泛布局,对沉浸式媒体等底层技术进行深入研究。
连接未来
为了解决「听」和「看」的问题,总有人在孜孜不倦地探索。
1876 年贝尔获得电话专利权,让人们可以听到千里之外的声音;1964 年美国最大的电信公司 AT&T 推出可视电话系统 Picture Phone,视频会议出现并逐渐扩大影响;近年来随着网络带宽的提升、硬件产品的更新迭代,在线教育、电商直播蓬勃发展,音视频产品已经具备了更多互动属性。
伴随着技术演进,数实融合的世界势必会加速到来,作为「科技与社会、人与人、人与世界之间的连接器」,腾讯云音视频将「尽快解决掉『全真互联网』里实时交互、沉浸式多媒体体验的难点」,在超高清视频、云游戏、VR/AR/MR、云端创作、AI 等方面继续强化,不断向外输入能力和服务。
超过 21 年的技术积累和实践,国内 90% 以上音视频开发团队的首选,腾讯会议上线 245 天突破 1 亿用户数的成绩,种种表现让我们有理由相信,增势强劲的腾讯云音视频会覆盖更多的场景和受众,以更短的时间抵达未来。
点击「在看」
是对我们最大的激励

继续阅读
阅读原文