元宇宙和音视频技术(元宇宙概念视频)
时间:2023-03-03

在过去的两年里,长短视频持续发力,元宇宙直播产业日益成熟,5G网络不断落地,播放设备清晰度逐渐提升,这些因素的交织之下,用户对于更低时延、更加高清、更为沉浸的需求就更加明显。可是元宇宙和音视频技术的升级是一种系统性的提升,单纯的依赖于终端、应用或者网络都不现实。当潮水退去,企业需要进一步提升的还在于底层和平台,这其中包括了实时音视频传输、编解码、场景化渲染、AI特效、RTC/IM、元宇宙概念视频制作等诸多技术的升级,也包括了海量SDK接入的问题。面对挑战,元宇宙技术如何才能一站式满足用户音视频需求?

image (56).png

多元需求下,IM、RTC、CDN如何实现三网合一

在以往,在用户平常使用的消息通讯应用中,IM 这种基于互联网的即时通讯技术已经成为主流;网络视频通话这样的实时音视频应用中,RTC则是不二选择,其与IM配合能够实现音视频互动直播的流程运行;而在直播应用平台和视频的点播应用中,CDN则是支撑起内容分发的核心。三大网络各司其职,日常音视频通信应用也都很难离开这三张大网。

image (57).png

随着低延时、强交互、沉浸式的需求强烈,三网合一已成大势所趋,尤其是电商直播、在线教育、企业直播等新兴场景中更是如此。以直播场景为例,对于一场流畅、低延时的直播来说,一开始可能只是需要普通的直播能力,后期如需要连麦、互动、弹幕、商品明细等功能,就需要IM技术,如果对延时不满意,想要进行超低延时的直播时就需要RTC + CDN技术。另外,在云游戏或是远程控制领域,也是通过IM音视频传输、RTC,再加上低延时技术才可以实现的。

在腾讯生态大会的云上展厅就采用了实时云渲染技术,将整个线上展厅完全搬至线上,让用户真正能够在手机上沉浸式逛展。展厅基于腾讯云渲染PaaS平台,以云渲染RTC技术为基底,实现了端到端时延低至60~80ms,最高可提供8K 144 FPS高清高帧率输出能力。因此除传统应用场景外,在云游戏、云渲染、远程控制等非典型音视频通信新兴技术应用上同样离不开RT-ONE™的三张网络。

腾讯云音视频不仅可以提供高连通、高可靠、强安全的全球网络连接通道,还能保证超低延时,全球互联的音视频通信服务。除了具备海量的基础设施资源外,整合后的 RT-ONE™网络在海量调度、就近接入、传输优化效率方面的能力也都获得了提升,用高质量、低成本、快速便捷的接入方式,能够为开发者提供更为精准智能的网络调度服务以及更低延时的传输能力。并且腾讯云音视频直接将TRTC、IM、CDN三张大网整合打通,在底层设施上实现复用,技术能力共享共建,在上层应用方案和产品化方面以一站式的SDK和API提供给开发者,为开发者解决了技术痛点难题。

腾讯云音视频利用“三网合一”这一优势,为用户在大多数场景提供更高质量、更低成本的便捷服务,随着各行各业的数字化转型以及疫情带来的用户习惯改变,“三网合一”降低客户了接入及使用门槛,为客户提供更方便高效的音视频通信能力,助力客户实现场景创新。

SDK调用过多,RT-Cube如何实现All in one SDK

随着万物互联的时代到来,人工智能等技术强势接入生活,我们对于场景的需求越发多样化。而以往单一的场景模式很难满足用户的更多需求,无论是低延时,强交互,亦或是多样性玩法,这都需要更多的SDK支持。但多场景往往意味着大量SDK集成才能够满足客户的音视频通信需求,这就意味着开发周期的大量延长。

对于音视频应用研发而言,SDK的整合与统一,意味着效能的全面提升,成本的进一步降低。

image (58).png

RT-Cube™作为腾讯云音视频推出的全新终端品牌产品, 整合了所有音视频通信能力,包括IM,TRTC,直播,点播等。其能够实现一个SDK解锁全部音视频通信能力,覆盖音视频通信全场景,一次接入,多处调用。这对于开发流程而言是一种极大的效能释放,开发者可以根据实际业务场景自由组合,随时快速升级扩展。对于直播产品而言,从简单的直播能力,到接入IM能力,RTC连麦能力,录制回放的点播能力等等,通过RT-Cube™,最快仅一天就可以搭建完成。并且可以实现一个控制台下管理IM,直播和互动直播等多种能力。账号系统也进行了统一,用户可以用同一个账号来管理IM,直播,TRTC的用户,进行统一登录,鉴权。

21年技术的积累,完备的音视频通信能力建设,让腾讯云音视频能够率先提出 All in One 的创新模式。SDK有很多模块,大到操作系统,小到SDK功能,需要做到协同运转和谐是很难的。多模块协同运作时很多协同、咬合、CPU拼抢等问题会一一浮现。RT-Cube™解决方案承载腾讯音视频多年积累的移动直播、互动直播、实时音视频、短视频、播放器等终端能力,在协同整合能力并让其发挥最大功效方面是十分困难的。基于这一技术难点,RT-Cube™ 解决方案完成了基础框架,架构设计、消息总线、线程模型、编译环境、监控模块以及测试系统的统一,在端侧的组件能够很好的协同增强。

在各种娱乐社交情景中,传统行业被云化的案例也比比皆是。当然,无论场景如何,所有开发者主要考量的内容都是一致的:时延、成本、品质。RT-Cube™ 面向各大场景提供低代码解决方案,为各行各业提供开箱即用的音视频应用开发工具,能够让开发者更专注创新,使得开发者可以快速上线高品质的音视频应用,节省开发者集成时间。

让音视频多一种可能,超高清的思与变

音视频产业的未来在哪里?有人说是高清互动,有人便直接说是元宇宙了。而笔者看来二者虽然路径不同,但从结果上来看,他们都是在为我们提供一个更加多彩的世界。虚拟的接触是一笔,高清触碰更是一笔。

8K的清晰度在以往看来几乎是不可能的事情,网络、编解码、时延,甚至连存储都可能是巨大的难题。但是随着5G和音视频技术的升级,如今这些看起来似乎都不再艰难。尤其是在如今更强的计算和处理能力,更优质的AI服务能力加持下,低码率更高清已经不再是天方夜谭。

image (59).png

腾讯明眸研究团队的画质增强研究工作主要是应用到编码优化前的前置处理的这个阶段,提供一些画质修复和增强的能力。通过传统算法和深度学习模型,来有效消除片源中的噪点和压缩效应,增强细节去除模糊,提升色彩质量,并解决由于分辨率和帧率低面卡顿不清晰等问题。

这样的技术能够适应的场景还有很多,腾讯已经将将更低成本、端到端的自由视角技术推向赛事直播、演会、活动直播、在线教学等各种侧重临场感和沉浸感的场景,让沉浸式体验走入生活,为游戏、影视、社交、办公等多个领域带来改变和影响。

越来越多的线下场景也会通过数字化的建模、音视频处理的技术还原到线上。去年疫情期间,腾讯云音视频与贝壳如视合作了VR带看的场景,随时随地可以发起与经纪人的联系,相较于业界普通3D效果,基于点云编码技术,提供三维景深信息,实现了全景图片对距离远近和方位的感知。VR同屏带看功能还用到了腾讯云音视频业界领先的实时音视频 (RTC)技术,可以实现接待人员和参观者之间在音视频之间做到实时同步。

“全真稳”三大特性成为了腾讯云音视频的标签,其能够支持 C 端及 B 端的各类音视频业务快速上线,赋能场景创新。而这样的表现也使得腾讯云视频云解决方案持续领跑中国市场,近日,国际数据公司(IDC)发布的《中国视频云市场跟踪(2021 上半年)》报告显示,腾讯云音视频在视频云解决方案市场排名第一,同时在 RTC(实时通信)这个重点赛道,腾讯云音视频的增速在头部厂商中排名 NO.1。不止于此,腾讯云音视频在音视频编解码、音视频处理等技术领域深耕,曾获得中国知识产权最高奖项“中国专利金奖”,且多次在 MSU 视频编解码大赛取得冠军。

随着技术的发展,音视频技术的发展会给更多的用户提供接触新世界的机会。 这样一个时代的出现,也可以为开发者的创新奠定基础,让技术与社会、人与人、人与世界的联系多方位、多形式。