历史上的今天

今天是:2024年10月28日(星期一)

正在发生

2020年10月28日 | 云网融合趋势下,视觉云如何实现颠覆媒体体验?

发布者:ZenMaster123 来源: eefocus关键字:英特尔  视觉云  云网融 手机看文章 扫描二维码
随时随地手机看文章

21 世纪是视频媒体的时代。和视频相关的应用,逐渐成为我们工作和生活不可或缺的组成部分。

 

除了传统视频业务之外,最近几年,随着新兴技术的不断出现,越来越多的新型视觉体验服务来到我们的身边,例如 4K/8K 超高清视频、VR/AR 沉浸式体验、AI 人脸识别、AI 自动换脸等等。

 

毫无疑问,我们的视觉体验,正在朝平台多样化、内容丰富化、交互智能化、沉浸式互动的方向发展。

 

更丰富多样的业务,意味着对系统及网络性能有更苛刻的要求。视频相关的核心处理流程,例如解码、推理、渲染和编码,都是“吃配置”的大户。如果视频处理平台缺乏灵活性、扩展性,不具备支撑高工作负荷的能力,将无法进行高效的视觉业务服务交付。

 

简单来说,性能不够,就会影响用户的业务体验,进而影响企业业务的进一步拓展。

 

于是,越来越多的企业,将自己的用户视觉体验业务迁移到云端,借助云平台,为业务提供充足动力和安全保障。视觉云,也就随之诞生了。

 

视觉云,包含一套面向远程消费内容和服务的功能,这些功能围绕高效提供直播型和文件型视觉体验,以及可将智能添加到视频内容中和利用机器学习及其它人工智能方面(例如物体识别)的应用。

 

我们常见的视觉云业务,包括媒体处理与交付、媒体分析、沉浸式媒体、云图形、云游戏、云 VR/AR 等。

 

那么,在目前云网深度融合的趋势下,视觉体验服务商该如何构建最适合自己的平台架构?面对媒体转型带来的巨大流量增长,服务商又该如何应对压力和挑战?如何进一步提升平台架构的效能,降低无效成本?

 

2020 年 10 月 12-16 日,英特尔在线上举办的“5G 云网融合线上论坛”。其中的“视觉云,变革媒体体验”分论坛,来自行业的 4 位顶级专家,分享了各自企业在上述问题方面的心得体会和实践经验。

 

 

Part 1

英特尔网络平台事业部市场开拓总监李进文表示,视觉云业务各自有不同的特性,开发部门各自有不同的考虑点,所以,没有一刀切的解决方案。

 

李进文首先对视觉云各个典型服务的发展趋势进行了预测。

 

他认为,视觉云中最关键的应用媒体分析,将达到 130 亿美金的市场。超高清 IP 视频流将在 2025 年达到接近整体 IP 视频流的 21%,这意味着 4K、8K 超高清内容将会成为趋势。增长幅度最快的是直播业务,拥有 15 倍的爆发性增长表现。近些年崛起的 VR/AR 业务也将创造 950 亿美金的市场,这同样是超高清 IP 视频流持续增长的原因之一。

 

面对机遇和挑战,拥有一个强大的平台刻不容缓。采用基于数据中心的基础设施架构来传输存储和处理,是必然的选择。

 

这类型的计算体系结构使大规模的视频交互变得更容易,且具有明显的成本优势,可以应对视觉云不断变化的需求。

 

提供视觉云服务需要广泛的软硬件架构,针对不同的应用快速提供创新服务,还需要一个广泛的生态系统提供完善的端到端解决方案。这些都是英特尔的强项,英特尔拥有广泛的软硬件平台和生态系统加速视觉云服务商的开发和创新。

 

李进文所在的视觉基础设施部门,可以提供完整的软硬件解决方案。在最底层,英特尔提供了广泛硬件,比如通用的英特尔®至强®可扩展处理器, Intel® Server GPU、FPGA、网卡等。软件方面,英特尔的策略是优先软件,目的在于提供完整的解决方案来加速客户的开发周期。

 

两个月前,英特尔发布了用于数据中心的独立图形处理单元,Intel® Server GPU,它最适合用于高密度的手游、云游和媒体传流,支持广泛的编解码功能,可以提供低成本高性价比的解决方案,同时也降低了安卓云游戏行业的入门门槛,从而使更多的游戏企业趁着 5G 的浪潮迈入云游戏行业。

 

 

李进文表示,广泛的视觉体验正在云端和边缘爆发性增长,企业和服务提供商需要更具有可伸缩性的基础架构,以及一系列软硬件和开源工具。基于英特尔的解决方案,是平衡的产品组合,提供更佳的体验和 TCO。

 

Part 2

来自北京华兴宏视技术发展有限公司的技术总监武宇文,重点分享了华兴宏视基于英特尔硬件架构的视频 AI 分析系统——PONTUS。

 

该系统将视频编码技术和视频 AI 分析技术相结合,能够实现多路高清视频的实时智能分析,对视频内容中出现的异常事件进行实时的分析报警以及场景的保存。

 

系统的 AI 能力是通过调用英特尔 openVINOTM 软件平台来实现的。底层硬件采用英特尔的 Scalable 高性能处理器以及 VCAC-A 高性能视频 AI 卡。软件能力能够提供视频图片的编解码与 AI Inference 同步进行,每秒提供 5~10 帧的视频 AI 实时分析,能够确保视频中不遗失关键信息。同时平台还支持视频流以及离线文件的接入实时分析。

 

 

在应用案例方面,武宇文重点介绍了铁塔高点视频监控(垃圾检测、渣土车检测)、实时视频车牌自动识别和视频智能分析。

 

以铁塔高点视频监控为例。基于铁塔顶端的高清摄像设备,可以部署高点监控系统,实现“危险场景的视频实时鉴别”,实现本地分析,实时响应。采用边缘处理的方式,不仅可以提升响应速度,还可以大幅节省带宽。

 

通过对问题内容的实时抓取,系统可以实现实时的报警功能,快速控制危险情况。例如非法排放、森林防火、秸秆焚烧、河道检测、管道检测、海防监控等。

非法作业车辆监测

 

这一方案将非常有利于生态环境综合治理及国土资源安全保护。

 

Part 3

前面我们提到,超高清 VR 直播目前正处于业务快速增长的状态。越来越多的 VR 应用场景出现,大量超高清 VR 内容的生产,进一步刺激 VR 产业的发展。

 

 

 

不过,超高清 VR 直播目前也存在一些问题。例如运营商网络流量费用高,终端下行带宽有限,限制了终端设备能够接收到的 VR 视频的码率,进而影响用户体验。再例如,终端设备的硬件解码能力有限,不同设备之间的解码能力参差不齐,即便是将高质量的码流传输到了终端,也不一定能够实现完美的解码和渲染,等等。

 

对于这些问题,来自北京博雅睿视科技有限公司的研发经理魏建超表示,需要从 VR 直播的各个环节考虑,紧密配合,提供端到端的解决方案,才能真正提高用户的体验。这些环节包括:VR 视频的采集、拼接,到后期的制作,网络传输,以及终端的解码渲染等。

 

博雅睿视的端到端解决方案,输入部分支持视频文件用于 VR 点播的需求,支持广电接口 SDI,支持 VR 相机接入,配备拼接服务器用于实时拼接,预览和后处理。这样的话,可以支持更多的应用场景,并从源端保证视频的质量。

 

 

另外,VR 视频的映射格式方面,方案采用 CubeMap 立方体映射格式,取代传统的 ERP 经纬图映射格式,从源端节省 VR 视频的数据量。

 

转码服务器基于英特尔的 SVT 技术,利用 SVT-HEVC 高并行化编码器,进行独立的编码,为基于 FoV 的 VR 视频传输提供了支持。

 

分发服务器,可以最大限度的利用现存网络的基础设施,实现用户基于 FoV 的内容拉流,大大降低下行的流量。终端用户根据视角拉取对应的 segments,下行带宽和解码压力都大大降低。

 

总结起来,高效的视频映射格式加上基于视角的传输,就得到了带宽的节省和用户体验的提升。

 

Part 4

最后,来自腾讯多媒体实验室的高级工程师许桂森重点介绍了腾讯云的 SVT-AVS3 编码器。

 

AVS3 是 AVS 工作组制定的我国拥有自主知识产权的第三代音视频编解码技术标准,也是中国音视频产业核心技术标准。该标准重点面向 8K 及 5G 产业应用,技术先进,专利清晰,受到行业的广泛关注。

 

根据参考软件的测试表明,AVS3 视频基准档次的性能比上一代标准 AVS2 和 HEVC 提升了约 30%。通过加入 AI 技术,主打智能编码,AVS3 的编码效率将比国际最新的视频编码标准 H.266/VVC 提升 20%。该标准的全面普及,将引领未来 5 年到 10 年 8K 超高清和 VR 视频产业的发展,进而领跑国际市场。

 

SVT-AVS3 超高清视频实时软件编解码系统,基于 AVS3 视频编码标准和英特尔 SVT(可扩展视频技术)实现,能够提供性能、延迟和视频质量之间的完美平衡。

 

腾讯 SVT-AVS3 的编码框架,是基于英特尔 SVT 编码框架经过发展优化而来的。框架主要分为几大块,第一部分是图像预处理相关的模块,第二部分是用原始像素进行 Motion Estimation 的模块,第三部分是码率控制相关的模块,第四部分是 MD 和重建模块,第五部分是环路滤波模块。

 

SVT-AVS3 的编码框架

 

SVT-AVS3 编码器支持视频预分析处理,通过对编码流程各个模块的充分解耦,在多核处理器中可以实现更好的帧级或段级的高度并行编码。在并行化处理的基础上,SVT-AVS3 通过对编码算法的参数化处理,实现了编码过程中速度与质量权衡过程中的无缝切换。在更高效利用处理器与内存资源的同时,更好地实现了速度与质量的权衡。

 

在编码时,SVT-AVS3 还支持对图像块级的分类分析。在使用低复杂度编码逻辑时,通过引入极少量视觉效果,在大幅提升编码速度的同时,可以保证图像主观上的视觉质量。这一点恰好能够满足现在短视频快速增长对编码速度及用户体验的要求。

 

许桂森表示,SVT-AVS3 目前已经适用于视频点播和实时编码 / 转码应用。腾讯多媒体实验室深度优化 SVT 架构的 AVS3 编码器,大幅提升 SVT-AVS3 的编码效率,现已集成到腾讯云,将其它标准码流转换成 AVS3 码流,为相关服务提供支撑。

 

 结 语

根据数据显示,2022 年,预计全球 82%的网络流量将是视频流。毫无疑问,这背后蕴藏着巨大的市场价值和商业机会。

 

英特尔推出的多种支持视觉云的解决方案,包括全套可扩展硬件、软件以及经优化的软硬件组成的精选解决方案,能够帮助云服务提供商、通信服务商及企业满足不断变化的需求。


关键字:英特尔  视觉云  云网融 引用地址:云网融合趋势下,视觉云如何实现颠覆媒体体验?

上一篇:人脸识别是否泄露个人隐私?人脸识别或存在风险
下一篇:华为AX3 Pro成本揭秘,高性价比的Wi-Fi 6 Plus 路由器

推荐阅读

开发商ConcernedApe(Eric Barone)表示,以农场为主题的角色扮演游戏《星露谷物语》已经在游戏机和个人电脑上大受欢迎,今天这款游戏将推向iOS平台。        官方称《Stardew Valley》正在全面转型,iOS平台上大部分主要功能和内容完好无损。        这款“休闲”游戏还将加入合作多人游戏,PC玩家甚至可以使用iTunes,将游戏中的文件...
你知道汽车上唯一一个需要每次开车前都检查的零件是什么吗?答案就是...轮胎这一条绝非在下一拍脑门凭空杜撰,而是黑黑白白印在了交规的考题当中,不过讽刺的是,可能绝大多数驾驶员开车前更关心自己的手机蓝牙连没连上娱乐系统,至于轮子在不在它该在的位置上却毫不关心。您是这样的人吗?如果答案是“yep”的话,那就赶紧看看大陆集团的新发明。德国大陆...
购物时“刷脸”支付、用手机时“刷脸”解锁,进小区时“刷脸”开门……如今,越来越多的事情可以“刷脸”,用人脸识别技术来解决。 近日发布的一份报告显示,有九成以上的受访者都使用过人脸识别,不过有六成受访者认为人脸识别技术有滥用趋势,还有三成受访者表示,已经因为人脸信息泄露、滥用而遭受到隐私或财产损失。那么“刷脸”时代,我们的人脸信息...
成立于2018年12月的上海芯联芯智能科技有限公司,主要致力于CPU IP技术的创新型研发、ASIC定制的全流程IC设计服务(含Chiplet定制封装研发)。在2021年CCIC上,芯联芯总裁余可专门接受了媒体专访。上海芯联芯智能科技有限公司总裁余可“我们是做设计服务的,但有1400项专利,并跟晶圆厂有密切的关系,可以保证IP转化为芯片后的良率。”余可介绍了芯联芯的...

史海拾趣

问答坊 | AI 解惑

需一枚芯币,却扣钱无数

这里下载东西咋这样啊,明示下载只需一枚芯币,却扣钱无数.明摆着让大家灌水吧!…

查看全部问答∨

研发工程师们:你们是在研发还是在抄袭呢?

现在这个社会,什么都可以抄袭。硬件方面可以抄板,软件的破解技术也是层出不穷。 所以想问问大家所在单位的产品都是怎么做出来的?…

查看全部问答∨

无线模块报警器的问题

我们公司的报警器是红外感应回拨未接电话的。有时乱回,解决此问题2000RMB奖赏QQ:842318330   15889688165 小武…

查看全部问答∨

请教问题 串口读取的GPS数据格式错乱

正确格式应该是这样的 $GPGGA,134835.000,3111.2624,N,12126.6671,E,1,07,2.0,75.4,M,8.1,M,,0000*5E $GPGLL,3111.2624,N,12126.66715.000,A*3C $GPGSA,A,3,11,25,23,06,03,16,19,,,,,,3.0,2.0,2.2*3F $GPRMC,134835.000,A,3111.2624,N,12126.6 ...…

查看全部问答∨

CString str("123"); 一直搞不明白,这样也可以?

Wince + eVC4 中: CString str("123"); 编译通过,运行没问题;调试一看,的确是 UNICODE 字符,这是为什么? 我并没有在字符串前边加 L 或 _T() ,怎么也行?…

查看全部问答∨

建议-单片机板块的置顶贴太多,影响查看其他帖子

临近年末,EEWORLD的活动丰富多彩,为了让大家能够第一时间查看到这些活动并参与进来,这些帖子置顶是毫无疑问的,   但是我发现单片机板块的置顶帖太多了,大致数了一下,该板块的置顶帖至少有15贴,这样就严重影响大家查看版面其余帖子, ...…

查看全部问答∨

SPI与中断服务的问题

WDTCTL = WDTPW + WDTHOLD; BCSCTL1 = CALBC1_8MHZ; DCOCTL = CALBC1_8MHZ; //主系统选择8M频率 TBCTL |= TBSSEL1; //选择ACLK(辅助时钟)作为TB时钟源 UCA0CTL1 |= UCS ...…

查看全部问答∨

招单片机软件工程师

本司急需招两名熟ST单片机的工程师,工作地点南山区,有想换地方的哥们找我,QQ327444825…

查看全部问答∨

dsp2812 I/O口输出波形的最高频率

大家好,有个问题请教下: 将dsp2812系统频率设置为150Mhz,那么它的I/O口的输出波形的最高频率为多少?我用了段程序测试了下,这段程序运行后,示波器显示,我的I/O口的输出波形周期为11.57微秒,即令I/O延时的一个指令花去了11.57/2微秒,则“指 ...…

查看全部问答∨
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved