腾讯自研芯片“沧海”斩获8大全球第一:远超行业GPU

久久百科 31 0

  近日,腾讯对外披露了其自研编解码芯片“沧海”的最新进展。

  在莫斯科国立大学举办的MSU硬件视频编码比赛中,腾讯“沧海”芯片包揽了所参加的两个赛道8项评分的全部第一。

  据了解,沧海芯片已在业务场景中投用数万片,服务腾讯自研业务及公有云客户。

  

腾讯自研芯片“沧海”斩获8大全球第一:远超行业GPU


  

腾讯自研芯片“沧海”斩获8大全球第一:远超行业GPU


  △MSU硬件视频编码比赛部分成绩

  具体来看,在SSIM (结构相似性)、PSNR(峰值信噪比)和VMAF(视频多方法评估融合) 等多项评价指标省,沧海芯片大幅领先行业GPU等标品硬件。

  据了解,MSU是视频压缩领域最具影响力的顶级赛事,迄今已连续举办了十七届,吸引了包括亚马逊、英伟达、英特尔、字节、快手、阿里和腾讯在内的国内外知名企业参与。

  2021年11月,腾讯在数字生态大会上公开发布了自主研制的三款芯片:AI 推理芯片“紫霄”、视频转码芯片“沧海”和智能网卡芯片“玄灵”。

  其中,沧海定位视频转码芯片,具备灵活的多核扩展架构、高性能编码流水线、层级化内存布局,优点为超前的软件编码器码率控制技术、高精度运动搜索、全功率失真优化、高效自适应量化,压缩率相比业界提升 30%以上。

  

腾讯自研芯片“沧海”斩获8大全球第一:远超行业GPU


  据悉,早在2019年初,腾讯蓬莱实验室、香农实验室联合启动了编解码芯片”沧海“研发。对硬件编解码的算法、架构和工程进行深度攻关,向高画质、低延迟、低成本的“不可能三角”发起挑战。

  基于自身在底层软硬件架构和音视频领域的多年积累,研发团队对每个模块的计算任务都作了并行拆解。通过分配不同的计算单元,从而叠加大量处理任务;为沧海芯片内置视频编码加速专用功能模块,让流水控制逻辑更纯粹,减少重复计算和分支判断,带来更低的功耗和成本。

  沧海芯片的编码器设计中完整实现了高精度运动搜索、全率失真优化、高效自适应量化等所有主流编码工具,并融合腾讯云软件编码器码率控制等方面的领先技术,压缩率高于市面标品35%以上。

  在硬件架构上,通过将视频预分析计算单元进一步卸载到硬件中,沧海芯片大幅减少了高密度转码场景下任务对CPU性能的依赖,将转码性能提升到更强。通过灵活的多核扩展架构、高性能编码流水线、层级化Memory布局,沧海芯片能满足高吞吐、低时延和实时性要求。

  根据MSU实测数据显示,从各项指标看,在同码率下,相较于业界GPU等标品硬件,沧海能大幅改善画面质量;在120fps的高帧率档位上,同等质量下,沧海比行业领先水平进一步节省10%以上的码率。

  另外,沧海芯片的单帧1080p的编码耗时仅4毫秒,吞吐性能几乎不受到编码参数、视频类型的影响。

  资料显示,沧海芯片在去年3月已顺利“点亮”,目前已经量产并投用数万片,在云游戏、直点播等场景中,面向腾讯自研业务和公有云客户提供服务。

  在直播平台中,观看人数小于200人的中长尾直播是主体,沧海芯片能帮助节省大量计算成本;在4K/8K超高清、高帧率场景中,相对软件编码,沧海芯片能实现低延时的高质量转码。

  腾讯丰富的多媒体应用场景,提供了充分的分析和验证条件,让沧海芯片迭代出更有针对性的场景解决方案。

  例如,针对云游戏场景,沧海芯片的瑶池板卡,可以灵活配比不同厂商GPU。针对视频转码场景,沧海芯片提供单机1024 路的高密转码能力,将转码成本降至最低。

  软硬件的联合调优,也为腾讯云媒体处理(MPS)带来了领先的产品优势。

  现在,腾讯云能提供音画质增强、云原生录制、实时特效渲染、智能编辑、内容分析理解等服务,为用户提供更低成本、更低延时、更极致压缩的处理效果。