关于在PC上对H.265/HEVC 4:2:2 10bit格式进行硬件解码的研究 您所在的位置:网站首页 可以硬解4k的cpu 关于在PC上对H.265/HEVC 4:2:2 10bit格式进行硬件解码的研究

关于在PC上对H.265/HEVC 4:2:2 10bit格式进行硬件解码的研究

2024-02-18 04:30| 来源: 网络整理| 查看: 265

序论

随着近年来微单相机市场的发展,越来越多的厂商开始在其主流消费级产品线上下放4:2:2 10bit这样的专业视频媒体格式。但是由于采用4:2:2色度采样的文件一般用于视频后期处理,在交付普通民用设备播放时会重新压缩为4:2:0,所以大部分数码设备上的视频硬件解码模块只支持后者的处理,遇到前者只能交给CPU进行软件解码,这会给设备带来很大的负载压力。

(PS:实际上负责视频硬件解码的一般并不是GPU的通用计算单元,而是芯片上一块特制的ASIC,所以你可以看到同一代架构的显卡对应不同解码能力。当然也有例外,比如Intel在4、5、6代酷睿上对部分格式的混合解码,以及NVIDIA基于CUDA的CUVID解码)

首先明确一点,就是我们今天探讨的4:2:2 10bit硬件解码主要针对H.265/HEVC编码格式,所以松下、索尼等提供的基于H.264的4:2:2 10bit格式不在其中。实际上H.264普及的时代很少用到10bit色深,绝大部分商用编码器甚至不支持Hi10P扩展,只有x264这样的能够实现,所以大部分设备对H.264的硬件解码只支持到4:2:0 8bit。目前已知Apple从某代A系芯片开始支持10bit的H.264硬件解码,但是具体规格不详,手头有相关设备的可以验证一下,尤其是对色度采样的支持情况。

其次,关于M系芯片的Mac是不是最佳视频创作工具,这是一个仁者见仁智者见智的问题。诚然M系芯片拥有强大的视频编解码引擎(不仅可以实现H.264 10bit、H.265/HEVC 4:2:2 10bit这些的硬件解码,还可以加速其专有的ProRes格式),在处理剪辑预览和导出这类任务时可以表现出卓越的性能。但是也有测试指出,由于现有软件生态尚不能很好利用其GPU的通用计算能力和AI单元算力,所以在特效、渲染等性能上可能会逊色于高性能PC主机。

硬件支持

回到我们的话题,先给一个明确的结论:目前PC平台上可以实现H.265/HEVC 4:2:2 10bit硬件解码的,仅有Intel Gen11架构之后的核显和独显。

简而言之,就是10代Intel酷睿低功耗移动平台Ice Lke(10代的桌面和标准电压移动平台基于Comet Lake架构),以及之后的全系带有核显的酷睿平台,还有Intel基于Xe架构的各种独立显卡,包括Intel DG1和Arc显卡。

你可以在Windows系统下使用DXVA Checker这款软件检查你的显卡硬件解码支持情况

UHD730

如图是笔者UHD 730核显的支持情况,你可以清晰地看到其中的HEVC_VLD_Main422_10_Intel,即H.265/HEVC 4:2:2 10bit的硬件解码支持。

那么NVIDIA那边是什么情况呢?以下链接给出了其GPU的编解码支持情况:

developer.nvidia.com/nvidia-video-codec-sdk

NVDEC

NVIDIA从Turing架构开始引入了对H.265/HEVC 4:4:4 12bit的硬件解码支持,但是直到最新的Ada架构依旧不支持H.265/HEVC 4:2:2,Ada的解码模块NVDEC基本沿用了上一代Ampere的,实在令人有些匪夷所思。

实际上NVIDIA对H.265/HEVC 4:4:4格式的支持也是有限的,在Windows平台上应该是没有实现的,笔者只在Linux下用mpv播放器在X11桌面下成功调用过硬件解码。

至于AMD的情况?目前已知的资料似乎表明其不支持4:2:0以外格式的硬件解码,所以~~~

软件支持

Adobe的支持情况如链接所示:

helpx.adobe.com/cn/x-productkb/multi/gpu-acceleration-and-hardware-encoding.html

新版的Adobe Premiere Pro 和 Adobe Media Encoder都是支持Intel的H.265/HEVC 4:2:2 10bit硬件解码加速的。

DaVinci Resolve是从17.1的Studio版本开始支持Intel的4:2:2编码和解码的,如图是笔者在一台Intel Core i5 12400 + NVIDIA RTX 3070 Laptop准系统上使用DaVinci Resolve Studio 18.0.4回放一段@影视飓风 Sony α7S3 2160p 100fps H.265 4:2:2 10bit素材的效果

成功启用核显硬件解码,Video Decode占用50%左右,CPU占用25%左右。

如果你有兴趣用本地播放器观看H.265 4:2:2 10bit视频的话,最新版的Potplayer在开启内置解码器硬件加速时也可以调用Intel的硬件解码。

(有朋友反映使用Potplayer播放H.265 4:2:2 10bit视频只有声音没有图像,请确认你更新到了最新版本,并且保证使用核显或Intel独显启动Potplayer,并且使用内置D3D11渲染器)。

设备选择

虽然Intel核显就足以应对4K甚至是8K的H.265 4:2:2 10bit解码,但考虑到视频制作还包括渲染、特效等需要GPU通用算力的场景,所以独立显卡还是必要的。尤其是很多功能往往是NVIDIA平台独占,所以推荐高性能的新版NVIDIA显卡作为主力。

对于已经拥有符合条件Intel核显的用户,在台式机上可以在BIOS里面找到类似于Multi-Monitor这样的多重显示选项,使得核显和独显可以同时工作而不会被屏蔽(需要主板支持);在笔记本上则可以切换到混合输出模式。

对于AMD平台或Intel无核显平台的用户,则可能需要单独购买一张Intel DG1或者最新的Arc独立显卡作为辅助。

当然,如果你愿意拿最新的Intel Arc独立显卡作为主力也不是不可以。

(顺便一提,Intel不同型号CPU上核显的多媒体处理单元数量是有差异的,编解码性能也会有所不同。高端和独立显卡是2个,低端的只有1个,可以去Intel ARK查看CPU的“多种格式编解码器引擎”数量)

新人创作不易,求大佬们一键三联。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有