超频稳定性测试方法和超频可行性研究 您所在的位置:网站首页 怎样查看显卡是否超频 超频稳定性测试方法和超频可行性研究

超频稳定性测试方法和超频可行性研究

2024-06-21 10:01| 来源: 网络整理| 查看: 265

之前发过一篇讲超频稳定性测试的文章,因为当时没有注意到prime95更新了,所以那篇文章其实可以作废了,重写一篇。没看过的也不用去看了,我可能过段时间就把那篇文章删掉了。

不一定只有超了频才需要测稳定性,装机完成之后,就可以进行稳定性测试,观察极限状态下硬件是否稳定。如果不稳定了就要去解决,而不是放着不管。

我见过一些买了5700/5700xt的,说是用的时候经常黑屏掉驱动。我没明白,都黑屏掉驱动了,你就继续这样用?不想着解决?没有解决办法就退了呗,你甚至可以录个正常游戏时黑屏掉驱动的视频,发给卖家,退货合情合理。不想退货就想办法分析问题,解决问题。最不应该选择的做法是,忍着问题,逢人就到处说。我虽然逢人就到处说刺客信条奥德赛是垃圾游戏,但我至少也是放弃游玩了。。一边忍着用,一边骂,我反正是不能理解。关于显卡黑屏掉驱动如何排查问题,我后面会简单说说。

如果把硬件超频了,准确的说,看过我之前讲PBO文章的人应该知道,是用户给出频率--电压曲线时,就需要测稳定性。当然,如果有时间,任何脱离默认状态的情况,都建议测一下稳定性,例如拉过功耗墙,甚至XMP。

稳定性测试大概分4部分,分别是CPU,内存,显卡,电源。

一 CPU

用到的软件是Prime95 29.8 build6,这是目前的最新版。如果以后有更新,本篇文章就又失去意义了,十分难受。还需要一个监控软件,hwinfo和aida64二选一,amd用户可以考虑使用ryzen master。

p95

第一个数字是你CPU默认的线程数,不用管它。最下面可以选择关闭AVX指令集。这是一个骗自己的选项。如果想测稳定性,就不要关AVX指令集。日常使用中会用到AVX指令集,例如守望先锋的保存最佳,剪辑视频等等。

测稳定性用到的选项有3个,分别是small ffts,large ffts,blend。分别对应 最高温度和最高功耗,内存控制器和内存,以及综合测试。这些测试都是分阶段的,不同阶段压力不同,都测完了就循环。

定压定频超频之后,对CPU的测试主要分两步,分别是 最高温度 和 长期稳定性。

最高温度:P95 small ffts,建议跑30分钟(觉得太长可以短点,5分钟?或者直接用单烤FPU代替?),观察CPU二极管最高温度是否符合你的要求。

其实不稳定也分等级,像9900k超5G,只给1v电压,这肯定是开不了机的。稍微升高点电压,可以进系统了,但是跑任何负载都不稳定。再升高点电压,能打游戏了,但重负载不稳定。直到电压够用了,所有情况都稳定。

说这个是因为,如果你给的频率--电压关系很离谱,跑最高温度测试时就可能出现不稳定的情况,就不需要往下测了。

长期稳定性:P95 blend,至少跑2小时,观察是否不稳定或者掉线程。

其实跑多长时间没有准确的答案,原因很简单,你跑8小时,不能确定8小时1秒会不会不稳定。所以2小时是我个人觉得比较折中的方案,有时间可以多跑一会儿。

不稳定就是蓝屏重启关机黑屏等情况,掉线程时prime95会有提示语句,CPU占用也会从100%掉下来。

CPU超频状态不稳定不一定只发生在负载时。有些CPU在超频时依然支持节能功能。CPU从节能状态切换到超频工作状态时,可能会出现不稳定。所以使用定频定压超频时,要在BIOS里关闭CPU节能选项(C-states),并且电源计划要使用“高性能”。

二 内存

单纯测内存稳定性可以使用runmemtestpro,我在CV3989387这篇文章里有讲过我是怎样使用这款软件的。如果不愿意看可以去看作者的说明,都是中文。

ryzen平台超内存,除了内存本身,还有内存控制器和IF总线的稳定性需要测。可以使用P95 large ffts,也是至少2小时。

intel平台的ring和IF总线比较类似,测试方法也类似。如果动了cache,也是用这个方法测。

三 显卡

使用3DMARK time spy压力测试和firestrike extreme压力测试,各跑三遍。

测试过程中开MSI afterburner看一下GPU和显存的最高温度是否符合你的要求。

这两项测试通过之后,大部分游戏都可以稳定运行了,但依然存在一些极限情况。包括但不限于:

极限功耗测试:furmark(甜甜圈)0aa。存在危险性,运行就会跑满功耗墙,可以用来测GPU最高功耗和最高温度。但因为撞了功耗墙,会降频,所以测不到超频状态。

通用计算频率:无论是A卡还是N卡,跑通用计算时,例如opencl和cuda,其工作频率会比你设定的频率高出很多。如果超频了,实际频率就更高了。测试方法的话就是找一些跑通用计算的软件,例如vapoursynth的gpu处理滤镜waifu2x caffe/vulkan,aida64 GPGPU等。

opencl时的GPU频率

显存带宽压力测试:如果超了显存或者给显存降压,可以考虑进行该项测试。跑满显存带宽的测试是aida64 GPGPU的显存复制项,但时间太短了,你得反复双击那项,不太好用。其它的话,我发现一些通用计算的软件吃显存带宽比较严重。

waifu2x vulkan时的显存温度远高于游戏时

四 电源

测电源测的是电源能否承受CPU和GPU都满载时的功耗。

由于甜甜圈0aa存在危险性,因此我个人推荐使用aida64单烤FPU,同时运行3DMARK TS压力测试。

TS测试跑完一次即可。

如果电源不够用,一般会触发过载保护而关机,前提是电源品质合格。

一些CPU压力测试的状态。

单烤FPUFPU+CPU单烤CPUP95 small fftsCinebench R20表格

这个测试没什么意义,因为这根本不是定频定压的超频状态,测试也没有保证时间不变。但是我可以说,在动态频率状态下(例如ryzen默认,pbo,显卡默认等),工作频率越低,压力越大。这是经验,如果觉得不对可以自己去定频定压测。

发这个就是想说一下P95不关AVX的压力是最大的。

之前那篇文章说FPU压力最大,是因为那版本的P95烤的是FMA3指令集,而FPU用到了AVX2。

这里说的压力,你可以理解为 用到的芯片内晶体管的数量多少。

下面说说超频的可行性研究。我写完之后发现这部分其实没啥太大用,愿意看我啰嗦就看看,不看无所谓的。

举几个例子。其中的数值大部分是我瞎编的。

3800x,3.9-4.5g。拿到这么一颗u,准备定频定压去超它。首先要做的是默认状态下跑一下最高温度测试,即压力最大的测试。因为P95分阶段不好测,可以用FPU代替。假设得到了80度,4.1g,1.3v的结果。再挂着hwinfo,适当调低轮询周期,例如0.5s,日常使用一段时间,例如待机,访问网页,聊天等等。去抓核心最高电压和最高频率,假设是4.5g,1.5v。那么可以得到如下结论,这些核心全部工作在4.5g,1.5v时是可行的,但是因为几个原因而不能这样做。原因是通过晶体管的电流不能太高,CPU的温度不能太高。再看80度,4.1g,1.3v的结果,适当提高频率,假设顺着默认的频率-电压曲线去提高电压,运行温度也会上升,直到你不符合你的要求(这步是思维实验,不是让你亲自操作)。你或许可以得到90度,4.2g,1.35v的结果。但默认电压一般会给的比较高,你可以摸你这颗U的体质,把1.35v的电压降低一点,去测稳定性,如果通过了,温度肯定是更低了(可以考虑一直摸索,摸到该频率下可以稳定的最低电压),那么就又有了提高频率和电压的空间,直到温度又到了临界点或者不稳定。不断去摸索,最终会找到一个可以过最高温度测试的频率,和电压,去测试长期稳定性,不通过就降频,电压不用动,再测,直到稳定。

这种情况被我称为 极限负载温度瓶颈。

极限超频时一般不需要测重负载的稳定性,部分是能开机就ok,部分是跑个分就ok。极限超频时存在一个频率,无论你给多高电压,都不能开机或者跑分,这种情况被我称为 频率瓶颈。为了日常使用的超频完全不需要考虑这种情况。

经过很长时间的折腾,你可能摸到了一组数值,假设是90度,4.3g,1.32v。这个频率状态,运行一些高负载的计算,性能一定比默认高。但是如果是做计算,稳定应该是第一前提,我不建议超频。然后再一看游戏时的频率,全核4.4g?那超频不是降低性能了么?没错啊,三代锐龙是这样的。

综上,得到结论,三代锐龙定频只有一个作用,秀跑分。即超频不可行。

像这种重负载工作频率在给定频率范围之间,且温度已经很高了的情况,一般定频也是定在这个范围之内。这种定频一定会降低单核性能。

那么再看看其他U。

2700,3.2-4.1g。默认状态单烤FPU,只有50度,频率3.4g,电压1.0v。频率范围最大值是4.1g,而且它有个大哥2700x,默认工作是4.0g左右。所以可以很容易推测出这颗2700超频潜力巨大。并且通过默认状态使用时的观察,可以看到4.1g的单核频率很少见,所以定频会损失单核性能也不太重要。可以抓它在4.1g时的电压,然后手动定4.0g,电压适当降低一点,去做上面说到的两项测试。不稳定了就加压,温度高就降压。最终可能会摸到一个稳定4.0g的电压,温度也满足要求。

如果没摸到,说明这颗u体质太差了,稳不了4.0g,那么可以试试3.9g。再不行就再降。2700这颗u全核频率定在3.6g以上都是ok的,不会过多损失部分核心占用时的性能。因为我知道这颗u的 核占用数--频率 曲线。核占用数>2时它就已经小于3.6g了。

在超频时,有时候会有一个目标,例如把2700超到4.0g,已经摸到一个极限低的电压1.28v,低于这个电压就会出现不稳定的情况,此时最高温度测试只有70度。对于这种情况,我个人建议频率不动,再稍微加一点电压,让最高温度在70--你的要求 之间。这是为了让CPU更稳定,减少测10小时没问题,10小时1秒出问题这种情况。

9900k,实际4.7-5.0g。intel平台其实比较简单。手动定4.7g,电压自动,记一下电压和最高温度。手动定4.8g,4.9g,5.0g,都记一下,这样你就有了一条曲线。5.0g,默认电压时的温度可能很高,不符合你的要求,那么尝试降压,降压之后发现最高温度并不太高(如果发现怎样降压都不行,就只能试4.9g,以此类推)。此时意味着有机会超到更高。但是官方都不能保证核心可以运行在如此高的频率上,所以5.1g时的电压你要一点一点摸,5.2g也需要。或许你可以直接先测5.6g,失败了测5.3g,利用一些二分法的思想.......最终你可能会摸到一个高于5.0g的频率和安全电压以下的电压,最高温度也满足你的要求(这当然是不可能的,这部分只讨论方法)。

我之前说过如果直接测 高频率,高电压时的极限负载,可能会因为瞬时高电流高温度而导致芯片损坏。这意味着超频有风险。有一些避免的方法,例如测试从压力较低的R20,单烤CPU逐渐增加到FPU,P95,还有频率和电压从较低的水平逐渐升上来,你就能预测到大概什么时候停下来。

我讲的这个超频思路,是在没有其他人超频的数据时,完全独立思考的过程。

就像WOW的团队本boss,你的团队是世界第一个开始开荒的,没有攻略,你是不是要从头开始规划战术呢?失败了就再尝试别的,慢慢优化。如果你是第一个摸到你的职业的人,没有教学,你是不是要自己研究?

这个过程其实有点像 进化论,自然选择,优胜劣汰。慢慢淘汰掉不好的方法和数据,最终会摸到比较好的结果。emmm,我最近在看 自私的基因 这本书,我觉得这个思想对我影响太大了.....

有了别人超频的数据,你在此基础上微调就可以了。不用重复造轮子,站在巨人肩膀上确实很容易取得更高的成就。我也不是建议超频必须从零研究。重要的是这个思想。

有些人拿到硬件之后喜欢超频,像不超频就显得他不懂硬件,不厉害了似的。我一直有个观点,就是搞这些自然科学,要尽量摒弃一些人性中丑陋的部分。这种为了显得自己懂硬件的超频,目的就是丑陋的。真正懂硬件的人会分析超频的性能提升,稳定性的下降,以及能获得多少乐趣。

最后,希望大家拥有独立思考的能力,在PC DIY过程中获得快乐。

结束之前,还要讨论一下因为显卡原因而黑屏掉驱动问题的分析方法。有些黑屏和显卡无关,说个比较奇怪的。华硕的一些主板,在软件频繁通过SMbus轮询superIO时,会有极高概率出现黑屏,只能断电,而且断电之后要等几分钟才能开机。

如果在显卡频率--电压完全默认的状态下,玩游戏会黑屏掉驱动,并且已经抓到过3次以上该情况,则需要你本人进入debug模式。

先进BIOS恢复默认设置(XMP算在“默认状态”,CPU超频不算,可以先恢复默认再开XMP,保存)。关机拔掉其他硬盘,格式化系统盘,安装最新微软官方纯净的镜像(系统),使用序列号或登录微软账户使用数字权利激活,不要用第三方软件激活成盗版,包括KMS。进入系统之后联网,把自动黑屏和休眠关掉,什么都不做放30分钟(这是为了让win10自动下载驱动的过程完成,你因为某些行为(例如手动安装驱动)强行终止该过程可能会造成一些奇奇怪怪的问题),重启。然后手动执行自动更新,把系统更新到最新。从intel或amd官方下载最新的芯片组驱动,安装好。

然后从nvidia或amd官方下载最新的显卡驱动(你可能需要提前查一查这个版本的驱动到底有没有bug。如果大家都有,那你也不用测了,等官方修就行了),正确安装。

此时显卡驱动的设置时完全默认的,系统也是纯净,最新,默认的。在这种状态下安装并运行3DMARK的TS压力测试和FSE压力测试(不建议盗版),观察是否出现不稳定的情况。如果出现,大概率是驱动有bug(可以去百度和谷歌相关信息,不要自己瞎猜)或者硬件本身有问题,或者你显卡pcie插槽接触不良,供电不足,电源纹波太严重等你自己平台的问题。如果不出现,去运行你出问题的游戏。如果出问题,说明是游戏和驱动有些不兼容,可以考虑去官网反馈该问题,这可能需要一些英文技能。

如果通过该方法,发现黑屏掉驱动的问题再也不会出现,那就说明是原有系统环境的问题,问题解决。如果之前动过驱动的选项,你甚至可以考虑让问题复现,按照以前的方法去乱调你的驱动,让问题再次发生,你就可以知道动哪些选项会让电脑黑屏掉驱动了,这就是知识积累的过程啊。

如果确定是硬件问题,就把显卡退了吧。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有