左转科技

解密骁龙820:完爆八核的神秘四核架构,820

左转科技 1

【手机中国 评测】平时我们的技术解析文章总围绕着骁龙600系列处理器,今天我们换一位主角——骁龙820。除了性能强劲以外,还追加了不少新特性和友商打出差异化竞争,例如Quick Charge 3.0(下文简称QC 3.0)、骁龙全网通。正如介绍骁龙600系列处理器的内容一样,我们对骁龙820的技术解析也会分开多个章节进行描述,今天我们先聊聊架构的事情。

骁龙820和骁龙810不同,回归了骁龙801的自主架构设计并依然只采用了四颗核心。从第一代骁龙处理器开始,Qualcomm对于自主架构设计看得特别重,后来的双核心架构Scorpion(骁龙S3时代)就是Qualcomm自主架构的处女作。四核心架构Krait(经典的骁龙600和骁龙800时代)更为其奠定了今后在手机处理器端的王者地位。

接着我们对比一下骁龙801和骁龙820这两套SoC方案,看看同样采用了四核心的Krait 400和Kryo CPU架构之间究竟有哪些改进?


骁龙820 VS 骁龙801

骁龙820无论从哪个角度看,硬件参数相比骁龙801都要好上不少,所以我们重点关注的并不是性能上差异,而是两套自主架构方案的传承和革新,下文的内容也是基于这个原则开展的。

骁龙820和骁龙801虽然都是四核心设计,但是在三个很重要的方面进行了重大提升。首先将处理器指令集从32位升级到64位,接着将处理器的工艺从28nm升级到14nm,最后就是把Adreno 330升级到Adreno 530。由于最后一项牵扯到GPU内容,今天我们暂不展开讨论。指令集的升级最大的好处就是能够支持Android L(Android 5.0)以后的系统,包括最新的Android M。

根据PC处理器的常识,如果我们需要提升处理器的运算能力,一般可以通过提高主频、增加核心数目、更改核心架构和更新制程四种常见方法。

单核心时代的手机处理器发现当主频抵达一定高度之后就无法提升上去。接着芯片厂商开始琢磨核心数目、架构和制程三方面的内容。这两年,随着处理器核心数目抵达一定数量之后,“核战”的意义变得没那么重要了,手机处理器厂商也开始理性回归,重点优化处理器架构和制程。

从32位架构提升到64位架构之后为什么能够带来更强大的运算能力?打个比方,以往我们用小卡车只能够同时搬运32箱大货物,如今用了大卡车之后我们能够将数量上升到64箱。

假设芯片厂商研发实力足够成熟,设计出一款在提高主频、增加核心数目、更改核心架构三方面都优化到位的处理器,但是最大的瓶颈往往是落在工艺制程上。骁龙820采用14nm制程,相比28nm骁龙801升级了两代工艺,带来最大好处就是处理器能够塞下更多的晶体管。如果不升级制程情况下硬塞晶体管进去处理器,即使能够让你塞得进也会让处理器内部变成火炉,功耗和发热问题会让这颗处理器根本无法正常工作。

简单来说,工艺制程就是为了保障我们的处理器能够拥有更多的核心,更先进的架构和更高的主频的前提。

上面的内容在我们以前的文章中或多或少都有接触过,今天我想研究一些干货内容,要了解处理器架构我们最好就是通过处理器核心开启机制直观地看出端倪。

不少读者留言想看看骁龙820和骁龙801这两套Qualcomm自主设计架构处理器的核心开启机制又会是怎样的?大家都是四核心设计,会不会像骁龙650和骁龙808这两颗六核心处理器那样出现了不一样的调用情况?或者是任何时候都是四核全开?

跑分对比

解密核心开启机制之前先看看跑分,满足部分消费者的对比欲望。不感兴趣的读者可以直接看下一页的内容。

安兔兔评测


骁龙820 VS 骁龙801

从上面的跑分明细表就已经能够看出Adreno 530相比Adreno 330的进步可谓巨大的,3D性能从四位数升级到五位数,这也是每一代Qualcomm处理器相比友商同级别处理器具有优势的地方之一。CPU性能和RAM性能从上面的截图来看相差并不大,但是骁龙820的SoC仍然具有优势。UX性能的差距仅次于GPU,这也是安兔兔评测近几个大版本变革后的重点测试项目。

鲁大师


骁龙820 VS 骁龙801

和安兔兔评测不同,骁龙820和骁龙801在鲁大师的三个测试项目的得分差距都并不大。无论是主打传统跑分的性能评测,还是更注重UE、UX的体验评测和HTML5评测。很多读者估计也没预料到相隔两年的两代旗舰架构在鲁大师跑分相差并不大。

PCMARK


骁龙820 VS 骁龙801

虽然两者在PCMARK的总分差距并不大,但是子选项得分还是能够明显看出差距的,尤其是文档编写和图片编写这些任务。

3DMark


骁龙820 VS 骁龙801

如果大伙还记得之前评测文章中骁龙808的跑分,就会发现骁龙801的成绩比其要好,因为骁龙808只在ICE STORM这个场景出现过“达到极限值!”的提示,另外两个场景都并没有出现这种情况。Adreno 530相比Adreno 330在3DMark这类专业的GPU跑分软件的成绩大概相差10000万。

GFXBench


骁龙820 VS 骁龙801

除了Adreno 530的三个场景超过或者达到了24 Fps这个临界值,Adreno 530和Adreno 330合计另外的5个场景全部都没有达标。不得不承认GFXBench相比3DMark的考验其实是更残酷的。

安兔兔视频测试


骁龙820


骁龙801

还记得前两年我拿骁龙801和友商的处理器PK安兔兔视频测试,发现其内置Adreno解码模块表现并不出色,之后骁龙615、骁龙410以及骁龙810和骁龙808的表现其实都并不好。直到今年的骁龙650、骁龙652和骁龙820终于把这块短板弥补上。需要强调的是,安兔兔视频测试并不能完全代表日常我们看视频的用户体验,有些格式纵然不支持,但是我们压根儿都不会去看那一类格式的视频或者音频文件,那么这项指标分数偏低对用户体验扣分自然也无伤大雅了。

Vellamo


骁龙820 VS 骁龙801

由于骁龙801并不支持最新版的Vellamo,所以我们分别采用两个版本软件对两颗处理器进行跑分。在浏览器和金属这两个经典项目上骁龙820还是发挥出应有的优势,只是Vellamo计算分数的方式不同安兔兔评测,所以看上去差距并没有那么大。

Geekbench 3


骁龙820 VS 骁龙801

虽然都是四颗核心,但是引入了64位架构并用上了14nm制程之后,Kryo CPU的单线程和多线程跑分相比Krait 400架构呈现了翻倍的增长,可见Qualcomm潜心研发两年的自主64位架构确实优化到位,无论是单核心的能效比还是多核心的并发能力都有所交待。

AndroBench


骁龙820 VS 骁龙801

最后这个考验存储系统项目和CPU自身关系并不大,但是骁龙820启用了全新的架构之后引入了对LPDDR4和UFS 2.0两项技术的支持,这是骁龙801所不具备的。最终在顺序读取(持续读取)速度上大幅超越后者,也就是从手机拷贝大文件到其它地方时候更省时间,算是自主架构升级的一个小福利。

核心开启机制

关于核心开启机制的研究我们按照惯例主要分为跑分软件、在线视频和游戏三方面。

跑分软件

先解读一下图例,骁龙820四颗核心的最高主频并不一致,理论上有两颗核心最高能够达到2-2.2GHz(下文简称高频核心),另外两颗核心则能够达到1.6-1.7GHz(下文简称低频核心)。骁龙801四颗核心最高都能够达到2.5GHz的理论值,但是笔者手上这台样机为低配版,所以最高只能够达到2.3GHz。

如下图所示,系统监视器显示骁龙820的CPU0和CPU1为低频核心,CPU2和CPU3则是高频核心。骁龙801四核颗心都是一样的设计,在下文的系统监视器中也印证了这一点,这也是Kryo CPU和Krait 400架构的不同之一。


骁龙820


骁龙801

在安兔兔跑分的第一个环节中,对于CPU的负载按道理并不会太高。骁龙820两颗低频核心一直处于低负载状态,高频核心主频则一直维持在1GHz以上,但是并没有达到重负载,最高也只飙到1.7GHz。骁龙801则关闭了两颗核心,让另外两颗核心处于高负载,主频基本上维持在最大值2.3GHz。


骁龙820 VS 骁龙801

多任务这个环节应该是跑分控最爱,骁龙820和骁龙801都选择了四核心全开,骁龙801四颗核心都达到了最高主频,而骁龙820四颗核心则并没有。在多任务环节也出现了类似的情况。


骁龙820 VS 骁龙801


骁龙820 VS 骁龙801

经过了上面的多线程和多任务监控,不少读者会以为这款样机的骁龙820是类似小米手机5标准版那颗低频版,其实不然,通过上面国际象棋游戏测试项目,我们能够看到骁龙820的两颗高频核心是能够达到2.15GHz的最大值。

骁龙820和骁龙801在国际象棋游戏这个环节核心开启机制并不相同,前者依然偏向调用两颗高频核心,后者则更偏向将工作量集中在一颗核心上。


骁龙820 VS 骁龙801

中国象棋游戏的环节骁龙820改变了调用策略,将两颗低频核心频率提高,并降低两颗高频核心的负载。骁龙801则依然偏向让一颗核心处于高负载状态,另外三颗核心虽然处于最高主频但是负载并不重。


骁龙820 VS 骁龙801

五子棋游戏对于两套处理器架构来说都提升了负载的需求,骁龙820四颗核心主频都突破了1GHz,两颗高频核心也处于最高主频状态,它们之中其中一颗核心为100%负载。骁龙801也出现了一颗核心为100%负载,另外三颗核心负载都突破了双位数。

在线视频


骁龙820


骁龙801

对于负载相对较轻的在线视频环节,骁龙820四颗核心主频基本上都维持在1GHz以下,而且并没有出现关闭部分核心的情况。相反,骁龙801则长期关闭了其中三颗核心,让剩下一颗核心作为主力工作。

游戏

地铁跑酷


骁龙820

对于地铁跑酷这种小游戏,骁龙820四颗核心都开启不过频率并不会太高,除了应付一些运算量瞬间剧增的画面,例如上图最右边的情况四颗核心主频都达到了1.3GHz左右。


骁龙801

骁龙801则选择关闭其中两颗核心,另外两颗核心处于相对高一点的负载状态,但是主频并没有突破2GHz。

激流快艇2


骁龙820

对于激流快艇2这种大型游戏,骁龙820两颗低频核心基本上徘徊在1.4-1.6GHz,两颗高频核心则长时间处于1.4GHz左右,部分时间达到最高主频2.15GHz。


骁龙801

和地铁跑酷类似,在激流快艇2中骁龙801大部分时间继续关闭两颗核心,另外两颗核心处于相对较高的负载状态。

极品飞车17


骁龙820

没有想到的是骁龙820在极品飞车17测试中基本上处于稳定的核心开启状态,如上图所示,看来如今的大型游戏对于骁龙820来说也并没有太大压力。


骁龙801

骁龙801方面也表现得很轻松,继续关闭两颗核心同时另外两颗核心的负载也并没有我们想象中的那么高。

狂野飚车8

本次参测的两台分别采用骁龙820(Optimus UI)和骁龙801(Funtouch OS)的手机都无法正常运行狂野飙车8,出现了闪退的现象而且重装软件和重新下载数据包都没有任何作用。所以暂时不讨论两款处理器在这款游戏上的表现。

总结:同样采用了Qualcomm自主架构设计的骁龙820相比骁龙801在核心开启机制方面的算法明显复杂更多,骁龙801在安兔兔评测的3D场景测试、小型游戏和大型游戏的环节中基本上都会关闭两颗核心,在线视频环节更出现了关闭三颗核心情况。

骁龙820在多任务和多线程环节虽然四颗核心全开并实现了100%负载,但是两颗高频核心主频并没有达到最大值,反而在后续棋类跑分和大型游戏中短时间出现了单核心最高主频。

另一方面,将核心开启机制和各种跑分软件成绩相结合,我们不难发现Qualcomm自主架构的进化历程其实是有规律可循的。骁龙801的Krait 400架构偏向关闭两颗核心,从而压榨另外两颗核心的最高能效比,用更少的人办更多的事情。

骁龙820的Kryo CPU在Geekbench 3中能够看到无论是单线程还是多线程运算能力相比Krait 400都发生了翻倍的变化。实际应用场景中虽然算法比较复杂,但是简单来看面对轻负载的情况,例如在线视频虽然会四颗核心全开但是主频都并不高。而面对高负载场景则主要依赖两颗高频核心工作,突显最高能效比的概念,延续了Krait 400架构的特点。

一件繁重任务分派到一个车间,领导发现这件事情能够拆分开几个小任务,之后分别安排给张三、李四和王五三个人完成。其中工作效率最高的张三分派到的子任务自然就是最重的,耗时也会相对较长,但是总比没有人协助要完成得快。这就是单核心主频抵达一定高度时候需要多核心分担运算任务的原理,并不能一味地推高主频,当年Intel的Pentium 4就领教过苦果。

相应地,另一件复杂任务交给车间长审核之后,发现让工作效率最高的张三一个人就已经能够搞定,当然就会直接指派给张三完成,而并不会让李四和王五在旁边协助。这就是芯片厂商历年都在不断优化处理器架构和制程,进一步提升单核心能效比的做法。

骁龙820就是上面两个例子的综合版,在需要开启多核心的时候就会让四颗核心协同工作,而侦察到某个运算任务并不需要那么多核心时候,骁龙820就会让部分核心处于低负载状态,将工作集中在一颗核心上从而发挥其最大能效比的优势。而部分友商的所谓八核心和十核心处理器大部分时间其实并不能做到这一点,相关内容有机会留待以后的章节和各位进行深入探究。

本站部分内容收集于互联网,如有侵犯您的权利请联系我们及时删除。