浅谈手机处理器SoC的制造工艺以及构成和工作原理 您所在的位置:网站首页 手机的组成原理 浅谈手机处理器SoC的制造工艺以及构成和工作原理

浅谈手机处理器SoC的制造工艺以及构成和工作原理

2024-07-01 05:23| 来源: 网络整理| 查看: 265

手机处理器(SoC)

手机芯片名为SoC(System on Chip),中文意为系统级芯片,也有称片上系统,意指它是一个产品,是一个有专用目标的集成电路是一个“片上系统”,一颗手机处理器包括了CPU、GPU、基带、ISP等众多单元,这些单元集成在一起叫做SoC

soc内部组成示意图

SoC构成之一    CPU

1. CPU架构

     CPU架构是CPU厂商给属于同一系列的CPU产品定的一个规范,主要目的是为了区分不同类型CPU的重要标示。手机SoC中的CPU使用的是ARM公司开发的cortex架构,属于精简指令集架构,特点是低功耗,而电脑上的CPU基本使用的是x86架构 属于复杂指令集架构,特点是高性能。

     ARM架构由ARM公司研发,ARM公司会将ARM公版架构授权给芯片设计公司,由芯片设计公司对公版架构进行定制、改进(高通的kryo CPU核心就是基于公版cortex架构魔改而来)。

     上面提到 arm 处理器的命名分为 A、R、M 三个系列,这三个系列分别代表三种不同的应用领域:

   这里主要介绍  cortex-A 系列,指的是 Application,主要高性能的处理器。

cortex架构的近代史

     手机SoC中的CPU部分采用cortex-A 系列架构,2012年后ARM v8架构发布,首次在移动设备上提供了64位指令集的支持,性能得到巨大提升。ARM v8中最为出名的能效、性能最佳ARM处理器的核心为:Cortex-A73,也就是骁龙835中的Kryo 280 CPU的蓝本,性能相比14nm工艺的制造的前代A72高出30%,功耗大幅降低。

     从此以后的A75 A76等架构的性能和功耗都不尽如人意,如骁龙845中成为Adreno 630 GPU瓶颈的A75核心和骁龙855中功耗失控的A76核心

     骁龙865中的的A78核心经历了短暂的好评后,从第二年的新系列cortex X1核心到第三年的X2核心,连续两年CPU性能提升微乎其微,但是功耗大幅增长,这来源于两个因素,一是ARM在架构设计上摆烂,二是高通为了缩减工艺成本采用了良品率更低的三星工艺,这造成了骁龙888和骁龙8gen1的严重失败,采用了骁龙888和骁龙8gen1的手机,曾出现过大面积wifi虚焊事件,厂商为了控制soc的功耗,使用降频、锁帧等暴力方式,严重影响了用户体验。

     谷歌Tensor处理器,CPU部分包含了2个X1超大核心,不仅未得到性能的提升,还造成了功耗翻倍的尴尬,直到高通在2022下半年推出了采用台积电工艺的骁龙8+ gen 1,使得CPU功耗被有效控制

骁龙855排名倒数,谷歌Tensor更为重量级

     而苹果的A系列soc采用ARM指令集,自研CPU架构,这为A系列芯片的CPU带来了比公版架构更强的性能和比公版架构更小的功耗,苹果在2019年发布的A13芯片(iPhone11系列所使用)依然能以碾压之势胜于2020发布的骁龙888,骁龙888以极高的功耗,换取接近到A13的性能。苹果在iPhone14的发布会说到“直到2022年,我们的竞争对手还在苦苦追赶我们三年前芯片的性能” 

     高通骁龙,海思麒麟,三星猎户座等等手机soc中的CPU部分,均采用了ARM授权的公版架构,所以苹果完全自研的CPU架构在一众使用公版架构的CPU中具有绝对优势。

ARM Cortex CPU

2.制程工艺

     制程指的是芯片中每个电路之间的距离,制程越小,芯片集成度越高,可容纳的晶体管越多,在提高芯片性能的同时能缩小芯片面积,且因为晶体管之间距离缩小,电能损耗减小,发热也会降低,近几十年来,芯片制程一路从μm(微米)提升到了nm(纳米),过程漫长且艰辛

     1963年,仙童公司的弗兰克.万拉斯和华人萨支唐首次提出CMOS电路技术。CMOS技术对芯片制造业未来几十年的发展起到了重大作用。今天,95%以上的集成电路芯片都是基于CMOS工艺制造。

     但是CMOS工艺技术有一个非常大的缺陷,那就是当半导体栅极长度逼近20nm大关时,对电流控制能力急剧下降,出现电子隧穿效应,晶体管不再能够束缚电子的运动,漏电率相应提高,也就是说利用CMOS工艺技术生产的半导体,其制程极限为20nm

     1970年代,芯片制程还在μm阶段,2000年代,制程已经达到100nm,到了2010年左右,芯片制程逐步逼近20nm,CMOS工艺即将迎来极限,为了进一步提高晶体管的集成密度,胡正明教授在美国加州大学领导着一个研究小组开始研究如何让CMOS技术拓展到20nm及以下领域

胡正明教授

     于是,一种新的晶体管结构FinFET(鳍式场效应晶体管)诞生了,FinFET是由胡正明、Tsu-Jae King-Liu、Jeffrey Bokor 等三位教授发明,实现了两点突破,一是把晶体做薄后解决了漏电问题,二是向上发展,晶片内构从水平变成垂直即二维变成三维,源极被三面环绕,增强了晶体管对电子的束缚能力

      20nm制造工艺的突破为手机soc的制造带来了极大的便利,因为手机soc的面积比PC端CPU面积小得多,并且soc中集成了包括CPU等单元,所以如果要在手机上获得较高的性能,只有增大晶体管的集成密度

     从2015年到如今,soc的制造工艺从20nm进步到了5nm以下,由于晶体管中栅极长度的进一步缩小,FinFET技术也即将到达极限,为了让晶体管拥有更强的束缚电子能力,GAA(全环绕栅极晶体管)技术随之诞生,GAA技术,它克服了FinFET晶体管的尺寸和性能限制,在通道的各个侧面都有四个栅极,以提供全面覆盖,进一步增强晶体管对电子的束缚能力

      2022年6月30日,三星电子宣布正式量产3nm GAA工艺,全球另一大半导体制造公司:台积电,在3nm工艺节点仍然使用FinFET晶体管技术,但是其也将在2nm节点引入GAA技术,商用高性能芯片在未来几年里,GAA技术将逐步取代目前主流的FinFET技术

三星举行新一代晶体管GAA技术3nm首批代工产品出货仪式

工艺的命名

     常能听到某手机厂商宣传某某芯片采用了多少nm工艺,在探讨工艺前,首先仍需明确一个概念。即现在的“几nm”工艺这样的称谓,顶多就是个营销概念。不管是7nm还是5nm,晶体管或者芯片微观层面,都不存在哪个几何参数是7nm或5nm。如此一来,5nm也就名副其实地成为了一个虚指,它仅能用于表达一个工艺节点,“5”不存在实际意义,其实早在cmos时期,以nm单位来衡量晶体管的集成密度就已不完全准确,2012年22nm节点问世时,随之而来的FinFET晶体管结构,这种3D结构要用一个数字来衡量晶体管尺寸也更难了。一颗芯片上,晶体管并不是只有逻辑电路,更非仅采用高密度单元,晶体管也不是均匀分布。具体的仍要看芯片本身的设计。如今“老实”的英特尔已经放弃和台积电 三星玩xx nm的数字游戏,改用了全新的工艺命名方式,如“Intel 4”,“Intel 3”,“20a”,“18a”等

英特尔工艺节点发展图

骁龙820(左)对比骁龙835(右),soc整体面积缩小,同时性能提升

世界两大芯片制造代工厂之一,台积电世界两大芯片制造代工厂之一,三星

3.时钟频率

     CPU频率,即CPU的时钟频率,是指CPU运算时的工作的频率,单位是Hz,简单来说,频率就是CPU每秒钟计算次数,常用单位有Mhz(百万次),Ghz(十亿次),比如说一款处理器的CPU频率为2.8Ghz,即为CPU最高每秒钟可计算28亿次,所以频率是决定CPU性能的参数之一

4.核心数量

     手机soc的CPU一般会有6个或8个核心,分为性能核心和能效核心,性能核心频率较高,架构较先进,主要应对手机需要处理大型任务的时候,同时耗电较多。能效核心一般频率较低,架构较低级,主要用于日常的用户使用,同时耗电较少,CPU常用的丛集为1+3+4或者4+4或者2+6或者2+4,以下是两组CPU丛集组合

骁龙888(三星5nm工艺):

1个cortex-X1超大核心  2.8GHZ

3个cortex-A78大核心 2.4GHZ

4个cortex-A55小核心  1.8GHZ

骁龙888的CPU部分示意图,能看到1+3+4的大小核组合设计

骁龙845(三星10nm工艺):

4个cortex-A75大核心  2.8GHZ

4个cortex-A55小核心  1.7GHZ

骁龙845的dieshot,红圈位置为骁龙845的CPU核心,能清楚的看到4小核+4大核的组合

     但为什么845和888的大核心频率一样,性能却相差如此之多?原因是CPU的性能由架构,制程共同决定,从845到888的CPU架构经历了三次迭代,制程从10nm提升到了5nm,架构和制程的迭代带来的就是性能的提升

SoC构成之一   GPU

     CPU主要负责逻辑指令的执行和处理,但是当CPU遇到大量的简单计算时,复杂的逻辑处理反而会降低运行效率,那这大量的简单计算究竟交给谁呢,那就是GPU了,GPU主要负责图形渲染等计算工作,减轻CPU负担,增强游戏体验

1.架构

     手机soc中的公版GPU架构为ARM的mali架构,目前华为的海思麒麟和联发科的天玑芯片正在使用公版mali架构,也有像高通的Adreno架构和苹果这样的自研GPU架构

骁龙888中使用的自研Adreno660 GPUARM供没有自研GPU架构的芯片设计厂商使用的公版GPU架构,mali-g710

2.频率

     手机soc的GPU频率一般明显低于CPU频率,一般不超过1GHZ,因为GPU内拥有大量的计算核心-流处理器单元,大批量的数据构成的矩阵,同时在不同流处理器单元内经过几步,便可以完成全部计算,因而大大缩短了延迟,不需要过高的频率

SoC构成之一   ISP(图像信号处理)

     手机拍照,录像的图像信号都会由ISP进行处理,目前ISP芯片分为两种,一种是集成式,就是这篇文章所讲的一样,它跟CPU,GPU,基带等一起集成在soc中。另一种是独立式,其拥有明显的优势,在图像处理能力和成像质量上都更加优秀,而且独立ISP一般是手机厂商根据不同机型的摄像硬件定制,也能更好的发挥出手机相机的实力,但高通似乎很有信心在未来用集成ISP干翻独立ISP

高通Spectra的三ISP设计,可支持手机三颗摄像头同时工作

SoC构成之一   Modem(基带/调制解调器)

     手机中通常由两大部分电路组成,一部分是高层处理部分,另一部分就是基带/调制解调器/猫,基带英文全称Baseband,也可以翻译为“信源”(信息源,也称发终端)发出的没有经过调制(进行频谱搬移和变换)的原始电信号所固有的频带(频率带宽),称为基本频带,简称基带。简单来说,手机处理器负责处理信息,基带将处理后的数据转换成无线电信号发出,当手机接受无线电信号时,基带将无线电信号转换为CPU能处理的数字信号,而我们上网,通话时的无线信号的收发均由基带完成。同时,基带也分为集成式和外挂式

骁龙855和骁龙865同为7nm制程,因为骁龙865的性能提升需要,采用了外挂基带

     骁龙865采用外挂基带是因为处理器内部寸土寸金,如果要保证soc的面积大小不变把基带集成进soc,必然会带来性能的牺牲。骁龙888使用了5nm制程,使得soc在相同面积内能容纳下更多的晶体管,所以高通这一次把x60基带集成进了soc。

骁龙888使用的高通x60基带,苹果用了都说好SoC构成之一   DSP

     DSP即数字信号处理器,它原本主要用于处理音频信号,比如语音降噪、数模转换和实现特殊音效等。

   但是在高通的改进中,赋予了dsp更多的意义,骁龙888中的Hexagon 780不仅用来处理数字信号,同时其具有强大的AI运算能力,在高通的分布式AI引擎系统中起着关键作用,详情参见下文NPU部分

Hexagon 780SoC构成之一   NPU

     neural-network process units(NPU),翻译成中文叫“嵌入式神经网络处理器”。这个名字听起来很高端,简单来说,它主要负责处理涉及神经网络算法和机器学习的海量数据,因为神经网络算法及机器学习需要涉及海量的信息处理,而当下的 CPU/GPU 都无法达到如此高效的处理能力,也就是AI能力,需要一个独立的处理芯片来做这个事,才有NPU的诞生。

高通的创新:分布式“NPU”

     然而高通在这一方面走出了另一条路,不只是内含NPU的Hexagon 780协处理器具备AI计算能力,包括我们前文中所提到的CPU,以及Adreno GPU都有针对AI计算进行特别设计,高通使用soc内部分布的多个单元组成了一个强大的AI引擎系统

soc中各个单元共同组成AI引擎

业余爱好,如有错误欢迎指出



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有