骁龙888芯片深度解读
2020-12-03 11:52

骁龙888芯片深度解读

本文来自微信公众号:半导体行业观察(ID:icbank),作者:李寿鹏,头图来自:Qualcomm


在昨天题为《新芯片为何叫骁龙888?高通是这样说的!》的文章中,我们大概谈了一下高通全新一代旗舰,当中也讲到了高通为何在这颗芯片的命名上打破常规。不过从小米创始人雷军昨天发布的一则微博以及行内人的讨论热度看来,高通这个新产品也的确是让人眼前一亮。



但令人眼前一亮的并不止这个芯片的命名。在昨天看到高通对骁龙888做的深入解读以后,我们发现最硬核的其实是这个新旗舰的设计。在具体谈每个细节之前,笔者先总结一下大家对骁龙888高度关注的几个点:


  • 采用三星5nm工艺打造

  • 搭载了基于Arm X1内核、A78内核和A55内核设计的Kyro 680 CPU

  • 搭载了高通最新的X60基带

  • 搭载了高通最新的GPU Adreno 660

  • 搭载了高通新一代DSP Hexagon 780

  • 搭载了高通首个三核ISP Spectra 580



此外,骁龙888还集成了高通第三代5G调制解调器及射频系骁龙X60和高通FastConnect 6900移动连接系统,同时还支持全新的Type-1 Hypervisor。这就让该芯片在能通过5G与WiFi与外界连接的同时,还能够以全新方式在同一终端上,在不同应用和多个操作系统之间进行数据的保护和隔离。


下面,我们来逐一解读骁龙888的各大亮点。


三星5nm工艺加持


其实在昨天的发布会上,关于新芯片的制造工艺,高通并没有谈到太多,他们只是一语带过,骁龙888采用了三星的5nm工艺。值得一提的是,高通的上一代旗舰使用的是TSMC的7nm工艺,这对于高通来说,也算是一个新尝试。



从之前semiwiki的报道我们看到,三星的5nm工艺比7nm的密度提高了25%,性能提高了10%,功耗降低了20%。相比之下,台积电的5nm密度提高了1.8倍,性能提高了15%,功耗降低了30%。为此semiwiki认为,三星的5nm工艺在跟台积电相比会有一些劣势。



但笔者在这里需要强调的是,上述的分析仅供参考,并不代表三星这个工艺的真正实力。具体情况,我们可以等相关机构将A14和骁龙888进行剖片解析(如果有的话),才能获得。


但我们可以肯定的是,在采用了三星的5nm工艺以后,三星骁龙888的产能应该会后顾无忧,这是一个绝对的利好。据最近的媒体报道,因为苹果A14和苹果M1的出货超预期,给台积电的5nm带来了产能紧张的状况。而包括博通在内的多家公司,也对台积电的5nm工艺虎视眈眈。这时候拥有产能优势的三星就成为高通的明智之选。


全新设计的CPU


在上一代的骁龙865的CPU Kryo 585的设计上,高通采用了“A77(1)+A77(3)+A55(4)”的设计。据高通的介绍,在这个设计中,有一个A77内核是性能大核,另外三个A77核心则充当大核,再加上四个A55的内核,这就可以满足了高中低等不同性能应用的需求,并且在功耗上有了更好的表现。


来到骁龙888上,高通在其搭载的CPU Kyro 680上同样采用了“1+3+4”的设计。这个新CPU在大核和小核分别选了Arm的A78和A55,这是顺理成章的。而在性能核方面,高通也跟随Arm的路线图,选择了性能更强的X1内核。


高通的这个决定,从某个角度看,可以看做是智能手机SoC进入新阶段的象征



熟悉智能手机SoC发展的读者应该了解,在过去多年里,为了满足终端应用的运算需求,手机SoC从单核走向了多核。而为了兼顾性能和功耗,Arm推出了Big.Little架构。引入了大小核概念,与手机芯片厂商一起渡过了这个难关。


而进入最近几年,为了更精细地处理任务,华为和高通这两家厂商都开始采用“性能核+大核+小核”的设计,而Arm推出的X1,可以说是迎合这种趋势的顺势而为。这是Arm在今年五月发布会上除A78以外的又一个亮点。



正如anandtech在一篇文章中所说,Arm的现有业务模型旨在打造可满足最广泛客户需求的CPU IP。但在这就带来了一个问题,那就是你不能过度关注PPA三角形的任何一个区域而又不折中考虑其他两个区域。


在anandtech的作者看来,Arm的CPU内核在过去多年来一直活在Apple CPU内核的阴影下,因为Apple经验丰富的芯片团队,让其芯片的单核拥有无以伦比的性能。这就给Arm带来了困扰,即他们究竟能不能打造如此强大的内核?而X1的推出,就是为了解决这个问题的。



据介绍,Cortex-X1是基于Arm的一个名为“Cortex-X Custom Program”项目设计的,该项目是基于Arm前几年发布的“Built on Arm Cortex Technology”项目所做的改进。在这种授权模式下,Arm允许客户在新的微体系结构的设计阶段早期进行协作,并要求对配置进行自定义,例如更大的重排序缓冲区(ROB),不同的预取器或接口自定义,以更好地集成SoC设计。(欲深入了解Arm的全新架构,可以查看Arm全新CPU深度解读


高通公司正是该许可模式的主要受益者。


“骁龙888是全球首个采用Arm Cortex X1架构的移动平台,这是一个全新的架构,可将CPU性能提高25%,并且我们还将整个CPU丛集的整体功效提高了25%”,高通技术公司产品管理副总裁Ziad Asghar在发布会上强调。


从高通提供的数据我们可以看到,高通的CPU的X1内核主频为2.84Ghz、带有1MB的L2缓存,三个A78大核则有2.4Ghz主频、512KB L2缓存,A55小核的主频则为1.8Ghz,缓存也做有128KB。


集成的X60基带


在本文开头提到的那篇文章中,我们讲到,骁龙888是高通首颗集成了5G基带的8系列处理器。但因为在上一代的骁龙865中,高通并没有将X55基带嵌入其中,这就引致大家的广泛讨论。在问到为何做出这样的选择时,Ziad Asghar告诉记者:“对高通来说,集成调制解调器并不是一个很难的问题,而公司在产品设计的时候会根据需求选择效果更好的方式”。



而作为高通第三代5G调制解调器及射频系统,高通骁龙X60也的确能带给消费者更好的体验。


根据Ziad Asghar的观点,X60是世界上最先进的集成式5G调制解调器及射频系统。从高通提供的资料我们则可以看到,骁龙X60支持5G Sub-6GHz载波聚合和毫米波,能够提供高达7.5Gbps全球最快的商用5G网络速度。通过支持几乎全球所有主要网络,该调制解调器及射频系统还支持出色的网络覆盖,包括利用动态频谱共享(DSS)技术实现全国范围的5G网络覆盖。


在高通总裁Cristiano Amon看来,动态频谱共享(DSS)技术将使更多国家实现全国性的5G覆盖。因为DSS使5G和4G能够使用相同的频谱,那就意味着能更快、更容易地向5G过渡。“DSS还为实现5G独立组网提供了基础,开启新的业务模式和服务的大门,充分利用5G的低时延、服务质量和安全性的优势”,Cristiano Amon强调。


此外,骁龙888还支持全球5G多SIM卡功能,从而实现国际漫游、在一部手机上同时管理个人和工作号码,并优化每月套餐资费。


“凭借领先的X60,骁龙888成为首款在FDD和TDD上增加5G载波聚合等关键特性的移动平台——而所有这些都是在一个非常紧凑的、集成式解决方案中实现的”,Ziad Asghar强调。他进一步指出,在搭载了X60后,骁龙888为运营商带来了极大的灵活性,能给全球更多的网络带来最佳的5G体验。


其实在笔者看来,无论高通在基带上交出怎样亮眼的成绩,也都是在意料之中的。因为这是他们成立三十多年来,一直都在研究的技术。从某种意义上看,这也是高通赖以吃饭的核心。业内一直流传的“买基带,送AP”说法就是对高通基带技术的认可。


对于笔者来说,高通在5G基带上面最让人印象深刻的是这不仅仅是一个基带,而是包含了射频系统。这也是有可能在行业内引起巨变的部分。(关于高通射频及其对行业的影响,可以参考此文《高通射频,前景几何?》)



高通之前的介绍也表示,X60推出的新的Qualcomm QTM535 mmWave天线模块比上一代产品要小,并且可以采用新颖时尚的mmWave智能手机设计,并具有改进的mmWave性能。


Adreno 660的赋能


据高通所说,Kryo 680和Adreno 660能够提供持续稳定的高性能,这是骁龙移动平台一直以来的优势。而从上文中,我们已经看到了Kryo 680的卓越。至于Adreno方面,这也当然是高通的绝对优势领域。


作为手机SoC开发者阵型中最早自研GPU的企业,高通在这方面的战绩彪炳。但在之前,Adreno其实原本是ATI旗下的移动GPU部门,其前身也有另一个名字——Imageon。在本世纪初AMD收购ATI的交易中,Imageon也随之变成了AMD的资产。但“新东家”看不上这个业务,便以区区6000万美元的价格将其卖给了高通,这就为高通的SoC贡献了一块重要拼图。而根据官方数据显示,自 2005年首次面世以来, 高通Adreno GPU已累计出货超过25亿颗。



来到全新一代的Adreno GPU上,高通也没有掉链子。


Ziad Asghar告诉记者,Adreno是移动行业中最高效的图形IP。而在今年的Adreno 660 GPU上 ,高通在图形渲染性能上实现了同比最大的飞跃。数据显示,新GPU的图形渲染速度较前代平台提升高达35%。但在能耗方面则降低了20%。


除此之外,高通还专注于持续性能和可用性能,为GPU增加了全新的尖端特性。这意味着更多的游戏可以打破帧率的限制,同时让玩家在智能手机上畅玩更久。


“Adreno不仅仅是一个图形引擎,它还包括一个世界级的显示引擎,可实现最佳的图像质量”,Ziad Asghar强调。“高通Adreno 660 GPU的AI性能提升了43%。通过如4输入混合精度点积,以及波浪矩阵乘法等新的指令集,可加其快浮点运算”,高通技术公司高级产品经理Hsin-I Hsu补充说。


Ziad Asghar告诉记者,通过骁龙888,高通在显示部分增加了新的硬件(如Demura和亚像素渲染技术),以进一步提高智能手机显示的图像质量。尤其是在游戏方面,借助这个新的GPU,高通给消费者带来了全新的体验。


高通技术公司公共关系高级经理Macey Davis在骁龙峰会上指出,高通公司致力于移动游戏创新已有20多年。而在所有的这些技术变革中,高通一直引领着创新。其中,尤其以高通Snadragon Elite Gaming凭借诸多首次,在移动端实现的突破性特性一直处在创新的前沿。


“作为行业首个将面向特定游戏的GPU驱动更新和端游级正向渲染等端游级特性引入移动端的企业。我们非常自豪能通过我们的创新,让开发者充分利用硬件,为游戏玩家提供真正令人惊叹的体验”,Macey Davis强调。


在骁龙888上,高通Snapdragon Elite Gaming将再次把另一个首次在移动端实现的特性带给移动游戏,那就是可变分辨率渲染(Variable Rate Shading)。从Macey Davis的介绍我们得知,到目前为止,被称为VRS的可变分辨率渲染——仅在高端PC和下一代专业游戏机上实现支持。


他同时指出,由全新高通Adreno 660支持实现的可变分辨率渲染,将有助于减少GPU工作负载,同时显著增强游戏性能。这将使下一代移动游戏能够以更快的速度和更高的分辨率运行,同时仍保持最高的视觉保真度。此外,GPU工作负载的减少也能降低功耗,从而让玩家更长时间的进行游戏。


“当渲染每一帧时,GPU为每个像素执行一个着色程序来计算它的颜色。这意味着360万像素被着色。可变分辨率渲染允许开发人员指定着色器程序以2个或4个像素为一组仅运行一次,然后将这些颜色结果重新复用于周围的像素着色。而通过可变分辨率渲染,你可以仅使用140万像素对整个帧画面进行着色。这将会使整体着色的总像素数减少40%,从而大大降低GPU工作负载。这一特性将让开发者在不牺牲视觉逼真度的情况下创造更具有沉浸感的游戏体验”,Macey Davis说。


第六代AI引擎


据高通方面介绍,骁龙888在AI架构方面实现了重大突破。整体全新设计的第六代高通AI引擎包括了全新高通Hexagon 780处理器,将AI与专业影像、个人语音助手、顶级游戏、极速连接和更多功能进行结合,赋能顶级移动体验。


高通技术公司高级产品经理Hsin-I Hsu则从多个方面,阐述了这个新引擎的优势。



首先,高通重新设计了Hexagon处理器。据介绍,全新的高通Hexagon 780处理器具有我们平时所说的融合AI加速器架构。为了解析什么是融合,Hsin-I Hsu以骁龙865的Hexagon处理器为例。他指出,高通在上一代旗舰中拥有标量、张量和向量加速器。


“但在骁龙888的Hexagon处理器上,我们对其进行了重新设计,所以现在这些加速器之间的物理距离几乎消失了。不仅如此,我们还在这三个不同的加速器之间添加了一个很大的共享内存,这样一来,这些加速器可以更快、更高效地共享和移动数据”,Hsin-I Hsu说。


从他提供的数据我们可以看到,在某些用例中,数据交互时效最多可提高上千倍



与此同时,高通还对这些加速器本身也进行了提升。据Hsin-I Hsu介绍,新加速器的标量加速器的性能提升了50%,而张量加速器的处理速度是前代的2倍。


为了兼顾性能和功耗,高通在提升上述性能的同时,还同步提升了加速器每瓦特性能——与前代相比提升至其3倍之多!高通AI引擎的其他部分也进行了升级,如前文谈到的Adreno 660 GPU提升,就是当中一个代表。



得益于这些新设计,骁龙888的AI算力达到了26 TOPS!在基准测试数据方面,基于行业标准的AI模型,骁龙888的峰值性能远远领先竞品。“高通的技术专长一直是在不牺牲功耗的前提下保证平台的强大性能。从这款产品的表现我们可以看到,在每瓦特性能上,高通仍是佼佼者”,Hsin-I Hsu表示。


为了让AI在骁龙888中全天候运行,高通还在去年的基础上,推出了更加智能的第二代高通传感器中枢。



Hsin-I Hsu表示,高通为其增加了一颗专用的、始终开启低功耗AI处理器。这种额外的AI处理能力使高通可以将Hexagon处理器高达80%的工作负载分担给高通传感器中枢,从而实现更加省电的目的。据了解,高通传感器中枢进行所有处理所需的功耗仅仅不到1毫安。


为了要确保开发者能够轻松访问高通传感器中枢。高通还与谷歌就其最新的TensorFlow Micro框架开展合作,面向Hexagon处理器和高通传感器中枢上的AI处理器进行优化。这样高通的OEM合作伙伴和开发者就能够开发出他们自己的情境感知应用程序,同时最大程度利用我们的硬件。


“举例来说,借助第二代高通传感器中枢,我们能够减少Hexagon处理器上“Ok,Google”侦测算法38%的负载”,Hsin-I Hsu告诉记者。


Hsin-I Hsu进一步指出 ,高通为其传感器中枢打造的另一个炫酷的特性就是让其与终端其他所有部分进行通信。例如你的麦克风,各种传感器以及调制解调器、Wi-Fi和蓝牙等连接功能,这样的话高通的传感器中枢就可以从终端所有部分实时收集数据,并创建情境感知用例。


为了更方便客户开发,在发布新的AI引擎同时,高通还介绍了其第六代神经网络处理SDK。高通技术公司技术副总裁Jeff Gehlhaar告诉记者,高通神经网络处理SDK已在全球超过5亿台Android终端上为出色的AI体验提供支持!高通神经网络处理SDK的提升包括对更多模型的支持,以及对搭载骁龙计算平台的笔记本电脑上微软Windows 10 AI用例的支持。


“在骁龙865上,我们推出了Hexagon NN Direct,让开发者可以从他们的应用程序中直接访问Hexagon。这一方式受到了广泛认可,因此,我们在骁龙888上针对这一方式做出进一步重要升级——即为整个移动平台带来统一的Direct应用程序接口的能力。这个引擎Direct的设计初衷就是在骁龙888上首次带来了一个跨整个骁龙平台的统一AI应用程序接口”,Jeff Gehlhaar说 。


而对于开发者或OEM厂商来说,可以充分利用这一解决方案的优势,跨骁龙平台使用第五代和第六代AI引擎。


Jeff Gehlhaar表示,通过这个解决方案,高通扩展并增强了其AI软件解决方案的功能,为开发者提供了直接访问硬件的途径,当中不仅针对Hexagon 780处理器,还包括Adreno GPU和高通Kryo CPU。


此外,高通还扩展了用于AI加速器的、支持Hexagon的开源编译器TVM。那就意味着开发者现在可以用几行简短的Python代码编写自定义算子,为Hexagon编译,并能将其直接插入高通AI引擎Direct框架。


“作为在骁龙平台的首创,这将使开发者和OEM厂商能够打造个性化的体验,并扩展高通AI引擎Direct。我们计划与开源社区分享我们的贡献,并欢迎开放合作”,Jeff Gehlhaar说 。


三核ISP、安全及通信其他


据高通介绍,全新的骁龙888的优势还包括了其ISP、安全和对WiFi 6以及WiFi 6E的支持


首先看ISP方面,据Ziad Asghar介绍,凭借全新Qualcomm Spectra 580 ISP,高通首次在骁龙平台上支持三ISP。这意味着基于其设计的智能手机可以从三个不同的视角捕捉三路不同的影像流,然后决定哪一张照片或哪一个视频最适合你,并将它们组合在一起,创造最佳的拍摄体验。用户还可以通过120fps捕捉超高速运动状态的高分辨率图像,或同时拍摄三个4K HDR视频。计算HDR赋能的全新4K HDR视频拍摄实现了色彩、对比度和画面细节方面的显著提升。



“Spectra 580还将支持被称为单帧逐行HDR传感器的最新传感器技术,这也是首次由高通达成在移动平台中引入计算HDR的成就”,Ziad Asghar说。


据介绍,Qualcomm Spectra 580 ISP的处理速度提高到每秒27亿像素,与前代对比像素吞吐率提高了35%。Qualcomm Spectra 580 ISP还首次采用全新低光架构,这让其即使在近乎黑暗的环境中,也能拍摄出更加明亮的照片。


此外,骁龙888还支持10-bit色深HEIF格式拍摄,让用户能够捕捉超过10亿色的照片。


再看安全方面。据介绍,骁龙888引入了业内首个使用Hypervisior和符合CAI标准的摄像头的安全解决方案,来更好的保护消费者的数据安全性。高通技术公司产品管理高级总监Saritha Sivapuram告诉记者:“该特性以前仅在台式机上流行,主要用于在其各自独立的安全空间中运行多个操作系统。而骁龙888将是首个支持Type-1 Hypervisor的骁龙移动平台”。


Saritha Sivapuram进一步指出,与台式机计算一样,高通的Hypervisor可以在智能手机上启用同一操作系统的多个实例,并可在它们之间即时切换。这样的话你就可以拥有一个专用于自己工作应用程序的操作系统实例,以及一个用于个人应用程序的独立操作系统,或者你甚至可以运行一个完全不同的操作系统。


“高通的Hypervisor在硬件内部制造了隔离,保护每个环境的安全性和私密性。我们也认为能够以不同的方式使用Hypervisor。而对于应用程序来说,其未来可能是拥有自己操作系统的应用程序”,Saritha Sivapuram接着说。


从他的介绍我们得知,Hypervisor不但可以隔离应用程序,还可以使该应用程序的数据完全不受主操作系统内应用程序的影响。这就使得高通Hypervisor可以为应用程序开发人员开启一个值得信赖的全新世界,让他们可以在每个应用程序中创建全新的私密体验。


“Hypervisor只是骁龙芯片组所赋能的众多技术之一,其实我们的安全技术已从骁龙芯片扩展到了云端”,Saritha Sivapuram表示。


通过与Truepic展开合作,骁龙888还能够拍摄符合CAI(Content Authenticity Initiative)标准、拥有加密印记的照片(CAI是一项由Adobe倡导的开放标准,用于验证数字内容来源)


再看连接方面。前面我们谈到了5G蜂窝通信,但其实包括WiFi、蓝牙在内的通信能力,也是考量手机SoC性能的一个参数。而拥有有多系列无线产品的高通似乎已经面对这种情况做好了准备。


据介绍,骁龙888平台采用了近期推出的高通FastConnect 6900移动连接系统,能够提供目前移动Wi-Fi业界最快的Wi-Fi 6速度(高达3.6Gbps),并且支持Wi-Fi 6E的全新6GHz频段。通过支持蓝牙5.2、蓝牙双天线、高通aptX™套件、广播音频和先进的调制及编码技术优化,FastConnect 6900移动连接系统还能够提供清晰、可靠且响应迅速的全新蓝牙音频体验。


“骁龙888是我们多年研发创新的巅峰之作,我们相信它会为顶级移动体验树立一个全新的标准,带来用户所期待的体验”,高通技术公司全球产品市场高级副总裁莫珂东最后说。


本文来自微信公众号:半导体行业观察(ID:icbank),作者:李寿鹏

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定