半年后,实时光线追踪会是 Android 旗舰的标配

产品

2022-07-08 10:34

除了 iPhone 搭载自研 A 系列芯片,Android 厂商们的 SoC 多是来自于高通、联发科与三星。

▲ 图片来自:wccftech

而高通、联发科与三星在 SoC 自主设计 CPU、GPU 架构上涉及不深,更偏向以 Arm 的公版架构为主。

如此,就带来了一个问题,当 Arm 公版架构设计不佳的时候,很容易引起连锁反应,旗舰芯片表现不佳,最终 Android 旗舰产品也大面积发热耗电。

▲  图片来自:《权力的游戏》

倘若再加上芯片代工厂的工艺良率不高,简直就是雪上加霜。

近年来,Android 高端 SoC 也陷入了如此的恶性循环,近年各厂的 Android 旗舰也被拖下了水。

原本算是较为小众的 SoC 知识,也逐步成为普通消费者的一个选购认知。

不过,相对于较难赶超的制程工艺,Arm 的公版架构定型之后,还是可以通过优化逐步扭转劣势。

▲ 第一代 Armv9 CPU 核心 图片来自:Arm

去年,Arm 在公版架构中引入了 Armv9 指令集,带来了 Cortex-X2、Cortex-A 710 和 Cortex-A510 三款全新的公版 CPU 核心。

最终在骁龙 8 Gen1 和天玑 9000 中,这套全新的架构相对于前代有了一定的提升,但仍旧有着不小的优化空间

在前些日子的 Total Compute Solutions 2022 大会上,Arm 对外公布了最新一代的公版架构,包括全新的 Cortex-A 三个 CPU 核心与全新的 GPU 系列。

新一代的 CPU 架构核心几乎也是就是围绕着优化与加强,GPU 则实打实的是创新。

CPU 着重提升能效比

Arm 芯片的优势便是能效比,但近年超大核 Cortex-X 的出现也开始让移动端的 Arm 芯片的绝对性能有了不小的进步。

新一代的 Cortex-X3 的出现,依旧是为了峰值性能,在与 Cortex-X2 相同的 3.3GHz 时钟频率之下,X3 有着 25% 的性能提升。

倘若 X3 运行在 3.6GHz 下,相对于一些主流级别的笔记本处理器来说,则有着 34% 的提升。

显然,Cortex-X3 超大核的超频潜力,以及更高的性能(和能耗)是给 Arm 的 PC 所准备,并非是为下一代的手机旗舰 SoC 所设计。

大核心 Cortex-A715 从命名来看,更像是对前作 A710 的改进,重点围绕的是效率。

核心结构优化之后,Cortex-A715 带来了 5% 的性能提升,同时能耗有了 20% 的降低。

从曲线来看,无论是在何种状态,A715 相对于 A710 都有着更好的能效比。为此,Arm 还表示在相同的频率和缓存下,A715 已经有了媲美 X1 的性能。

另外在大核心上,Arm 彻底地取消了对 32 位 App 的支持。因此,A715 的指令解码器的尺寸比前作缩小了 4 倍,使得 A715 核心在面积、功率和执行方面更有效率。

中核心的命名仍是 Cortex-A510,但 Arm 仍旧做了优化,并称之为是焕然一新的 A510。(感觉更像是重做了一遍 A510,毕竟前作问题很大。)

新 A510 核心,改进了时序,优化效率,由此功耗降低 5%。最为关键的是,A510 重新加入了对 32 位 App 的支持。

为此这个全新的 A510 也会被运用到物联网等其他领域,同样地,也不仅面向智能手机。

除了三款自有 Cortex 核心的优化迭代,Arm 的 DSU(DynamIQ Shared Unit 动态共享单元)也更新支持 12 个内核与 16MB 的 L3 缓存。

由此,未来的 Arm 处理器可能有着更为丰富的核心组合,除了常见的 1+3+4 的三丛架构,也可以是 1+4+4、2+2+4 等组合,甚至在一些追求更高能的芯片上,也可以用上 8+4+0 这种究极组合。

总的来说,Arm 新一代的 Cortex 核心多是在优化前代的结构,尽量提供更优的能效比,以及修正前代的一些不合理的设计。

另外,Arm 的核心设计也不仅限于智能手机,而是开始扩展各个核心的覆盖范围,超大核心 X3 着重向 PC 领域发展,而中核心 A510 具有更强的兼容性以面向物联网等领域。

GPU 光追将成为标配

以往来说,Arm 的公版 GPU 相对于 CPU 核心来说要弱势一点,更像是个基础的配置。

Arm 公版的 Mali GPU 不断迭代,在上一代的旗舰芯片中,公版的 Mali 在表现上已经接近高通自研的 Adreno。

随着新一代 CPU 核心的发布,Arm 也更新了新一代的公版 GPU。与此前例行升级不同的是, 这次 Arm 带来了一个全新的 Immortalis 旗舰系列。

▲ Immortan Joe 图片来自:《疯狂麦克斯 4》

Immortalis 系列与 Mali 在功能上最大的区别就是对光线追踪的支持,而在核心上,Immortalis-G715 拥有至少 10 个核心,而 Mali-G715 则可搭载 7~9 个核心。

核心数量上的差距,以及硬件上对光线追踪的支持,都让 Immortalis-G715 有着更广泛的用处,与 Cortex-X3 一样,更像是提前为 Arm 桌面级芯片做一个铺垫。

Arm 产品管理总监 Andy Craigen 宣称 Immortalis-G715 仅用了 4% 的着色器核心区域,便通过硬件加速带来了 3 倍的性能提升。

其实,在 Arm 前代的 Mali-G710 GPU 上,就提供了基于软件的光线追踪。另外,三星的 Exynos 2200 也同 AMD 合作,推出了硬件上对光线追踪的支持。

无论是 Arm,还是芯片厂商,都在提前布局移动端的光线追踪,只不过目前来说对外演示的多是几个 Demo,而游戏开发商们并未有明确的行动。

▲ 新 GPU 光线追踪演示 Demo(动图有压缩),注意看光影的变化 图片来自:Arm

对于移动端的 3D 游戏来说,大范围的硬件光追加持,有些像黎明之前的黑暗。

不过,Arm 的 Paul Williamson 在接受 TheVerge 的采访时,就暗示待明年搭载 Immortalis-G715 GPU 的终端上市后,就会有相应的产品以提供有趣的体验。

▲ 图片来自:Android Authority

常规更新的 Mali-G715,如同 Cortex-A715 一般,着重在能效上提升,相对于 G710,有着 15% 的能效优化。

另外,Arm 也更新了一款定位略低于 Mali-G715 的 GPU,Mali-G615,区别就是有着更少的核心(小于 6 个),面向中端 Arm 处理器。

要说 Mali-G715 和 G615 是常规迭代的话,那硬件上支持光追的 Immortalis-G715 实打实的是大升级,对于 3D 图像有了更好的计算性能。

Immortalis 系列的 GPU 与 Cortex-X 超大核类似,更像是 Arm 为桌面级处理器所准备,似乎准备开始在 Arm PC 上发力了。

芯片厂商们开始瞄向 Arm PC 领域

除了高通,三星 Exynos、联发科都会直接运用 Arm 的公版 CPU、GPU 架构,只不过核心频率、制程有所不同。

▲ AMD 的加入,也没能拯救 Exynos 2200

而随着三星上一代 Exynos 2200 开始与 AMD 一同合作推出 Xclipse GPU 之后,目前主流 SoC 市场也只有联发科在依照 Arm 公版架构进行开发天玑系列。

与三星 Exynos 找到 AMD 合作类似,高通则是直接收购了 NUVIA,一家拥有自主设计 Arm 芯片架构的公司,目的便是着手于自己的 Arm 架构芯片。

高通内部也准备了一块代号「Hamoa」的芯片,初期的目标便是苹果 M 芯片。其 CPU 将会引入自主设计的 IP 架构内核,而非是 Arm 公版架构。

很多分析师也表示,高通也有计划将自主设计 IP 的 CPU 内核引入骁龙芯片之中,当然前提是表现足够优秀。

▲ 苹果芯片已经领跑于高通、联发科、三星

之所以不像苹果 A 芯片一般直接切换,实则还是由于骁龙芯片的市场份额太大,风险太高。

如今,Arm 的公版架构更像是一个基础,越来越接近于给厂商们一个参考。

▲ 苹果芯片就是「差异化」的代名词

有能力的芯片厂商也在逐步开始自主设计核心架构,为的就是与苹果 A、M 芯片一样,有着更强的差异化,从而获得更多的订单量。

Arm 公版架构也开始着眼于 Arm 生态的打造,超大核 Cortex-X、 Immortalis 系列的 GPU 峰值性能的提升, 为的就是 Arm PC 处理器的布局,Cortex-A510 的重新设计,有了更好的向下兼容性。

智能手机市场已经转变为存量市场,无论是高通这种芯片厂商,还是 Arm 这种核心 IP 提供商来说,潜力巨大的 Arm PC 领域可能会是它们的下一个增长点。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中