Google 自研芯片 Tensor 什么水平? | 硬哲学

产品

2021-11-23 08:51

兼容并包的 Android 系统,造就了百花齐放的 Android 智能手机。但对于机皇的称号,每个人心里都有着自己的答案。

而 CNN(有线电视新闻网)则把「目前最佳 Android 手机」的称号送给了 Pixel 6 Pro,称其有着优秀的相机、流畅的系统以及独有的外观。

▲ Android 12.

造就这些特色的除了 Android 12 系统,还有 Google 首枚自研芯片 Tensor,如此的软硬结合成就了几年间竞争力、关注度最高的 Pixel,没有之一。

在 Pixel 亮相之前,有着苹果自研 A 系列芯片的珠玉在前,Tensor 也被贴上了「炸场」的标签,似乎 Google 也会拿出一枚足以名垂青史的自研 SoC。

只是随着 Pixel 的出货,Tensor 的架构、性能也被彻底解构,但它在性能、功耗上的表现还不足以称得上「成熟」。但在一些功能模块的取舍上,颇具 Google「设计」的匠心。

到底是自研,还是「魔改」

21 世纪的半导体产业已不像上个世纪 80 年代的百家争鸣,更像是几大寡头之间三分天下。

Google Silicon 团队在 Tensor 上已经投入了三到四年,但对于一款面向于智能手机的处理器 SoC 而言,没有深厚的技术积累,想要「出道即巅峰」实属有些痴人说梦。

▲ Google Tensor. 图片来自:@Sundar Pichai

隔壁的苹果在芯片产业上投入了接近三十几年,水瓶座、PowerPC 均折戟,最终在 2010 年发布自研 A4 芯片,并终于在 A7 上「一炮而红」,甩下对手几个身位。

Google Silicon 团队此前并没有复杂 SoC 芯片的设计、制造经验,此前的作品更多的是 Pixel 2、Pixel 3 的图像处理芯片 PVC,Pixel 3 及后续的 Titan M 安全芯片。

▲ Titan M 安全芯片.

Tensor 则是 Google Silicon 团队的首款「作品」。

Google Silicon 团队的副总裁菲尔・卡马克(Phil Carmack)在 Ars Technica 的采访之中曾坦言,「虽然我们是初涉 SoC 领域的团队,但我们知道如何去打造一枚专业级芯片,我们有着非常可靠的实现路径。」

所以,有些类似程咬金的 Tensor 到底自研几分,引起了相当大的关注。在 Pixel 6 Pro 发售之后,Anandtech 就对 Tesnor 做了一次彻彻底底的解构与分析。

简单来说,Tensor 与三星 Exynos 的命名规则较为接近,并且几年前,就传出三星半导体已开始提供「半定制」芯片的服务。

ETNews 甚至在 8 月份的报道中就表明,三星会根据客户需求提供定制技术与功能,甚至可以在芯片设计阶段就可以介入。

▲ Google Tensor 丝印内部命名为 S5P9845,而 Exynos 2100 则是 S5E9840. 图片来自:TechInsights

虽然近些年,三星的 Exynos 芯片不如高通和联发科,但在角色上,三星已然不再是简单的芯片制造商,格局打开了。

除了背景信息,Tensor 与 Exynos 用着相同的 CPU、GPU 架构,且电源管理、IO、存储控制器等等大功能模块均为同源。只是,在 SoC 大功能模块的设计之上有着「客制」的影子,Tensor 与 Exynos 有着很大的不同。

▲ 三星 Galaxy S21 Ultra 与 Google Pixel 6 Pro. 图片来自:digitaltrends

直白的说,Tensor 便是三星「半定制」芯片服务的一个客户,Google 提供设计主旨,三星负责搭建生产(此处埋个伏笔)。

严格来说,Tensor 应该是一款「客制化」的芯片,并非由 0 到 1 创造,而是从 1 到 2,或者 1 到 3。

这也基本解开了 Tensor 身世的一个谜题,但这并不能否定 Google Silicon 团队的投入,毕竟芯片不是艺术品,「是骡子是马总要拉出来溜溜」。

Google Tensor 到底什么水平?

如果用一句话来概括的话,Google Tensor 的 CPU 大概是 A12(被中核心拖累),GPU 比高通骁龙 888+ 强点(但功耗奇高),AI 性能前无古人(3 倍于 888+)。

Tensor 的 CPU 并没有选择主流的 1+3+4 架构,而是选用了 2+2+4 架构,两颗 X1 超大核心,两颗 A76 大(中)核心,以及四颗 A55 小核心。

▲ 同宗不同源的 Exynos 2100 与 Google Tensor. 图片来自:Anandtech

具体来说,Tensor 的 X1 核心 2.8GHz 的频率是要低于 Exynos 2100 与高通骁龙 888(888+),并且相对于 Exynos 2100,Google 给设计了 1MB 的 L2 缓存,与骁龙 888 齐平,超过 Exynos 2100。

两颗降频的 X1 在性能表现上无出其右,较低的频率选择也让 Tensor 能够长时间的运行高负载而不降频。

到了大(中)核心,Tensor 没有选择更新的 Cortex-A78 核心,退而求其次的用上了 Cortex-A76。A76 实则是两年前的核心架构,最早出现在高通骁龙 855 上,而现在多出现在骁龙 7 系上(这里再埋一个伏笔)。

小核心使用的是 Cortex A55,频率为 1.8GHz,算是高端芯片的标配。而 Google 同样给配备了两倍于 Exynos 2100 的 L2 缓存,来到 128KB,再次向骁龙 888 看齐。

与大核心 A76 类似,小核心 A55 同样有着一个「迷」,Tensor 将 L3 缓存与 A55 核心频率绑定,这与 Exynos 2100 专用的 L3 缓存频率不同,会引起延迟、功耗的问题(再加一个伏笔)。

GPU 上,Tensor 配备的是 Mali-G78 MP20,几乎是公版 G78 的天花板,L2 频率直接拉到丧心病狂的 996MHz,相对于 Exynos 的 MP14 来说,增加了 42% 的核心数,还堆高了频率,那就是用功耗来换取极限性能了。

如此设计的 Tensor 在实际表现上,其实是有点偏科,2 枚超大核心的存在使得其单核心性能足够,但 A76 的存在,整体拖累了 Tensor 的多核性能。

▲ Google Tensor GeekBench 5 跑分. 图片来自:anandtech

只是,Tensor 最致命的是内存延迟较高,甚至不如 Exynos 2100。CPU 在等待内存的同时,也在不断地发光发热。在一轮的测试中,Anandtech 表示 Tensor 用去的时间更长,成绩低于骁龙 888,但耗电却更高(多 13.8%)。

CPU 之中,亮眼的只有两枚 X1 大核心,而能效较差的 A76,以及与 L3 绑定的 A55,最终导致了 Tensor 发热、缓慢的运行效率。

GPU 如同理论分析,高能高耗,峰值功率直接堆到 8~10W,但 Pixel 6、6 Pro 都未用当下搭载高通 SoC Android 手机的 VC 散热板或者其他散热手段,散热水平「更像是 iPhone,而非是 Android」,积热严重只能降频,还未完成一轮测试,Pixel 就开始降频了。

而对于 GPU 冲到 8~10W 的功率水平,我只在一些骁龙 888 的电竞游戏手机中看到过,要知道它们可是有类 PC 级主动散热系统,并且外置电源的状况之下。

要说在 CPU、GPU 的设计上有所遗憾的话,那在 ISP(图像处理器)、TPU(机器学习引擎)配置上,Google 把自己的优势彻彻底底的发挥了出来。

ISP 把 Exynos 的和 Google 的定制图像芯片整合在一起,Exynos 的部分负责图像的采集和前期处理,而 Google 定制的部分就负责「计算」,反映在 Pixel 6 Pro 产品上,就是视频 HDR Net、动态模糊、人物抠像等等功能。

而 Tensor 内置的 TPU 才是 Tensor 命名的缘由,它采用最新的机器学习处理架构,并对 Android 12 系统进行过优化,不过如同其他芯片的机器学习、AI 模块所能直接表现出来的特性还比较「模糊」。

在 Pixel 6、6 Pro 上最为直观的就是系统、动画流畅,语音、图像识别速度很快这类特性。而对于 Tensor 上这颗 TPU 的性能在一些模型的跑分中,也超过了现在流行的主流 SoC(包括高通骁龙 888 与 Exynos 2100)。

另外,Google 官方还未向开发者公布这颗 TPU 的 SDK,因而 Tensor 内置的强大算力的 TPU 仍是 Google 独享,暂时落后于苹果 A 系芯片的开发生态。

为何如此设计 Google Tensor?

在解构 Tensor 之时,我留了几个伏笔,一是三星负责生产,二是 CPU 大核心 A76 的选择,三是 A55 小核心的设计问题。

其实关于 Tensor 的设计取舍还有许多的疑问,比如 2+2+4 架构的选择,做 Tensor 的初衷等等。

▲ Google Silicon 团队高级主管莫妮卡・古普塔(Monika Gupta). 图片来自:businessworld.in

「对于 Google 来说,我们希望把 AI 运用在我们生活的方方面面」,Google Silicon 团队高级主管莫妮卡・古普塔(Monika Gupta)又打了个比方「甚至我们园区餐厅的菜单也可能是由 AI 根据我们的喜好来设计的。」

「我们不想生产传统意义上的智能手机」,Google 想要 AI 和机器学习处理能力大增的设备,但市面上的处理器并不满足 Google 的需求,更强的 AI 才是 Google 选择自研芯片的初衷

这也是我们在 Tensor 上看到配备足够强大 TPU 的的原因。而 Google AI 部门中最常用的名称就是「Tensor」,取名 Tensor 的意味相当明显。另外,Tensor(张量)这个词本身就很 Google,很工程师文化。

「Pixel 6 的机器学习代码放在旧 Pixel 上,依然能够运行,但效率就差了一些。」Tensor 中独树一帜的 AI 性能并非是「空谈」,莫妮卡补充道「Google 已经把研发部门最新最强的成果呈现在 Pixel 6、6 Pro 之中。」

「一切与你想要达成的目的一致」,这个目的就是效率,Google 认为两个超大核以中等负载运行下的效率要远高于一颗大核,并且能效比也更高。

Google Silicon 团队的副总裁菲尔・卡马克(Phil Carmack)也举了个例子,「打开相机,除了你看到的一切,SoC 内部的 CPU、GPU、ISP、TPU 在不断地运行、计算,复杂的场景会牵扯到大量机器计算。」此时交由两颗 X1 处理器,更游刃有余。

「如果你需要更灵活的响应速度,高效率、高性能的达到目的,两枚 X1 的配备是要比当下的一颗超大核心配备要更为优秀。」

至于大核心选择 5nm 的 A76,而非更新的 A78,并未出现在这则访谈之中,由此我们只能猜测 Google 的意图,大概有这么几个情形。

一是,Google 认为 5nm 制程下的 A76 相对于几年前 7nm 的 A76 性能提升 20%,足够应付轻量负载,再高就交给双 X1。

二是,Google 对 A76 核心有着丰富的调教经验,更有利于直接复用此前在 Pixel 上的机器学习,无需重新去适配调用。

三是,在 Google 与三星进行合作设计 SoC 时,由于 A78 太新,三星暂时还未能提供 A78 核心,Google 退而求其次选择 A76。

无论以何种考量,初代的 Tensor 在 CPU、GPU 的选用上还是让 Google 吃了一堑,2+2+4 的架构以当前 Android 12 的调度之下,与 Google 的预期还有着一定的差距。

Google 为何要造芯?

Google CEO 桑达尔・皮查(Sundar Pichai)将 Tensor 芯片称为「迄今为止在 Pixel 领域最大的创新」。

▲ Pixel 发生了翻天覆地的变化. 图片来自:CNET

对于 Pixel 来说,即使抛开 Tensor,Pixel 6、6 Pro 仍然是 Pixel 翻开新篇章的产品,回归主流的硬件,全新的 Android 12 以及足够 Google 的设计。

而「自研」的 Tensor 并没有超越当前同代的处理器,但它在 Google 的设计之下,以求自己的方式来解决问题,并呈现一台非常规意义上的手机。

纵使配合 Android 12 的 Pixel 6、6 Pro 还未能发挥出应有的表现,而 Google 强调的 AI、机器学习功能暂时也没有想象中的强大。不过,对于 AI、机器学习大拿 Google 来说,彻底的吃透 Tensor 也只是个时间问题了。

如同 Google Silicon 团队卡马克所言,在统一的处理器架构之下,市场上传统意义的产品太多,Google 的 Pixel 系列想要分得一块蛋糕,选择不同的策略不失是一个好的选择。

不仅是 Google,手机厂商自我造芯已然成为一股潮流,像是 vivo V1、小米的澎湃,实质上与 Tensor 较为接近,就是够独特、与众不同的产品。

以及想让自己对产品有着足够的自定义权,而非是随着市场主流处理器架构而不断地调整产品形态,就好似今年的 Android 旗舰全部在内部散热上下文章一般。

从这个意义来说,绝对性能并不在第一梯队的 Tensor 对 Google 来说实则是成功了,它并未被市场大潮所裹挟,Tensor 偏向 AI、机器学习的设计已为 Pixel 系列打上了 Google 最强的印记。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中