【更新】NVIDIA Tegra 3 详解
随着华硕(ASUS) Transformer Prime 的发布,“理论上最快”的四核心 ARM 处理器 NVIDIA Tegra 3 终于登场了。回望一年以前,我们还处于对双核 Cortex-A9 的极度渴望中,而现在四核心的 SoC 即将量产,它会为手持数码设备带来怎样的革新?
巧妙的架构:4 + 1 核心
NVIDIA 曾经发布过一篇名为《可变 SMP:一种低功耗高性能的多核心 CPU 架构》的论文,试图引入第五个核心“协处理器”来实现高性能和低功耗这两个目标。论文中用一个最简单的曲线图来描述这种“快+慢”的思想:
图中的红色线条代表“高性能内核”,绿色线条代表“低性能内核”,那么最显著的特点就是:在待机或者低速处理的时候,需要一个“低性能内核”,因为它消耗的电量较少。但是在大数据量和高速处理时,需要一个(或多个)“高性能内核”,因为它在同等电量消耗的情况下可以提供更佳的性能。
那么 Tegra 3 就是这样的产品,它有四个主核心,和一个协处理器。其中协处理器的频率范围是 0-500 MHz ,它能承担基本的工作:待机,睡眠,后台邮件,系统通知等等。当系统负荷超出它的承受范围时,四个主核心会依次介入,承担更多任务:游戏,图片渲染,视频剪辑等等。
这就是 NVIDIA 的专利技术:可变对称式多核处理器 Variable Symmetric Multiprocessing,简称 vSMP。
多核心负载模式
多核处理器的调度工作是件复杂的事情,Tegra 3 有几种运行模式:
- 低功耗协处理器:最高 500MHz ,处理后台任务,音频视频(有硬解码)等等。
- 单核运行模式:最高 1.4GHz ,处理简单 2D 游戏,地图,基本网页浏览等等。
- 双核运行模式:最高 1.3GHz ,处理 Flash 网页,多任务切换,视频聊天等等。
- 四核运行模式:最高 1.3GHz ,处理大型游戏,视频剪辑等等。
也就是说,在最简单的运行状况下四核心完全没有启动,达到了节省电量的目的。NVIDIA 宣称 Tegra 3 在播放视频的环境下比 Tegra 2 省电 61%。
这段视频演示了一台搭载 Tegra 3 的 Android 3.0 平板在各种任务中的 CPU 占用率。
游戏性能表现
就目前的应用程序来说,能充分消耗四核处理器的 App 很少,只有大型 3D 游戏有这个实力。NVIDIA 把桌面 GPU 的经验带到了移动设备,在 Tegra 3 的 demo 演示中展示出了难以置信的光影效果——请看下面截图的阴影,水波,光照效果。
画面的细节表现,已经大幅超越了市面上的掌上游戏机,并朝家用机看齐。(更加期待年底的 PSV 有何表现)
所以 NVIDIA 的另一个战略就是“移动的家用机”,把手持设备跟电视机连接,在配上手柄,可以轻松享受高分辨率的游戏体验。它的名字叫“The True Mobile Console”。
这里有几段游戏演示的视频:
发展和演进
Tegra 系列产品的演进路线图是:Tegra 2,Tegra 3(KAL-EL),Wayne(四核 Cortex-A15),Logan(速度比 Tegra 2 快 40 倍),Stark(速度比 Tegra 2 快 75 倍)。
如果这幅路线图能够按期实现,那么在 2014 年还真有可能看到 ARM 攻占台式机的景象。
【更新】
补充 Transformer Prime 的拆机图,这里能清楚地看到 NVIDIA Tegra 3 和旁边的 elpida RAM。