最卷一夜！Google版 ChatGPT 开放、英伟达又投下核弹显卡……一觉醒来 AI 又变天了

AI 的「iPhone 时刻」已经到来

在刚结束的英伟达 GTC 2023 大会上，英伟达 CEO 黄仁勋把这个观点反复说了 3 遍。

怎么理解？

iPhone 搭载的多点触摸屏幕技术开创了一个全新的智能手机界面交互模式，由此孕育了移动互联网。

而 ChatGPT、Stable Diffusion 等 AI 超级应用的出现，标志着加速计算和 AI 技术的成熟已迈入成熟，AI 正以一个前所未有的速度渗入各行各业，推动一场新的产业革命。

经过近几年 AI 技术的不断发展，强大算力和先进模型为 AI 提供了合适的应用平台，促使各个厂商们重新构想自己的产品和商业模型，以及更新迭代的速度。

昨天晚上，英伟达、微软、Google、Adobe 等厂商在相差无几的时间里都推出了各自的 AI 服务，你追我赶之势仿佛在传达着同一个焦虑：

「在这个大 AI 时代，如果不想被人颠覆，就要先颠覆别人。」

AI 将会怎样改变我们的生活？看过这「AIGC 最卷一夜」后，你或许能有更深的感触。

英伟达正在把 AI 带到各行各业

英伟达在一年一度的 GTC 大会上又带来了很多让人眼前一亮的「新活」。

例如发布了一项名为 CuLitho 的 AI 辅助制芯技术，为 2nm 制程铺平了道路；与路特斯、奔驰、宝马等汽车厂商合作，用 Omniverse 搭建数字生产线等。

但要说到整场 GTC 大会最亮眼的内容，还得是英伟达发布的新显卡——带有双 GPU NVLink 的 H100 NVL。

H100 NVL 是专门针对算力需求巨大的 ChatGPT 而设计的显卡，H100 NVL 拥有夸张的 188GB HBM3 内存（每张卡 94GB），这也是目前英伟达发布的内存最大的显卡。

像 GPT 这样的大语言模型非常占用内存资源，理论上参数达到上千亿的 GPT 模型可以迅速占满一张 H100 显卡。

与用于 GPT-3 处理的 HGX A100 相比，使用了四对 H100 和双 GPU NVLink 的标准服务器的速度快了 10 倍，「核弹级」的 H100 NVL 是大规模部署像 ChatGPT 语言模型的理想选择。

英伟达整的另一个大活就是把「ChatGPT 同款」搬到了云上，向公众开放。

ChatGPT 的运行主要依靠由 A100 或 H100 组成的 DGX 超级计算机，微软为此花了数亿美金采购了上万张 A100 显卡组建 Azure 云计算平台。

为了降低用户部署大模型的成本，英伟达推出了 DXG Cloud 服务，每个月 36999 美元起，你就能获得一个由 8 张 H100 或 A100 显卡组成的云端超级计算机，轻松完成高负载的计算工作。

2016 年，老黄亲手向 OpenAI 交付了第一台 DGX 超级计算机电脑。7 年之后，顶尖的 AI 算力通过 DXG Cloud 有机会走进每家公司，完成在过去不可能完成的任务。

不难想象，像 ChatGPT 这样能够改善人类交流、提高工作效率的先进应用会持续涌现，为我们的生活带来更多的便利和惊喜。

点石成金，二代 Runway 让你一句话生成各式大片

B 站一直流行一句梗：视频不能 P，所以这是真的。但如今视频不仅可以 P，还可以从无到有直接用 AI 生成，不用画师、不用摄影、不用后期。只要你往 Runway 中输入一段文字，它便还你一段震撼人心的短片。

最早，Runway 是一款后期辅助工具，虽然借助了人工智能的神奇力量，但所能实现的，并不复杂：擦除物体、图像插帧、删除背景、运动追踪等，可以将它视作 Adobe Premiere 的傻瓜式插件。

而当 Runway 打开人工智能的新大门后，它拥有了点石成金的能力。在去年 9 月公布的 Gen 1 版本中，它有了文本转视频的能力。那时的人们，刚刚见识过文本转图像的魔力，而 Runway 直接能生成动态影像，简直是降维打击般的震撼。

时隔半年，Runway Gen 2 来了。

比起 Gen 1 模型，它实现了更高的时间一致性和保真度，说人话就是画面之间的联接得更顺畅了，画质还更高清了。

用上 Gen 2，距离随时随地生成自己想象的视频更近了。

输入一条不算长的提示词：无人机航拍的山脉。据此 Runway 生成出以下画面。

再来一个：午后阳光照进纽约市中一幢公寓的窗户。

来个进阶版，给 Runway 喂进图片和文字，进而生成一段短片。

▲ 文字为：一个男人走在街上，周围酒吧的霓虹灯照亮了他

▲ 原图

或者是让一幅静态图片动起来。

还可以将一张无纹理待渲染动图，直接渲染出动态影像。

Runway 的进步有目共睹，在对抗网络模型路上越走越远、越走越顺，如今的 Gen 2 版本已经算是「可看」的程度，虽称不上精致，但未来可期。

或许到了 Gen 3 版本，我们就能在它的帮助下，一键生成抖音爆款短片。到时候，这会是优质博主的噩梦吗？

突发！Google 开启 Bard 测试

如果说英伟达让我们看到了 AI 发展的未来，那 Google 的 Bard 就是 AI 的今天。

在大家被 GPT-4 和 Midjourney V5 震撼刷屏一周后、老黄展望未来 AI 时代的同时，Google 宣布正式开放 Bard 的访问：请尝试 Bard，并提供你的反馈。

根据 Google 的最新演示，相比 ChatGPT，Bard 更像是一个专注于工作学习的随身助理，你可以在它的协助下，激发想法、满足好奇心。

你可以让 Bard 用简单的语言解释量子物理学，或者让它提供头脑风暴，帮你在一年内阅读 20 本书。

Google 表示，用户可以在 Bard 的协助下，加速想法、激发好奇心。你可以使用 Bard 提供一些技巧，比如如何实现一年阅读 20 本书，或者用简单的语言解释量子物理学。

在演示中内容中我们还发现了一些细节，Bard 似乎会同时生成多个回答，你可以根据需求选择最适合你的那一个，并进行持续提问。

当然，ChatGPT 也可以生成多个回答，但它是在回答结束后重新生成，相较来看，Bard 更像是一个会同时提供多种方案的乙方。

可能是 ChatGPT 和 Bing Chat 的负面消息引起了 Google 的重视，后者不断强调 Bard 只是一场实验，Bard 生成的信息并不代表 Google 的观点。

Google 表示，虽然 Bard 由大型语言模型提供支持，并会随着时间推移而日渐强大，但它会学习到一些偏见或者刻板印象，导致它「自信满满」地说出一些不准确或者虚假的信息，比如它会将「ZZ Plant」理解为 Zamioculcas zamioculcas，而不是正确的 Zamioculcas zamiifolia。

有了 Bing Chat「疯了」的前车之鉴，Bard 的第一个测试版就限制了同一对话中的交流次数，从而保证内容的准确。当你第一次登陆 Bard 时，它就会告诉你这只是一个实验，并期待你的反馈。

作为 Bard 的第一个版本，它暂时还不支持更多语言（包括中文），Google 会持续更新写代码、识别/生成图片以及多语言支持。

▲ Bard：我不会中文，但希望未来会说

目前，Bard 仅在英国、美国开放访问权限，未来会逐渐扩展到更多国家和地区。

聊天就能做图，Bing Chat 更进一步

Bing Chat 到底有多火，或许只有上线一个月就让 Bing 日活首次突破 1 亿的数据能说明了。从复杂问题到娱乐聊天，再到灵感创意的实现，Bing Chat 正在重塑我们网络搜索的体验。

现在起，你可以让 Bing Chat 画图了。

微软为新 Bing 和 Edge 浏览器的预览版更新了三个新功能：Bing Image Creator、人工智能驱动的 Stories 以及 Knowledge Cards 2.0。其中最重要的当属可以画画的 Bing Image Creator。

微软表示，人脑处理视觉信息的速度比文本快约 6 万倍，Bing 的搜索数据中，图像是搜索最多的类型之一，而由 DALL·E 模型的高级版本提供支持的 Bing Image Creator，可以让我们通用自己的语言在 Bing Chat 中描述图片信息、选择艺术风格，Image Creator 就会联系上下文，将你的想象「画在纸上」。

Bing Image Creator 的加入，让 Edge 浏览器变成了第一个集成人工智能图像生成器的浏览器。