• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

乐高积木的 AI 平替?LegoGPT 费脑不费手

产品

05-21 18:14

无论是从设计师,还是从玩家的角度出发,能够把脑海中的奇思妙想变成看得见、摸得着的乐高积木,这都是一件很酷的事情。

例如,自带火焰涂装车衣的改装车,深红色和金色花纹的复古花纹挂毯装点的躺椅,保留拱形纹路的中世纪哥特式大教堂书柜……

上述几款乐高积木模型均由一个名为 LegoGPT 的 AI 模型生成。按照官方的说法,LegoGPT 目前能以端到端的方式,直接把用户输入的文本 prompt,理解转化为物理结构稳定的乐高积木模型设计,并且所生成的积木零部件可供人类玩家、机械手自行搭建。其也是首个达成这一成就的 AI 模型。

不过,虽然这个 AI 模型被冠以了「Lego」之名,但其实与平日在商场里看到乐高品牌「LEGO」,并无直接的联系。这两者若要牵上关系,可以说乐高品牌是开创了一种积木范式,而 LegoGPT 则是为乐高式积木找到了一种新的创作方式。

而且长期以来,乐高积木价格整体偏贵,这让不少普通玩家望而却步,而乐高发烧友们的 DIY 乐高城更是价格「连」城。

某主流社交平台上粉丝量 736 万的乐高城「岛主」,今年年初通过其主页视频分享道,大型建筑体一套花费 1500 元到 2000元 不等,小型建筑体一套花费 500 元到 1500 元不等,整座乐高城目前总造价粗略估计已超 10 万元。

由于正版价格偏贵,乐高积木租赁也悄然在某主流二手转卖平台上成为了一门生意,可以低于正价体验同款产品,或是几块钱单独卖一些正版零部件。

面对后者的需求,为玩家提供了自由发挥空间的 LegoGPT,也许能青出于蓝胜于蓝。

如果你想要为你的乐高城添置点个性化配件,放在以前,你可能需要花费大量时间精力去海淘其他人的成品,或者找一些形状、颜色、纹路相近的零部件来平替。

现在,你便有机会把自己的灵感和创意,注入到每一块乐高城元件中了。

当然,如果你想无痛拥有一些乐高积木摆件,LegoGPT 生成的积木模型,不妨试试交由自动机械手「AI 代拼」吧。

AI 再现原皮裸装乐高积木

那么,现阶段 LegoGPT 的乐高积木作品还原度如何呢?下图是为大众所熟知的乐高牌积木。

1949 年,乐高公司首创乐高式积木;1953 年,乐高积木品牌正式上线;1958 年,乐高积木创新性采用「凸起管」设计,这种较为稳固的标志性积木连接方式沿用至今。

而下图是 LegoGPT 生成的一些沙发、床、杯子、椅子和相机积木模型,构成元件的形态较为基础和简单。引用一句外媒的辣评:

它呈现的乐高积木风格仿佛回到了1974 年。

不过,还不用急着吐槽它的古早味风格。经由 AI 上色和美化加工后,这些朴素的乐高积木已改头换面。

官方演示中的吉他乐高积木模型可以自由选择多种配色,也可以来个「混搭风」。

乐高积木「皮肤」的图案、纹理、颜色、风格、样式等等细节,也可以通过 LegoGPT 大胆创作。你可以获得超现实的赛博风沙发,也可以给石凳增添一丝独属于青苔的年代感。


目前,其研究团队在 Hugging Face 上提供了一个 Demo 版本。该 Demo 版本暂时不支持给积木模型上色或绘画图案纹理效果。

爱范儿浅浅试用了一下 Demo 版本的 LegoGPT。

提示词:「A circular milk bowl with geometric design.(一个几何形状的圆形牛奶碗。)」

提示词:「Piano featuring a flat rectangular surface over two evenly spaced legs.(带平坦矩形面板及两条等距支撑腿的钢琴。)」

单从这两张图的效果来看,LegoGPT 较为准确地理解并生成了 prompt 所涉及的物品形状、结构信息,积木大框架成型。用户优化其生成效果的关键在于 prompt 是否给的足够具体且准确。

不过,LegoGPT 目前在实际应用上仍有一定局限性,例如其暂时仅支持搭建 20×20×20 的积木空间,且仅提供一组共 8 种标准类型的积木块元件,绞尽脑汁排列组合能满足的物品款式也十分有限。

3 大 AI 技术撑起最稳积木骨架

LegoGPT 背后的研究人员,主要是卡内基梅隆大学生成式智能实验室助理教授朱俊彦的团队成员,以及同校教授刘畅流和Deva Ramanan。

该研究团队在题为《从文本生成物理稳定且可搭建的乐高设计》的论文中谈道,不少现有的 3D 生成模型专注于制作具有精细几何形状的多样化物体,但这些数字设计通常无法做成实体,「如果没有适当的支撑,设计的某些部分可能实际上会坍塌、漂浮或缺少连接元件」。

从「LegoGPT」的命名中也不难看出,这个 AI 模型与乐高积木设计数据集,以及 OpenAI 的 GPT 系列模型,都有着深远的联系。

据外媒近期报道,用 LegoGPT 生成的乐高积木模型之所以能「实体组装不散架」,离不开该 AI 模型研究团队的3大核心技术,分别是积木块预测模型、增强积木块预测模型的软件工具和用于训练模型的「StableText2Lego」新数据集

▲LegoGPT 的工作原理分为 3 大部分

其中,LegoGPT 使用的积木块预测模型利用了 GPT 系列模型、LLaMA-3.2-1B-Instruct 微调模型等技术。

而 StableText2Lego 数据集则采纳了超 47000 个稳定的乐高积木结构。

不仅如此,研究团队还把每个乐高积木结构从 24 个不同视角渲染的图像,输入 GPT-4o 模型,并且用该模型来生成相应的文字说明。文字说明的具体要求是,关注这些乐高积木结构的几何特征,而忽略其颜色信息。

你说少点几何思维不好上手拼?别担心,LegoGPT的产品和分步图解说明书会一起打包出厂。

▲用于训练LegoGPT的数据集

都说最终还是要用数据说话,那LegoGPT也当仁不让。依据其研究团队提供的测验数据,LegoGPT 能把乐高积木模型设计的实际组装稳固率,从普遍较低的 24% 直接拉升到 98.8%,基本告别「搭了个寂寞」的窘境。爱玩乐高积木的熊孩子、手残党也少犯愁了。

而且,这套模型的数据集、代码和模型均已开源,还不赶紧上手试试,可就怪不了别人了。

LegoGPT 这项新研究为积木市场填补上的空白,也许远不止这一点。它实际上在一定程度上解决了,当前 3D 生成模型存在的设计缺陷问题,还有望给那个高溢价、同质化、盗版泛滥严重的积木市场划开一道口子。

未来,AI 不仅能帮你设计积木,还能让设计图纸上的条条框框跳出来,变成能稳稳当当摆在桌上的玩具和艺术品。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中