魔改「黑神话悟空」，打败 Midjourney，这个AI 生图神器让人上头

商业

2024-08-23 13:33

当 AI 文生图比拼真实度、艺术感，Ideogram 开辟了一个刁钻的赛道：在图片上精准生成文字，并且字体和排版都好看。

这个需求并不小众，一键生成海报、插画，还不用 P 图，能够省不少事，很适合对设计一窍不通的普通人。

我们之前写过 Ideogram 的 1.0 版本。8 月 21 日，2.0 版本来了，真实感更好了，海报更有设计感了，文字这个看家本领也更强了。

你或许从来没有听说过它，这是一款前 Google 员工开发的 AI 产品，缺点不少，但长板能「弯道超车」Midjourney。

指路👉https://ideogram.ai/

AI 想知道，你说的悟空，是哪个悟空

Ideogram 有个特别新手友好的功能：「魔法提示」。

你直接输入中文提示词，它会帮你翻译成英文，同时帮你优化。作为一款海外产品，这样的操作很能收买人心。

同时，Ideogram 主打五种风格：普通、写实、设计、3D、动漫，都很好理解，所以选择起来也不会让人纠结。

先来个简单的中文提示词，「拿着金箍棒的孙悟空」，动漫风格，让 AI 帮我翻译和优化，看看它能自由发挥成什么模样。

当水灵灵的《七龙珠》版悟空出来的时候，我惊了一下，一看提示词，AI 把孙悟空翻译成了「Son Goku」，那就不奇怪了。

而且，也很想问问 Ideogram，是不是太明目张胆，给版权费了么。

为了避免 AI 再误解，再输入提示词的时候，我不偷懒了，强调「孙悟空」是「Sun Wukong」，不是「Son Goku」。

这次走写实风格，并且规定了比较详细的场景，大圣身穿铠甲，手拿金箍棒，神情肃穆，威风凛凛，站在佛窟前，温暖的橙色调，图片底部写着「Black Myth: Wukong」（黑神话：悟空）。

文字没有错误，大写字母冲击感强，佛窟的氛围也营造了三分，但「大圣」的气质差了点、形象返祖了点，眼神里也没有光。

用相同的提示词让 Midjourney 生成一次，文字既有错误又没设计感，但稍帅一筹的「大圣」和页游的画风弥补了这一点。

▲ Midjourney生成

不甘心的我又试了 3D 风格，提示词基本保持不变，只是把底部的文字改成了「8 月 20 日游戏上线」。

结果，Ideogram 生成的结果很像某个国风 Q 版盲盒系列的宣传图，画面处理得很干净，但完全不是我脑海里的 3D 游戏风格，还把美猴王画出了二郎神的模样。

并且 AI 也从中暴露了自己，虽然它对英文的文字渲染得心应手，却对中文一窍不通，这个缺陷从 1.0 延续到了 2.0。

看来海外产品不够理解国内的传统文化，Ideogram 第一回合的表现有些令人失望，却也不失趣味。

Ideogram 团队说过，2.0 版本不输 Flux 和 DallE。最近，Flux 真实版 LoRA 生成的 TED演讲照片因为真假难辨，骗过了不少网友的眼睛。那么就来测测，Ideogram 生成的结果能多像照片。

▲ Flux生成

选择写实风格后，我输入了中文提示词，TED 演讲照片，幻灯片标题为「Ideogram 2.0发布」，上面有三个要点：「文字准确」「擅长设计」和「更真实」，女性演讲者站在白板前，背景中有几个人。

可以看出，Ideogram 的语义理解是不错的，该有的元素都有，TED 的标志几乎以假乱真，演讲者和观众的表情都很生动，头发和皮肤比较自然。

不过，细节处理得还不够好，虽然要求生成的文字没有问题，随机出现的一些小字坏了一锅粥，人物的手指和身体也不太对劲，但已经比之前的 1.0 版本强太多了。

至于海报设计，可以说是 Ideogram 吊打其他文生图 AI 的「舒适区」了。

如果以票房异常火爆的《异形：夺命舰》为考题，AI 能设计出那种不可名状的恐怖感觉吗？

我选择了设计风格，用提示词描述了一下画面的要素，并特别提及，海报底部写上一句：「未成年观众谨慎观看。」

总体的效果让人眼前一亮，长串的文字也成功生成了，只有一处小错误，但特别不写实，更像美漫的画风，和真人电影不太相配。

我再以暑期档烂片《红楼梦之金玉良缘》为灵感，让 Ideogram 生成海报，提示词写到的背景、装饰物乃至人物都在其中了，再次感叹提示词的跟随性真的不错。

片名当然也写对了，但字体像借鉴了指环王，有些出戏，整体风格更像花木兰动画电影。

Ideogram 的「设计风格」偏向二次元，比较独特，但反过来想，这也局限了海报的使用场景。

小结一下，Ideogram 是一款很有自己特色的 AI 文生图产品，写实的水平和 Flux 相近，艺术感和 Midjourney 各有千秋。

▲ 「rainy summer」图案

但文字生成水平独一档，比较适合用来生成海报、插画、广告、表情包、T 恤印花等。

人类评估的结果显示，Ideogram 2.0 在提示词对齐、整体表现和文本渲染质量方面，都比 Flux Pro 和 DALL·E 3 更好。

▲ 但这是 Ideogram 自己的说法

可玩性高又接地气，这样的 AI「甜品」不妨多来一些

去年 8 月 22 日，Ideogram 宣布成立，与 2.0 发布正好相隔一年。

创始团队共 7 人，来自 Google Brain、加州大学伯克利分校、卡内基梅隆大学和多伦多大学，其中 4 位是 Google 文生图扩散模型 Imagen 研究论文的作者。

这次除了发布 2.0，Ideogram 还推出了 iOS app，国内可以直接下载，Android 版计划稍晚发布，从网页到移动端，我们可以随时随地生成图片了。

▲ 手机端界面

Ideogram 目前向所有用户免费开放，不过，额度非常有限，生成 5 次共 20 张照片后，Ideogram 就提醒我，10 个积分用完了，请明天再来。（当然，隔壁的 Midjourney 免费生成 25 张也没有显得多大气。）

如果很少接触文生图，想要一款文生图 AI 用来入门的，Ideogram 是个不错的选择。

输入中文提示词、用「魔法提示」翻译和优化是一方面，另外，Ideogram 还有很多选项帮你生成更接近脑海所想的画面。

提供范围有限的选项让用户「点击」，相比在空白的输入框完成「输入」，交互起来更简单。想要什么图片比例、什么风格、什么色调，Ideogram 都可以让你挑选。

▲ 不同色调的「戴珍珠耳环的少女吃麦当劳」

不会写提示词，那也可以画出来，让 Ideogram 帮我们化腐朽为神奇。

我为我的糟糕画工感到抱歉，但 AI 能够领会意思，优化了线条和上色，还加了个背景，格调一下子上去了。有了 AI，谁不是神笔马良。

另外，网页版的输入框下面，都是他人生成的作品，遇到喜欢的，我们可以查看和参考提示词。Ideogram 表示，他们的用户在过去一年生成了超过 10 亿张公开可见的图片。

如果想要生成一个特定的对象，但又不知道怎么写提示词，Ideogram 这次还推出了用文本搜索公共创作库的功能，但这个功能目前需要会员。

▲ 搜索「cat」的结果

总而言之，Ideogram 是一款可玩性较强的文生图产品。

它可以比较精准地生成用户所需的文字内容，并适配各种风格的图片，就业领域很广。

▲ Ideogram 博客

偶尔还能带来情绪价值，以图言志，虽然做的表情包太偏欧美互联网的审美了。

▲ 「我想玩《黑神话：悟空》」表情包

Ideogram 的整体质量不差，文本功能强大，对新手友好，使用方便，交互也让人愉悦。当 AI 工具兼具了创意、便利和分享价值，就很容易让人上头。

一个照着模子刻出来的世界太无聊了，洞察到很小的需求，然后将解决办法做到行业第一，那也很有意思。

世界上有很多的产品，同时有更多的受众，我们可以期待更多这样的 AI「甜品」。

Ideogram Midjourney

分享

正在加载中

爱范儿 App

爱范儿,让未来触手可及

爱范儿

AppSo

玩物志

知晓云

知晓程序

Ifanr QR Code

关注爱范儿微信号，连接热爱，关注这个时代最好的产品。

AppSo QR Code

想让你的手机好用到哭？关注这个号就够了。

CoolBuy QR Code

关注玩物志微信号，就是让你乱花钱。

CoolBuy QR Code

小程序开发快人一步。

CoolBuy QR Code

最好的微信新商业服务平台。