魔改「黑神话悟空」打败 Midjourney这个 AI 生图神器让人上头

甜品展示 | 2024-08-26 18:56

　　。8 月 21 日，2.0 版本来了，真实感更好了，海报更有设计感了，文字这个看家本领也更强了。

　　你或许从来没有听说过它，这是一款前 Google 员工开发的 AI 产品，缺点不少，但长板能「弯道超车」Midjourney。

　　你直接输入中文提示词，它会帮你翻译成英文，同时帮你优化。作为一款海外产品，这样的操作很能收买人心。

　　同时，Ideogram 主打五种风格：普通、写实、设计、3D、动漫，都很好理解，所以选择起来也不会让人纠结。

　　先来个简单的中文提示词，「拿着金箍棒的孙悟空」，动漫风格，让 AI 帮我翻译和优化，看看它能自由发挥成什么模样。

　　当水灵灵的《七龙珠》版悟空出来的时候，我惊了一下，一看提示词，AI 把孙悟空翻译成了「Son Goku」，那就不奇怪了。

　　为了避免 AI 再误解，再输入提示词的时候，我不偷懒了，强调「孙悟空」是「Sun Wukong」，不是「Son Goku」。

　　这次走写实风格，并且规定了比较详细的场景，大圣身穿铠甲，手拿金箍棒，神情肃穆，威风凛凛，站在佛窟前，温暖的橙色调，图片底部写着「Black Myth: Wukong」（黑神话：悟空）。

　　文字没有错误，大写字母冲击感强，佛窟的氛围也营造了三分，但「大圣」的气质差了点、形象返祖了点，眼神里也没有光。

　　用相同的提示词让 Midjourney 生成一次，文字既有错误又没设计感，但稍帅一筹的「大圣」和页游的画风弥补了这一点。

　　不甘心的我又试了 3D 风格，提示词基本保持不变，只是把底部的文字改成了「8 月 20 日游戏上线」。

　　结果，Ideogram 生成的结果很像某个国风 Q 版盲盒系列的宣传图，画面处理得很干净，但完全不是我脑海里的 3D 游戏风格，还把美猴王画出了二郎神的模样。

　　并且 AI 也从中暴露了自己，虽然它对英文的文字渲染得心应手，却对中文一窍不通，这个缺陷从 1.0 延续到了 2.0。

　　看来海外产品不够理解国内的传统文化，Ideogram 第一回合的表现有些令人失望，却也不失趣味。

　　Ideogram 团队说过，2.0 版本不输 Flux 和 DallE。最近，Flux 真实版 LoRA 生成的 TED 演讲照片因为真假难辨，骗过了不少网友的眼睛。那么就来测测，Ideogram 生成的结果能多像照片。

　　选择写实风格后，我输入了中文提示词，TED 演讲照片，幻灯片标题为「Ideogram 2.0 发布」，上面有三个要点：「文字准确」「擅长设计」和「更真实」，女性演讲者站在白板前，背景中有几个人。

　　可以看出，Ideogram 的语义理解是不错的，该有的元素都有，TED 的标志几乎以假乱真，演讲者和观众的表情都很生动，头发和皮肤比较自然。

　　不过，细节处理得还不够好，虽然要求生成的文字没有问题，随机出现的一些小字坏了一锅粥，人物的手指和身体也不太对劲，但已经比之前的 1.0 版本强太多了。

　　至于海报设计，可以说是 Ideogram 吊打其他文生图 AI 的「舒适区」了。

　　如果以票房异常火爆的《异形：夺命舰》为考题，AI 能设计出那种不可名状的恐怖感觉吗？

　　我选择了设计风格，用提示词描述了一下画面的要素，并特别提及，海报底部写上一句：「未成年观众谨慎观看。」

　　总体的效果让人眼前一亮，长串的文字也成功生成了，只有一处小错误，但特别不写实，更像美漫的画风，和真人电影不太相配。

　　我再以暑期档烂片《红楼梦之金玉良缘》为灵感，让 Ideogram 生成海报，提示词写到的背景、装饰物乃至人物都在其中了，再次感叹提示词的跟随性真的不错。

　　片名当然也写对了，但字体像借鉴了指环王，有些出戏，整体风格更像花木兰动画电影。

　　Ideogram 的「设计风格」偏向二次元，比较独特，但反过来想，这也局限了海报的使用场景。

　　小结一下，Ideogram 是一款很有自己特色的 AI 文生图产品，写实的水平和 Flux 相近，艺术感和 Midjourney 各有千秋。

　　但文字生成水平独一档，比较适合用来生成海报、插画、广告、表情包、T 恤印花等。

　　人类评估的结果显示，Ideogram 2.0 在提示词对齐、整体表现和文本渲染质量方面，都比 Flux Pro 和 DALL · E 3 更好。

　　创始团队共 7 人，来自 Google Brain、加州大学伯克利分校、卡内基梅隆大学和多伦多大学，其中 4 位是 Google 文生图扩散模型 Imagen 研究论文的作者。

　　这次除了发布 2.0，Ideogram 还推出了 iOS app，国内可以直接下载，Android 版计划稍晚发布，从网页到移动端，我们可以随时随地生成图片了。

　　Ideogram 目前向所有用户免费开放，不过，额度非常有限，生成 5 次共 20 张照片后，Ideogram 就提醒我，10 个积分用完了，请明天再来。（当然，隔壁的 Midjourney 免费生成 25 张也没有显得多大气。）

　　如果很少接触文生图，想要一款文生图 AI 用来入门的，Ideogram 是个不错的选择。

　　输入中文提示词、用「魔法提示」翻译和优化是一方面，另外，Ideogram 还有很多选项帮你生成更接近脑海所想的画面。

　　提供范围有限的选项让用户「点击」，相比在空白的输入框完成「输入」，交互起来更简单。想要什么图片比例、什么风格、什么色调，Ideogram 都可以让你挑选。

　　不会写提示词，那也可以画出来，让 Ideogram 帮我们化腐朽为神奇。

　　我为我的糟糕画工感到抱歉，但 AI 能够领会意思，优化了线条和上色，还加了个背景，格调一下子上去了。有了 AI，谁不是神笔马良。

　　另外，网页版的输入框下面，都是他人生成的作品，遇到喜欢的，我们可以查看和参考提示词。Ideogram 表示，他们的用户在过去一年生成了超过 10 亿张公开可见的图片。

　　如果想要生成一个特定的对象，但又不知道怎么写提示词，Ideogram 这次还推出了用文本搜索公共创作库的功能，但这个功能目前需要会员。

　　它可以比较精准地生成用户所需的文字内容，并适配各种风格的图片，就业领域很广。

　　Ideogram 的整体质量不差，文本功能强大，对新手友好，使用方便，交互也让人愉悦。当 AI 工具兼具了创意、便利和分享价值，就很容易让人上头。

　　一个照着模子刻出来的世界太无聊了，洞察到很小的需求，然后将解决办法做到行业第一，那也很有意思。

　　世界上有很多的产品，同时有更多的受众，我们可以期待更多这样的 AI「甜品」。杏宇平台