谷歌推出了新款文本到图像模型 Imagen 4,承诺在文本渲染方面比前作有显著改善。同时发布的 Imagen 4 Ultra 版更精准地遵循详细文本提示,适合愿意支付额外费用的用户。两者通过 Gemini API 提供付费预览,并在谷歌 AI Studio 进行有限的免费测试。Imagen 4 的定价为每张图像 0.04 美元,而 Imagen 4 Ultra 则为 0.06 美元,专注于严格按照指示生成图像。尽管展示的图像质量良好并紧密遵循文本提示,但仍显现出机器生成的特征,未能如 Dall-E 3 和 Midjourney 7 等竞争对手那样吸引用户,尤其是在 AI 艺术热度减退的背景下。
谷歌推出了最新的文本到图像模型 Imagen 4,承诺相比前身 Imagen 3 “显著改善文本渲染”。此外,该公司还推出了一款名为 Imagen 4 Ultra 的豪华版,旨在更好地遵循精确的文本提示,适合愿意支付额外费用的用户。两个版本现在可以通过 Gemini API 进行付费预览,并在谷歌 AI Studio 进行有限的免费测试。
主要的 Imagen 4 模型被描述为“适合大多数任务的首选”,每张图像的价格为 0.04 美元。另一方面,Imagen 4 Ultra 旨在处理需要严格遵循详细说明的图像,提供与 Dall-E 和 Midjourney 等其他图像生成器相比“强大的”输出结果。该模型的成本提高了 50%,每张图像的价格为 0.06 美元。
该公司展示了多种图像,包括由 Imagen 4 Ultra 生成的三面漫画,描绘了一艘小飞船被一只巨大的蓝色生物攻击,伴随有“咔嚓!”和“有了!!”等音效。输出结果紧密遵循提示,类似于 3D 应用程序的卡通渲染。另一个提示请求生成一张关于京都的复古旅游明信片,结果准确地生产出来,但风格较为通用。尽管这些图像展示了良好的质量并遵循了文本提示,但仍然明显显得是机器生成的。总体来说,虽然 Imagen 4 代表了一定的改进,但似乎并未像 Dall-E 3 和 Midjourney 7 等市场领导者那样吸引用户,尤其是在对 AI 生成艺术的兴趣似乎因其在社交媒体广告中过度使用而减弱的情况下。