谷歌Imagen 4模型提升乏味图像

发布时间：2025-06-26 00:13:15 浏览量：97

谷歌推出了新款文本到图像模型 Imagen 4，承诺在文本渲染方面比前作有显著改善。同时发布的 Imagen 4 Ultra 版更精准地遵循详细文本提示，适合愿意支付额外费用的用户。两者通过 Gemini API 提供付费预览，并在谷歌 AI Studio 进行有限的免费测试。Imagen 4 的定价为每张图像 0.04 美元，而 Imagen 4 Ultra 则为 0.06 美元，专注于严格按照指示生成图像。尽管展示的图像质量良好并紧密遵循文本提示，但仍显现出机器生成的特征，未能如 Dall-E 3 和 Midjourney 7 等竞争对手那样吸引用户，尤其是在 AI 艺术热度减退的背景下。

谷歌推出了最新的文本到图像模型 Imagen 4，承诺相比前身 Imagen 3 “显著改善文本渲染”。此外，该公司还推出了一款名为 Imagen 4 Ultra 的豪华版，旨在更好地遵循精确的文本提示，适合愿意支付额外费用的用户。两个版本现在可以通过 Gemini API 进行付费预览，并在谷歌 AI Studio 进行有限的免费测试。

主要的 Imagen 4 模型被描述为“适合大多数任务的首选”，每张图像的价格为 0.04 美元。另一方面，Imagen 4 Ultra 旨在处理需要严格遵循详细说明的图像，提供与 Dall-E 和 Midjourney 等其他图像生成器相比“强大的”输出结果。该模型的成本提高了 50%，每张图像的价格为 0.06 美元。

该公司展示了多种图像，包括由 Imagen 4 Ultra 生成的三面漫画，描绘了一艘小飞船被一只巨大的蓝色生物攻击，伴随有“咔嚓！”和“有了！！”等音效。输出结果紧密遵循提示，类似于 3D 应用程序的卡通渲染。另一个提示请求生成一张关于京都的复古旅游明信片，结果准确地生产出来，但风格较为通用。尽管这些图像展示了良好的质量并遵循了文本提示，但仍然明显显得是机器生成的。总体来说，虽然 Imagen 4 代表了一定的改进，但似乎并未像 Dall-E 3 和 Midjourney 7 等市场领导者那样吸引用户，尤其是在对 AI 生成艺术的兴趣似乎因其在社交媒体广告中过度使用而减弱的情况下。

标签：模型谷歌 imagen 图像谷歌imagen

相关资讯更多>>
苹果研究揭示：大型语言模型存在重大AI推理缺陷

10-17 09:00
中信建投：海内外视频模型密集发布 API打开商业化空间

10-17 08:47
AI翻译界杀手诞生！阿里国际翻译大模型吊打谷歌和GPT-4

10-16 14:18
苹果研究揭示大型语言模型“推理”能力的深层缺陷

10-15 16:00
天玑9400全面支持全球主流大模型，深度优化体验更佳

10-15 11:16
谷歌提出RAG推理scaling laws；苹果推出多模态大语言模型MM-Ego｜大模型论文日报

10-11 14:30
强制谷歌交出私有AI模型数据？美政府要对谷歌进行重大拆分

10-10 19:42
果然视频|我爱你中国！AI同声大合唱，跨越时空的告白

10-01 08:03