近期,谷歌推出的一款具备照片编辑与合成图像生成能力的AI模型受到摄影爱好者关注,该模型官方名称为Gemini 2.5 Flash Image,此前曾有“Nano Banana”的相关称呼,目前不少用户开始尝试用它将普通照片转化为迷你人偶图像,成为新的创意创作方向。其实将照片转化为人偶图像并非全新形式,在2025年初,就有用户通过其他AI工具制作过类似效果的图像,而此次Gemini 2.5 Flash Image凭借更贴近真实场景的生成效果,逐渐走进更多摄影用户的视野。
照片原图
AI生成人偶图像
对于想要体验这一功能的摄影爱好者来说,操作路径并不复杂,可通过Gemini应用或访问Gemini官网来实现。具体操作时,首先需要上传想要转化的照片,随后输入对应的提示词即可启动生成流程,提示词也可根据个人创作需求进行调整。从实际使用反馈来看,参考提示词设置为“制作图中角色的1/7比例商业化手办,风格写实,置于真实环境中。手办放在电脑桌上,配有圆形透明亚克力底座,底座上无文字。电脑屏幕上显示的是该手办的3D建模过程。电脑屏幕旁有一个玩具包装盒,设计风格贴近高品质收藏级手办,印有原创图案,包装盒上有二维平面插图”时,生成的效果更符合多数用户对“真实场景人偶”的预期。
在实际操作过程中,选对照片是提升生成效果的关键环节。作为摄影从业者或爱好者,日常积累的高质量、光线充足、高分辨率照片在此时能发挥更大作用,这类照片能让AI更清晰地识别主体特征,进而生成细节更丰富的人偶图像。同时,若希望完整呈现主体的外观特点,选择目标对象的全身照会更合适,避免因主体局部缺失导致AI生成时出现特征偏差。
有用户分享过一组实操案例,其上传的源照片内容为浅色调瓷砖地面与木质橱柜为背景,画面中有一只棕色吉娃娃和一个大菠萝;通过Gemini 2.5 Flash Image生成的图像则呈现出更具场景感的效果——电脑桌上摆放着与照片中吉娃娃和菠萝对应的人偶,电脑屏幕里同步显示着这两个形象的图像,旁边还有一个印有该图像的产品包装盒,桌面上同时呈现出键盘、鼠标和杯子等物品,整体场景搭建完整,细节还原度较高,能直观体现出照片到人偶场景的转化价值。
除了通过Gemini应用和官网,谷歌还专门推出了一款可借助该AI模型编辑照片的网络工具,用户也可通过相关AI平台体验这一功能,多路径选择让不同使用习惯的用户都能找到适合自己的操作方式。从摄影创作角度来看,这一功能为摄影作品的二次创作提供了新思路,比如将人像摄影作品转化为人偶图像后,可用于制作个性化纪念周边;将风光摄影中的特色元素转化为人偶场景,能打造出更具创意的视觉作品;对于商业摄影从业者而言,还可借助该功能快速生成产品概念图,为客户呈现更丰富的方案构想。
值得注意的是,在使用该AI模型进行创作时,有几个细节需要摄影用户留意。一是照片背景的选择,尽量避免过于复杂的背景,减少AI识别主体时的干扰因素,若照片背景较杂乱,可先通过基础修图工具进行简化处理后再上传;二是提示词的精准度,尽量明确人偶的材质、比例、场景元素等关键信息,比如在提示词中补充“人偶材质为PVC质感,表面有轻微光泽”“电脑屏幕尺寸约为40厘米×25厘米”等细节描述,能让生成效果更贴近预期;三是生成后的调整,若首次生成的效果存在局部偏差,可针对偏差部分修改提示词后再次生成,比如“调整人偶的面部细节,使其更贴近照片中主体的五官特征”“优化包装盒上的图案色彩,使其与主体色调协调”。
从技术特点来看,Gemini 2.5 Flash Image在场景构建与细节还原上有一定优势,不仅能生成人偶主体,还能同步搭建与之匹配的周边环境,比如桌面、屏幕内容、包装等元素,让最终呈现的图像更具完整性和故事感,这对于追求“场景化表达”的摄影用户来说,能节省大量后期场景搭建的时间成本。同时,该模型对多主体同时转化的支持也较为友好,当照片中存在多个独立主体时,只要在提示词中明确各主体的对应关系,就能生成各主体协调共存的人偶场景,这为多元素摄影作品的二次创作提供了更多可能。
对于摄影行业而言,这类AI工具的出现并非替代传统摄影创作,而是为创作提供了新的辅助手段。摄影用户可借助其将脑海中的创意快速可视化,或为传统摄影作品赋予新的呈现形式,尤其对于非专业3D建模的摄影爱好者来说,无需掌握复杂的建模软件,仅通过照片和提示词就能实现“3D人偶场景”的创作,大大降低了创意落地的门槛。未来随着技术的不断优化,这类AI工具在细节还原、风格适配等方面或会有进一步提升,为摄影创作带来更多元的可能性。
目前,该AI模型的使用均为免费开放,用户无需额外付费即可体验基础的照片转人偶功能,对于有更高精度需求的用户,也可通过平台提供的进阶设置调整生成参数,进一步优化作品效果。对于摄影用户来说,不妨将其作为日常创意练习的工具,尝试将不同风格、不同主题的摄影作品转化为人偶图像,探索摄影创作与AI技术结合的更多有趣方向,为自己的创作积累新的灵感。