金融界2025年5月27日消息,国家知识产权局信息显示,谷歌有限责任公司申请一项名为“经由扩散模型的图像特定微调的文本驱动图像编辑”的专利,公开号CN120051803A,申请日期为2023年10月。
专利摘要显示,提供了用于通用文本驱动图像编辑的系统和方法,这些系统和方法的示例实现方式可以称为“UniTune”。UniTune可以接收任意图像和文本编辑描述作为输入,并且可以在保持对输入图像的高语义和视觉保真度的同时执行编辑。UniTune不需要如遮罩或草图的任何额外输入。根据本公开的一个方面,通过正确选择参数,本文所描述的示例系统可以在单个图像上微调大型扩散模型(例如,Imagen),从而促使模型在视觉和语义上保持对输入图像的保真度,同时仍允许表现性操作。