Abstract not available.
广告图像生成日益关注点击率等在线指标,但现有方法采用“一刀切”策略,仅优化整体点击率,忽视了用户群体间的偏好多样性。这导致特定群体的表现欠佳,限制了定向营销的效果。为弥补这一差距,我们提出了《一图多配》统一框架,旨在协调大规模广告图像生成中多样化的群体点击偏好。该框架首先进行产品感知的自适应分组,根据用户属性和产品特征动态组织用户,并用丰富的集体偏好特征表示每个群体。基于这些分组,偏好条件图像生成采用群体感知多模态大语言模型,为每个群体生成定制化图像。该模型经过预训练,能同时理解群体特征并生成广告图像。随后,我们使用提出的群体偏好优化方法对模型进行微调,以协调群体偏好,有效提升各群体在生成图像上的点击率。为推进该领域发展,我们引入了分组广告图像偏好数据集,这是首个大规模公开的群体图像偏好数据集,包含基于4000万用户构建的约60万个群体。大量实验表明,我们的框架在离线和在线场景下均实现了最先进的性能。代码和数据集将在https://github.com/JD-GenX/OSMF发布。