为什么大扩散模型不会背诵训练数据:两个时间尺度的隐式正则化
2023 年 Carlini 等人做了一件让 Stable Diffusion 团队和版权律师同时紧张的事:他们用一种"提示词反演"的攻击方法,从 Stable Diffusion 中逐像素重建出了部分训练图像,包括有身份的人脸和受版权保护的画作 [Carlini et al. 2023, USENIX]。论文里一张攻击图与训练原图的对照让人发凉——大模型确实在"背诵"。 ...
2023 年 Carlini 等人做了一件让 Stable Diffusion 团队和版权律师同时紧张的事:他们用一种"提示词反演"的攻击方法,从 Stable Diffusion 中逐像素重建出了部分训练图像,包括有身份的人脸和受版权保护的画作 [Carlini et al. 2023, USENIX]。论文里一张攻击图与训练原图的对照让人发凉——大模型确实在"背诵"。 ...