高斯噪声
1. 什么是“高斯噪声”?
想象一下,你往照片上非常均匀地撒上一层极细的、有黑有白的沙子。
- 这些沙子有的是深色的(会使像素变暗),有的是浅色的(会使像素变亮)。
- 大部分沙子都是接近灰色的(对像素改变很小),只有极少数是纯黑或纯白的(对像素改变很大)。
- 平均来看,撒上沙子后照片的整体亮度不会变,因为深色和浅色的沙子数量差不多。
这就是高斯噪声的特点。在数学上,我们为每个像素生成一个随机数,这个随机数来自于均值为0的高斯分布(正态分布)。
- 均值为0:意味着这个随机数有同等概率为正(调亮像素)或为负(调暗像素),其期望效果是不会系统性地把整张图调亮或调暗。
- 高斯分布:意味着大多数随机数的绝对值都很小(微小的亮度调整),而绝对值很大的数(剧烈的亮度调整)非常罕·见。
效果:给图像添加一层看起来非常自然的、随机的“颗粒感”或“噪点”,就像老旧电视的雪花信号一样。
2. 什么是“独立地”添加?
“独立地”(Independently)意味着我们对每个像素的操作都是互不相干的。
继续用撒沙子的比喻:你给照片左上角的像素撒什么颜色的沙子,完全不影响你给它旁边的像素或者右下角的像素撒什么颜色的沙子。它们是两次完全独立的“撒沙子”事件。
计算机的操作是:
处理第一个像素:生成一个随机噪声值,加到这个像素上。
处理第二个像素:重新生成一个全新的、完全不相关的随机噪声值,加到这个像素上。
...
对图像中的几百万个像素,重复这个过程几百万次。
为什么这很重要? 因为如果噪声不是独立的(比如,噪声形成了一块一块的团状或条纹),那噪声本身就有了“结构”。我们希望加的噪声是完全无结构的,这样最终图像剩下的唯一结构就来自于原始图像。这使得模型在后续“去噪”时,只需要学习如何恢复图像结构,而不需要学习如何去除噪声的结构。
3. 什么是“强度为 βt”?
“强度”(Intensity)在这里指的就是噪声的剧烈程度,在数学上对应了高斯分布的方差(Variance),也就是 βt。
小的 βt (强度弱):
想象一下,你撒的沙子颜色都非常接近灰色,只有极淡的黑白之分。
这意味着生成的随机数范围很小(比如在-5到+5之间)。
效果:对图像的改变非常微弱,只是增加了一点点几乎看不见的颗粒感。这通常发生在加噪过程的早期步骤(如 t=1, 2, ...)。
大的 βt (强度强):
想象一下,你撒的沙子颜色从纯黑到纯白都有,色彩非常丰富。
这意味着生成的随机数范围很大(比如在-50到+50之间)。
效果:对图像的改变非常剧烈,原始图像的细节被严重破坏,看起来噪声非常大。这通常发生在加噪过程的后期步骤。
βt 是一个预先设定的“时间表”,它控制着在每一步 t 加入噪声的强度,从 β1 的非常弱,到 βT 的非常强。
总结
所以,“给每个像素独立地添加一个强度为 βt 的高斯噪声” 这句话的完整执行过程是:
对于图像中的每一个像素,计算机都会:
生成一个随机数:这个数来自一个均值为0,方差为 βt 的高斯分布。
更新像素值:将这个随机数加到该像素原来的值上。
对所有像素重复此操作:并且每次都生成一个全新的随机数。
最终的效果就是在整个图像上均匀地叠加了一层特定强度的、无结构的随机噪点。