计算两幅图像的相似度（PSNR、SSIM、MSE、余弦相似度、MD5、直方图、互信息、Hash）& 代码实现与举例

2022-11-21 14:06 1553人阅读评论(0)

MSE（Mean Squared Error）均方误差

MSE公式

MSE 计算模型的预测 Ŷ 与真实标签 Y 的接近程度。公式表示为：

对于两个m×n的单通道图像I和K，它们的均方误差可定义为：

优点：MSE的函数曲线光滑、连续，处处可导，便于使用梯度下降算法，是一种常用的损失函数。而且，随着误差的减小，梯度也在减小，这有利于收敛，即使使用固定的学习速率，也能较快的收敛到最小值。

缺点：当真实值y和预测值f(x)的差值大于1时，会放大误差；而当差值小于1时，则会缩小误差，这是平方运算决定的。MSE对于较大的误差(>1)给予较大的惩罚，较小的误差(<1）给予较小的惩罚。也就是说，对离群点比较敏感，受其影响较大。

代码实现


  
   
    
     
    
    
     
      # MSE
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 方法一：自定义函数
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      import numpy 
      as np
     
    
   
    
     
    
    
     
      def 
      MSE(
      img1,img2):
     
    
   
    
     
    
    
     
          mse = np.mean( (img1 - img2) ** 
      2 )
     
    
   
    
     
    
    
         
      return mse
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 方法二：调用库函数
     
    
   
    
     
    
    
     
      # 老版本的scikit-image，加载SSIM、PSNR、MSE的方式：
     
    
   
    
     
    
    
     
      from skimage.measure 
      import compare_mse 
      as mse
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 新版本的scikit-image，加载方式：
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import mean_squared_error 
      as mse

PSNR（Peak Signal-to-Noise Ratio）峰值信噪比

PSNR(Peak Signal to Noise Ratio)，峰值信噪比，是一种评价图像的客观标准。，应用场景有很多。它具有局性，PSNR是“Peak Signal to Noise Ratio”的缩写。peak的中文意思是顶点。而ratio的意思是比率或比列的。整个意思就是到达噪音比率的顶点信号，psnr一般是用于最大值信号和背景噪音之间的一个工程项目。通常在经过影像压缩之后，通常输出的影像都会在某种程度与原始影像不同。为了衡量经过处理后的影像品质，通常会参考PSNR值来衡量某个处理程序能否令人满意。它是原图像与被处理图像之间的均方误差相对于(2n-1)2的对数值(信号最大值的平方，n是每个采样值的比特数)，它的单位是dB。

PSNR是最普遍和使用最为广泛的一种图像客观评价指标，然而它是基于对应像素点间的误差，即基于误差敏感的图像质量评价。由于并未考虑到人眼的视觉特性（人眼对空间频率较低的对比差异敏感度较高，人眼对亮度对比差异的敏感度较色度高，人眼对一个区域的感知结果会受到其周围邻近区域的影响等），因而经常出现评价结果与人的主观感觉不一致的情况。

PSNR公式

PSNR是通过MSE得出来的，公式如下：

其中，MAXI是表示图像点颜色的最大数值，如果每个采样点用 8 位表示，那么就是 255。

所以MSE越小，则PSNR越大；所以PSNR越大，代表着图像质量越好。一般来说，

PSNR高于40dB说明图像质量极好（即非常接近原始图像）；
在30—40dB通常表示图像质量是好的（即失真可以察觉但可以接受）；
在20—30dB说明图像质量差；
最后，PSNR低于20dB图像不可接受。

代码实现


  
   
    
     
    
    
     
      # PSNR
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 方法一：自定义函数 
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      import numpy
     
    
   
    
     
    
    
     
      import math
     
    
   
    
     
    
    
     
      def 
      psnr(
      img1, img2):
     
    
   
    
     
    
    
     
          mse = numpy.mean( (img1 - img2) ** 
      2 )
     
    
   
    
     
    
    
         
      if mse == 
      0:
     
    
   
    
     
    
    
             
      return 
      100
     
    
   
    
     
    
    
     
          PIXEL_MAX = 
      255.0
     
    
   
    
     
    
    
         
      return 
      20 * math.log10(PIXEL_MAX / math.sqrt(mse))
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 方法二：调用库函数
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 老版本的scikit-image，加载SSIM、PSNR、MSE的方式：
     
    
   
    
     
    
    
     
      from skimage.measure 
      import compare_ssim 
      as ssim
     
    
   
    
     
    
    
     
      from skimage.measure 
      import compare_psnr 
      as psnr
     
    
   
    
     
    
    
     
      from skimage.measure 
      import compare_mse 
      as mse
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 新版本的scikit-image，加载方式：
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import structural_similarity 
      as ssim
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import peak_signal_noise_ratio 
      as psnr
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import mean_squared_error 
      as mse

SSIM（structural similarity）结构相似性

SSIM(structural similarity)，结构相似性，是一种衡量两幅图像相似度的指标。

SSIM算法主要用于检测两张相同尺寸的图像的相似度、或者检测图像的失真程度。

SSIM公式基于样本x和y之间的三个比较衡量：亮度 (luminance)、对比度 (contrast) 和结构 (structure)。

SSIM公式

常数𝑪𝟏， 𝑪𝟐， 𝑪𝟑是为了避免当分母为 0 时造成的不稳定问题。
𝝁𝒙为均值， 𝝈𝒙 为方差， 𝝈𝒙𝒚 表示协方差。

SSIM取值范围为[0,1]，值越大表示输出图像和无失真图像的差距越小，即图像质量越好。

缺点：结构相似性指标有其限制，对于影像出现位移、缩放、旋转（皆属于非结构性的失真）的情况无法有效的运作。

代码实现


  
   
    
     
    
    
     
      # SSIM
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 方法一：自定义函数
     
    
   
    
     
    
    
     
      # 很奇怪，计算出来和调用函数结果差异很大，建议直接调用函数
     
    
   
    
     
    
    
     
      import numpy 
      as np
     
    
   
    
     
    
    
     
      def 
      ssim(
      y_true , y_pred):
     
    
   
    
     
    
    
     
          u_true = np.mean(y_true)
     
    
   
    
     
    
    
     
          u_pred = np.mean(y_pred)
     
    
   
    
     
    
    
     
          var_true = np.var(y_true)
     
    
   
    
     
    
    
     
          var_pred = np.var(y_pred)
     
    
   
    
     
    
    
     
          std_true = np.sqrt(var_true)
     
    
   
    
     
    
    
     
          std_pred = np.sqrt(var_pred)
     
    
   
    
     
    
    
     
          c1 = np.square(
      0.01*
      7)
     
    
   
    
     
    
    
     
          c2 = np.square(
      0.03*
      7)
     
    
   
    
     
    
    
     
          ssim = (
      2 * u_true * u_pred + c1) * (
      2 * std_pred * std_true + c2)
     
    
   
    
     
    
    
     
          denom = (u_true ** 
      2 + u_pred ** 
      2 + c1) * (var_pred + var_true + c2)
     
    
   
    
     
    
    
         
      return ssim / denom
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 方法二：调用库函数
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 老版本的scikit-image，加载SSIM、PSNR、MSE的方式：
     
    
   
    
     
    
    
     
      from skimage.measure 
      import compare_ssim 
      as ssim
     
    
   
    
     
    
    
     
      from skimage.measure 
      import compare_psnr 
      as psnr
     
    
   
    
     
    
    
     
      from skimage.measure 
      import compare_mse 
      as mse
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 新版本的scikit-image，加载方式：
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import structural_similarity 
      as ssim
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import peak_signal_noise_ratio 
      as psnr
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import mean_squared_error 
      as mse

函数 structural_similarity


  
   
    
     
    
    
     
      def 
      structural_similarity(
      *, im1, im2,
     
    
   
    
     
    
    
     
       win_size=None, gradient=False, data_range=None,
     
    
   
    
     
    
    
     
       multichannel=False, gaussian_weights=False,
     
    
   
    
     
    
    
     
       full=False, **kwargs)

处理RGB等多通道图像或划分为多块时

上述原始计算方式仅法针对单通道灰度图，

求RGB图或多通道图时，PSNR有三种方式，其他类似：

分别计算 RGB 三个通道的 PSNR，然后取平均值。
计算 RGB 三通道的 MSE ，然后再除以 3 。
将图片转化为 YCbCr 格式，然后只计算 Y 分量也就是亮度分量的 PSNR。

分为多块时，在实际应用中，可以利用滑动窗将图像分块，令分块总数为N，考虑到窗口形状对分块的影响，采用高斯加权计算每一窗口的均值、方差以及协方差，然后计算对应块的结构相似度SSIM，最后将平均值作为两图像的结构相似性度量，即平均结构相似性SSIM。

例：计算两个RGB图像的MSE（均方误差）：

‎从红色通道开始‎；
‎计算两个图像的红色通道中每个像素的灰度值之间的差异（所有像素位置的(redA(0,0)-redB(0,0)等）；
‎对每个像素的差异进行平方 (redA(0,0)-redB(0,0)^2；
‎计算红色通道中所有像素的平方差之和‎；
‎对绿色和蓝色通道重复上述操作‎；
‎将 3 个通道的总和相加并除以 3，即（红色通道和+绿色通道和+蓝色通道和）/ 3‎；
‎除以图像面积（宽度高度）‎‎以形成平均值或平均值，即（红和+绿和+蓝和）/（3* 宽度*高度）‎‎= MSE‎。

余弦相似度

把图片表示成一个向量，通过计算向量之间的余弦距离来表征两张图片的相似度。

余弦相似度算法：一个向量空间中两个向量夹角间的余弦值作为衡量两个个体之间差异的大小，余弦值接近1，夹角趋于0，表明两个向量越相似，余弦值接近于0，夹角趋于90度，表明两个向量越不相似。

余弦公式

代码实现

图片相似度计算方法总结 - 知乎 (zhihu.com)


  
   
    
     
    
    
     
      # -*- coding: utf-8 -*-
     
    
   
    
     
    
    
     
      # !/usr/bin/env python
     
    
   
    
     
    
    
     
      # 余弦相似度计算
     
    
   
    
     
    
    
     
      from PIL 
      import Image
     
    
   
    
     
    
    
     
      from numpy 
      import average, dot, linalg
     
    
   
    
     
    
    
     
      # 对图片进行统一化处理
     
    
   
    
     
    
    
     
      def 
      get_thum(
      image, size=(64, 64), greyscale=False):
     
    
   
    
     
    
    
         
      # 利用image对图像大小重新设置, Image.ANTIALIAS为高质量的
     
    
   
    
     
    
    
     
          image = image.resize(size, Image.ANTIALIAS)
     
    
   
    
     
    
    
         
      if greyscale:
     
    
   
    
     
    
    
             
      # 将图片转换为L模式，其为灰度图，其每个像素用8个bit表示
     
    
   
    
     
    
    
     
              image = image.convert(
      'L')
     
    
   
    
     
    
    
         
      return image
     
    
   
    
     
    
    
     
      # 计算图片的余弦距离
     
    
   
    
     
    
    
     
      def 
      image_similarity_vectors_via_numpy(
      image1, image2):
     
    
   
    
     
    
    
     
          image1 = get_thum(image1)
     
    
   
    
     
    
    
     
          image2 = get_thum(image2)
     
    
   
    
     
    
    
     
          images = [image1, image2]
     
    
   
    
     
    
    
     
          vectors = []
     
    
   
    
     
    
    
     
          norms = []
     
    
   
    
     
    
    
         
      for image 
      in images:
     
    
   
    
     
    
    
     
              vector = []
     
    
   
    
     
    
    
             
      for pixel_tuple 
      in image.getdata():
     
    
   
    
     
    
    
     
                  vector.append(average(pixel_tuple))
     
    
   
    
     
    
    
     
              vectors.append(vector)
     
    
   
    
     
    
    
             
      # linalg=linear（线性）+algebra（代数），norm则表示范数
     
    
   
    
     
    
    
             
      # 求图片的范数
     
    
   
    
     
    
    
     
              norms.append(linalg.norm(vector, 
      2))
     
    
   
    
     
    
    
     
          a, b = vectors
     
    
   
    
     
    
    
     
          a_norm, b_norm = norms
     
    
   
    
     
    
    
         
      # dot返回的是点积，对二维数组（矩阵）进行计算
     
    
   
    
     
    
    
     
          res = dot(a / a_norm, b / b_norm)
     
    
   
    
     
    
    
         
      return res
     
    
   
    
     
    
    
     
      image1 = Image.
      open(
      '010.jpg')
     
    
   
    
     
    
    
     
      image2 = Image.
      open(
      '011.jpg')
     
    
   
    
     
    
    
     
      cosin = image_similarity_vectors_via_numpy(image1, image2)
     
    
   
    
     
    
    
     
      print(
      '图片余弦相似度', cosin)

哈希相似度 Hash

图片相相似度计算（Hash、SSIM、compareHist）_南苏月的博客-CSDN博客_图像相似度计算公式

哈希算法-图片相似度计算_chenghaoy的博客-CSDN博客_均值哈希算法相似度

实现图片相似度比较的hash算法有三种：均值哈希算法（AHash），差值哈希算法（DHash），感知哈希算法（PHash）。

aHash：平均值哈希。速度比较快，但是常常不太精确。
pHash：感知哈希。精确度比较高，但是速度方面较差一些。
dHash：差异值哈希。精确度较高，且速度也非常快。

哈希不是以严格的方式计算Hash值，而是以更加相对的方式计算哈希值，因为“相似”与否，就是一种相对的判定。值哈希算法、差值哈希算法和感知哈希算法都是值越小，相似度越高，取值为0-64，即汉明距离中，64位的hash值有多少不同。三直方图和单通道直方图的值为0-1，值越大，相似度越高。

均值哈希算法（AHash）

一张图片就是一个二维信号，它包含了不同频率的成分。亮度变化小的区域是低频成分，它描述大范围的信息。而亮度变化剧烈的区域（比如物体的边缘）就是高频的成分，它描述具体的细节。或者说高频可以提供图片详细的信息，而低频可以提供一个框架。而一张大的，详细的图片有很高的频率，而小图片缺乏图像细节，所以都是低频的。所以我们平时的下采样，也就是缩小图片的过程，实际上是损失高频信息的过程。均值哈希算法就是利用图片的低频信息。
具体步骤：

缩小尺寸：将图片缩小到8x8的尺寸，总共64个像素。这一步的作用是去除图片的细节，只保留结构、明暗等基本信息，摒弃不同尺寸、比例带来的图片差异。
简化色彩：将缩小后的图片，转为64级灰度。也就是说，所有像素点总共只有64种颜色。
计算平均值：计算所有64个像素的灰度平均值
比较像素的灰度：将每个像素的灰度，与平均值进行比较。大于或等于平均值，记为1；小于平均值，记为0。
计算哈希值：将上一步的比较结果，组合在一起，就构成了一个64位的整数，这就是这张图片的指纹。组合的次序并不重要，只要保证所有图片都采用同样次序就行了。

最后得到两张图片的指纹信息后，计算两组64位数据的汉明距离，即对比数据不同的位数，不同位数越少，表明图片的相似度越大。
分析：均值哈希算法计算速度快，不受图片尺寸大小的影响，但是缺点就是对均值敏感，例如对图像进行伽马校正或直方图均衡就会影响均值，从而影响最终的hash值。

感知哈希算法（PHash）

感知哈希算法是一个比均值哈希算法更为健壮的一种算法，与均值哈希算法的区别在于感知哈希算法是通过DCT（离散余弦变换）来获取图片的低频信息。
离散余弦变换（DCT）是种图像压缩算法，它将图像从像素域变换到频率域。然后一般图像都存在很多冗余和相关性的，所以转换到频率域之后，只有很少的一部分频率分量的系数才不为0，大部分系数都为0（或者说接近于0）。经过DCT变换后的系数矩阵从左上角到右下角频率越来越高，因此图片的能量主要保留在左上角的低频系数上了。
具体步骤：

缩小尺寸：pHash以小图片开始，但图片大于8x8，32x32是最好的。这样做的目的是简化了DCT的计算，而不是减小频率。
简化色彩：将图片转化成灰度图像，进一步简化计算量。
计算DCT：计算图片的DCT变换，得到32x32的DCT系数矩阵。
缩小DCT：虽然DCT的结果是32x32大小的矩阵，但我们只要保留左上角的8x8的矩阵，这部分呈现了图片中的最低频率。
计算平均值：如同均值哈希一样，计算DCT的均值。
计算hash值：这是最主要的一步，根据8x8的DCT矩阵，设置0或1的64位的hash值，大于等于DCT均值的设为”1”，小于DCT均值的设为“0”。组合在一起，就构成了一个64位的整数，这就是这张图片的指纹。

分析：结果并不能告诉我们真实性的低频率，只能粗略地告诉我们相对于平均值频率的相对比例。只要图片的整体结构保持不变，hash结果值就不变。能够避免伽马校正或颜色直方图被调整带来的影响。对于变形程度在25%以内的图片也能精准识别。

差值哈希算法（DHash）

比pHash，dHash的速度要快的多，相比aHash，dHash在效率几乎相同的情况下的效果要更好，它是基于渐变实现的。
主要步骤：

缩小尺寸：收缩到8x9（高x宽）的大小，一遍它有72的像素点
转化为灰度图：把缩放后的图片转化为256阶的灰度图。
计算差异值：dHash算法工作在相邻像素之间，这样每行9个像素之间产生了8个不同的差异，一共8行，则产生了64个差异值
获得指纹：如果左边的像素比右边的更亮，则记录为1，否则为0.

代码实现


  
   
    
     
    
    
     
      import cv2
     
    
   
    
     
    
    
     
      import numpy 
      as np
     
    
   
    
     
    
    
     
      #感知哈希算法
     
    
   
    
     
    
    
     
      def 
      pHash(
      image): 
     
    
   
    
     
    
    
     
          image = cv2.resize(image,(
      32,
      32), interpolation=cv2.INTER_CUBIC) 
     
    
   
    
     
    
    
     
          image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY) 
     
    
   
    
     
    
    
     
      # cv2.imshow('image', image)
     
    
   
    
     
    
    
     
      # cv2.waitKey(0)
     
    
   
    
     
    
    
     
      # cv2.destroyAllWindows()
     
    
   
    
     
    
    
         
      # 将灰度图转为浮点型，再进行dct变换 
     
    
   
    
     
    
    
     
          dct = cv2.dct(np.float32(image))
     
    
   
    
     
    
    
     
      # print(dct)
     
    
   
    
     
    
    
         
      # 取左上角的8*8，这些代表图片的最低频率 
     
    
   
    
     
    
    
         
      # 这个操作等价于c++中利用opencv实现的掩码操作 
     
    
   
    
     
    
    
         
      # 在python中进行掩码操作，可以直接这样取出图像矩阵的某一部分 
     
    
   
    
     
    
    
     
          dct_roi = dct[
      0:
      8,
      0:
      8]  
     
    
   
    
     
    
    
     
          avreage = np.mean(dct_roi) 
     
    
   
    
     
    
    
         
      hash = [] 
     
    
   
    
     
    
    
         
      for i 
      in 
      range(dct_roi.shape[
      0]): 
     
    
   
    
     
    
    
             
      for j 
      in 
      range(dct_roi.shape[
      1]): 
     
    
   
    
     
    
    
                 
      if dct_roi[i,j] > avreage: 
     
    
   
    
     
    
    
                     
      hash.append(
      1) 
     
    
   
    
     
    
    
                 
      else: 
     
    
   
    
     
    
    
                     
      hash.append(
      0) 
     
    
   
    
     
    
    
         
      return 
      hash
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #均值哈希算法
     
    
   
    
     
    
    
     
      def 
      aHash(
      image):
     
    
   
    
     
    
    
         
      #缩放为8*8
     
    
   
    
     
    
    
     
          image=cv2.resize(image,(
      8,
      8),interpolation=cv2.INTER_CUBIC)
     
    
   
    
     
    
    
         
      #转换为灰度图
     
    
   
    
     
    
    
     
          image=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
     
    
   
    
     
    
    
     
          avreage = np.mean(image) 
     
    
   
    
     
    
    
         
      hash = [] 
     
    
   
    
     
    
    
         
      for i 
      in 
      range(image.shape[
      0]): 
     
    
   
    
     
    
    
             
      for j 
      in 
      range(image.shape[
      1]): 
     
    
   
    
     
    
    
                 
      if image[i,j] > avreage: 
     
    
   
    
     
    
    
                     
      hash.append(
      1) 
     
    
   
    
     
    
    
                 
      else: 
     
    
   
    
     
    
    
                     
      hash.append(
      0) 
     
    
   
    
     
    
    
         
      return 
      hash
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #差值感知算法
     
    
   
    
     
    
    
     
      def 
      dHash(
      image):
     
    
   
    
     
    
    
         
      #缩放9*8
     
    
   
    
     
    
    
     
          image=cv2.resize(image,(
      9,
      8),interpolation=cv2.INTER_CUBIC)
     
    
   
    
     
    
    
         
      #转换灰度图
     
    
   
    
     
    
    
     
          image=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
     
    
   
    
     
    
    
     
      # print(image.shape)
     
    
   
    
     
    
    
         
      hash=[]
     
    
   
    
     
    
    
         
      #每行前一个像素大于后一个像素为1，相反为0，生成哈希
     
    
   
    
     
    
    
         
      for i 
      in 
      range(
      8):
     
    
   
    
     
    
    
             
      for j 
      in 
      range(
      8):
     
    
   
    
     
    
    
                 
      if image[i,j]>image[i,j+
      1]:
     
    
   
    
     
    
    
                     
      hash.append(
      1)
     
    
   
    
     
    
    
                 
      else:
     
    
   
    
     
    
    
                     
      hash.append(
      0)
     
    
   
    
     
    
    
         
      return 
      hash
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      #计算汉明距离
     
    
   
    
     
    
    
     
      def 
      Hamming_distance(
      hash1,hash2): 
     
    
   
    
     
    
    
     
          num = 
      0
     
    
   
    
     
    
    
         
      for index 
      in 
      range(
      len(hash1)): 
     
    
   
    
     
    
    
             
      if hash1[index] != hash2[index]: 
     
    
   
    
     
    
    
     
                  num += 
      1
     
    
   
    
     
    
    
         
      return num
     
    
   
    
     
    
    
     
      if __name__ == 
      "__main__":
     
    
   
    
     
    
    
     
          image_file1 = 
      './data/cartoon1.jpg'
     
    
   
    
     
    
    
     
          image_file2 = 
      './data/cartoon3.jpg'
     
    
   
    
     
    
    
     
          img1 = cv2.imread(image_file1)
     
    
   
    
     
    
    
     
          img2 = cv2.imread(image_file2)
     
    
   
    
     
    
    
     
          hash1 = pHash(img1)
     
    
   
    
     
    
    
     
          hash2 = pHash(img2)
     
    
   
    
     
    
    
     
          dist = Hamming_distance(hash1, hash2)
     
    
   
    
     
    
    
         
      #将距离转化为相似度
     
    
   
    
     
    
    
     
          similarity = 
      1 - dist * 
      1.0 / 
      64 
     
    
   
    
     
    
    
         
      print(dist)
     
    
   
    
     
    
    
         
      print(similarity)

直方图距离

图片的相似度--直方图距离 - 知乎 (zhihu.com)

直方图距离描述

方法描述：按照某种距离度量的标准对两幅图像的直方图进行相似度的测量。

图像直方图丰富的图像细节信息，反映了图像像素点的概率分布情况，统计每一个像素点强度值具有的像素个数。

优点：计算量比较小。
缺点：直方图反应的是图像灰度值得概率分布，并没有图像的空间位置信息在里面，因此，会出现误判；比如纹理结构相同，但明暗不同的图像，应该相似度很高，但实际结果是相似度很低，而纹理结构不同，但明暗相近的图像，相似度却很高。

计算步骤：

将图片resize，得到相同大小的图片；
将图片灰度，灰度后图片的像素在[0-255]之间；
计算图片的直方图数据，统计相同像素点的概率分布；
根据相关性计算公式，计算两个图片直方图的相关性。

代码实现


  
   
    
     
    
    
     
      import cv2
     
    
   
    
     
    
    
     
      def 
      calculate(
      image1, image2):
     
    
   
    
     
    
    
         
      # 灰度直方图算法
     
    
   
    
     
    
    
         
      # 计算单通道的直方图的相似值
     
    
   
    
     
    
    
     
          hist1 = cv2.calcHist([image1], [
      0], 
      None, [
      256], [
      0.0, 
      255.0])
     
    
   
    
     
    
    
     
          hist2 = cv2.calcHist([image2], [
      0], 
      None, [
      256], [
      0.0, 
      255.0])
     
    
   
    
     
    
    
         
      # 计算直方图的重合度
     
    
   
    
     
    
    
     
          degree = 
      0
     
    
   
    
     
    
    
         
      for i 
      in 
      range(
      len(hist1)):
     
    
   
    
     
    
    
             
      if hist1[i] != hist2[i]:
     
    
   
    
     
    
    
     
                  degree = degree + (
      1 - 
      abs(hist1[i] - hist2[i]) / 
      max(hist1[i], hist2[i]))
     
    
   
    
     
    
    
             
      else:
     
    
   
    
     
    
    
     
                  degree = degree + 
      1
     
    
   
    
     
    
    
     
          degree = degree / 
      len(hist1)
     
    
   
    
     
    
    
         
      return degree
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      classify_hist_with_split(
      image1, image2, size=(256, 256)):
     
    
   
    
     
    
    
         
      # RGB每个通道的直方图相似度
     
    
   
    
     
    
    
         
      # 将图像resize后，分离为RGB三个通道，再计算每个通道的相似值
     
    
   
    
     
    
    
     
          image1 = cv2.resize(image1, size)
     
    
   
    
     
    
    
     
          image2 = cv2.resize(image2, size)
     
    
   
    
     
    
    
     
          sub_image1 = cv2.split(image1)
     
    
   
    
     
    
    
     
          sub_image2 = cv2.split(image2)
     
    
   
    
     
    
    
     
          sub_data = 
      0
     
    
   
    
     
    
    
         
      for im1, im2 
      in 
      zip(sub_image1, sub_image2):
     
    
   
    
     
    
    
     
              sub_data += calculate(im1, im2)
     
    
   
    
     
    
    
     
          sub_data = sub_data / 
      3
     
    
   
    
     
    
    
         
      return sub_data

互信息（Mutual Information）

归一化互信息(NMI)评价指标_易_的博客-CSDN博客_nmi指标

信息熵、相对熵、互信息

信息熵：对信息进行量化度量。可以理解为某种特定信息的出现概率。

相对熵：（relative entropy），又被称为Kullback-Leibler散度（Kullback-Leibler divergence，KL散度）或信息散度（information divergence），是两个概率分布（probability distribution）间差异的非对称性度量。在在信息理论中，相对熵等价于两个概率分布的信息熵（Shannon entropy）的差值。

互信息：(Mutual Information)是信息论里一种有用的信息度量，它可以看成是一个随机变量中包含的关于另一个随机变量的信息量，或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性。

归一化互信息：将互信息放在[0,1]之间，容易评价算法的好坏。

代码实现


  
   
    
     
    
    
     
      from sklearn 
      import metrics 
      as mr
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      img1 = cv2.imread(
      '1.png')
     
    
   
    
     
    
    
     
      img2 = cv2.imread(
      '2.png')
     
    
   
    
     
    
    
     
      img2 = cv2.resize(img2, (img1.shape[
      1], img1.shape[
      0])
     
    
   
    
     
    
    
     
      nmi = mr.normalized_mutual_info_score(img1.reshape(-
      1), img2.reshape(-
      1))

像素匹配 pixelmatch

GitHub - whtsky/pixelmatch-py: A fast pixel-level image comparison library, originally created to compare screenshots in tests.

利用像素之间的匹配来计算相似度


  
   
    
     
    
    
     
      # https://github.com/whtsky/pixelmatch-py
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 第一步：
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      pip install pixelmatch
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 第二步：
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      from PIL 
      import Image
     
    
   
    
     
    
    
     
      from pixelmatch.contrib.PIL 
      import pixelmatch
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      img_a = Image.
      open(
      "a.png")
     
    
   
    
     
    
    
     
      img_b = Image.
      open(
      "b.png")
     
    
   
    
     
    
    
     
      img_diff = Image.new(
      "RGBA", img_a.size)
     
    
   
    
     
    
    
     
      # note how there is no need to specify dimensions
     
    
   
    
     
    
    
     
      mismatch = pixelmatch(img_a, img_b, img_diff, includeAA=
      True)
     
    
   
    
     
    
    
     
      img_diff.save(
      "diff.png")

举例1——使用四种方法计算图片相似度：MD5、直方图、PSNR、SSIM

有史以来最全的图像相似度算法_小殊小殊的博客-CSDN博客_图片相似度

使用四种方法计算图片相似度：MD5（粗暴的md5比较，判断是否完全相同）、直方图、PSNR、SSIM。


  
   
    
     
    
    
     
      import numpy 
      as np
     
    
   
    
     
    
    
     
      from PIL 
      import Image
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import structural_similarity
     
    
   
    
     
    
    
     
      import cv2
     
    
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
     
      import hashlib
     
    
   
    
     
    
    
     
      import math
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      '''
     
    
   
    
     
    
    
     
       粗暴的md5比较 返回是否完全相同
     
    
   
    
     
    
    
     
      '''
     
    
   
    
     
    
    
     
      def 
      md5_similarity(
      img1_path, img2_path):
     
    
   
    
     
    
    
     
          file1 = 
      open(img1_path, 
      "rb")
     
    
   
    
     
    
    
     
          file2 = 
      open(img2_path, 
      "rb")
     
    
   
    
     
    
    
     
          md = hashlib.md5()
     
    
   
    
     
    
    
     
          md.update(file1.read())
     
    
   
    
     
    
    
     
          res1 = md.hexdigest()
     
    
   
    
     
    
    
     
          md = hashlib.md5()
     
    
   
    
     
    
    
     
          md.update(file2.read())
     
    
   
    
     
    
    
     
          res2 = md.hexdigest()
     
    
   
    
     
    
    
         
      return res1 == res2
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      normalize(
      data):
     
    
   
    
     
    
    
         
      return data / np.
      sum(data)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      '''
     
    
   
    
     
    
    
     
       直方图相似度
     
    
   
    
     
    
    
     
       相关性比较 cv2.HISTCMP_CORREL：值越大，相似度越高
     
    
   
    
     
    
    
     
       相交性比较 cv2.HISTCMP_INTERSECT：值越大，相似度越高
     
    
   
    
     
    
    
     
       卡方比较 cv2.HISTCMP_CHISQR：值越小，相似度越高
     
    
   
    
     
    
    
     
       巴氏距离比较 cv2.HISTCMP_BHATTACHARYYA：值越小，相似度越高
     
    
   
    
     
    
    
     
      '''
     
    
   
    
     
    
    
     
      def 
      hist_similarity(
      img1, img2, hist_size=256):
     
    
   
    
     
    
    
     
          imghistb1 = cv2.calcHist([img1], [
      0], 
      None, [hist_size], [
      0, 
      256])
     
    
   
    
     
    
    
     
          imghistg1 = cv2.calcHist([img1], [
      1], 
      None, [hist_size], [
      0, 
      256])
     
    
   
    
     
    
    
     
          imghistr1 = cv2.calcHist([img1], [
      2], 
      None, [hist_size], [
      0, 
      256])
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          imghistb2 = cv2.calcHist([img2], [
      0], 
      None, [hist_size], [
      0, 
      256])
     
    
   
    
     
    
    
     
          imghistg2 = cv2.calcHist([img2], [
      1], 
      None, [hist_size], [
      0, 
      256])
     
    
   
    
     
    
    
     
          imghistr2 = cv2.calcHist([img2], [
      2], 
      None, [hist_size], [
      0, 
      256])
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          distanceb = cv2.compareHist(normalize(imghistb1), normalize(imghistb2), cv2.HISTCMP_CORREL)
     
    
   
    
     
    
    
     
          distanceg = cv2.compareHist(normalize(imghistg1), normalize(imghistg2), cv2.HISTCMP_CORREL)
     
    
   
    
     
    
    
     
          distancer = cv2.compareHist(normalize(imghistr1), normalize(imghistr2), cv2.HISTCMP_CORREL)
     
    
   
    
     
    
    
     
          meandistance = np.mean([distanceb, distanceg, distancer])
     
    
   
    
     
    
    
         
      return meandistance
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      PSNR(
      img1, img2):
     
    
   
    
     
    
    
     
          mse = np.mean((img1/
      255. - img2/
      255.) ** 
      2)
     
    
   
    
     
    
    
         
      if mse == 
      0:
     
    
   
    
     
    
    
             
      return 
      100
     
    
   
    
     
    
    
     
          PIXEL_MAX = 
      1
     
    
   
    
     
    
    
         
      return 
      20 * math.log10(PIXEL_MAX / math.sqrt(mse))
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      SSIM(
      img1, img2):
     
    
   
    
     
    
    
     
          gray1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY)
     
    
   
    
     
    
    
     
          gray2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
     
    
   
    
     
    
    
         
      # 计算两个灰度图像之间的结构相似度
     
    
   
    
     
    
    
     
          score, diff = structural_similarity(gray1, gray2, win_size=
      101, full=
      True)
     
    
   
    
     
    
    
         
      # diff = (diff * 255).astype("uint8")
     
    
   
    
     
    
    
         
      # print("SSIM:{}".format(score))
     
    
   
    
     
    
    
         
      return score, diff
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      ssim(
      img1, img2):
     
    
   
    
     
    
    
     
          u_true = np.mean(img1)
     
    
   
    
     
    
    
     
          u_pred = np.mean(img2)
     
    
   
    
     
    
    
     
          var_true = np.var(img1)
     
    
   
    
     
    
    
     
          var_pred = np.var(img2)
     
    
   
    
     
    
    
     
          std_true = np.sqrt(var_true)
     
    
   
    
     
    
    
     
          std_pred = np.sqrt(var_pred)
     
    
   
    
     
    
    
     
          c1 = np.square(
      0.01*
      7)
     
    
   
    
     
    
    
     
          c2 = np.square(
      0.03*
      7)
     
    
   
    
     
    
    
     
          ssim = (
      2 * u_true * u_pred + c1) * (
      2 * std_pred * std_true + c2)
     
    
   
    
     
    
    
     
          denom = (u_true ** 
      2 + u_pred ** 
      2 + c1) * (var_pred + var_true + c2)
     
    
   
    
     
    
    
         
      return ssim/denom
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      MSE(
      img1,img2):
     
    
   
    
     
    
    
     
          mse = np.mean( (img1 - img2) ** 
      2 )
     
    
   
    
     
    
    
         
      return mse
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      if __name__ == 
      '__main__':
     
    
   
    
     
    
    
     
          img1_path = 
      '1_08.jpg'
     
    
   
    
     
    
    
     
          img2_path = 
      '2_08.jpg'
     
    
   
    
     
    
    
     
          img1 = cv2.imread(img1_path)
     
    
   
    
     
    
    
     
          img2 = cv2.imread(img2_path)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
         
      # 1.粗暴的md5比较 返回是否完全相同
     
    
   
    
     
    
    
         
      print(
      'md5_similarity:', md5_similarity(img1_path, img2_path))
     
    
   
    
     
    
    
         
      # 2.直方图相似度
     
    
   
    
     
    
    
         
      print(
      'hist_similarity:', hist_similarity(img1, img2))
     
    
   
    
     
    
    
         
      # 3.PSNR
     
    
   
    
     
    
    
         
      print(
      'PSNR:', PSNR(img1, img2))
     
    
   
    
     
    
    
         
      # 4.SSIM
     
    
   
    
     
    
    
         
      print(
      '灰度图SSIM:', SSIM(img1, img2)[
      0])
     
    
   
    
     
    
    
         
      print(
      'RGB图_ssim:', ssim(img1, img2))
     
    
   
    
     
    
    
         
      print(
      'RGB图_structural_similarity:', structural_similarity(img1,img2, multichannel=
      True))
     
    
   
    
     
    
    
         
      # 5.MSE
     
    
   
    
     
    
    
         
      print(
      'MSE:', MSE(img1, img2))

效果展示：


  
   
    
     
    
    
     
      md5_similarity: 
      False
     
    
   
    
     
    
    
     
      hist_similarity: 
      0.1344447074377748
     
    
   
    
     
    
    
     
      PSNR: 
      12.980832701995697
     
    
   
    
     
    
    
     
      灰度图SSIM: 
      0.5966066785284522
     
    
   
    
     
    
    
     
      RGB图_ssim: 
      0.9917382398395064
     
    
   
    
     
    
    
     
      RGB图_structural_similarity: 
      0.525279441002218
     
    
   
    
     
    
    
     
      MSE: 
      86.05895699395074

举例2——批量计算PSNR、SSIM、MSE


  
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
     
      import numpy 
      as np
     
    
   
    
     
    
    
     
      from glob 
      import glob
     
    
   
    
     
    
    
     
      import cv2
     
    
   
    
     
    
    
     
      from skimage.measure 
      import compare_mse,compare_ssim,compare_psnr
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      read_img(
      path):
     
    
   
    
     
    
    
         
      return cv2.imread(path,cv2.IMREAD_GRAYSCALE)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      mse(
      tf_img1, tf_img2):
     
    
   
    
     
    
    
         
      return compare_mse(tf_img1,tf_img2)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      psnr(
      tf_img1, tf_img2):
     
    
   
    
     
    
    
         
      return compare_psnr(tf_img1,tf_img2)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      ssim(
      tf_img1, tf_img2):
     
    
   
    
     
    
    
         
      return compare_ssim(tf_img1,tf_img2)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      main():
     
    
   
    
     
    
    
     
          WSI_MASK_PATH1 = 
      'E:/test/A/'
     
    
   
    
     
    
    
     
          WSI_MASK_PATH2 = 
      'E:/test/B/'
     
    
   
    
     
    
    
     
          path_real = glob(os.path.join(WSI_MASK_PATH1, 
      '*.jpg'))
     
    
   
    
     
    
    
     
          path_fake = glob(os.path.join(WSI_MASK_PATH2, 
      '*.jpg'))
     
    
   
    
     
    
    
     
          list_psnr = []
     
    
   
    
     
    
    
     
          list_ssim = []
     
    
   
    
     
    
    
     
          list_mse = []
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
         
      for i 
      in 
      range(
      len(path_real)):
     
    
   
    
     
    
    
     
              t1 = read_img(path_real[i])
     
    
   
    
     
    
    
     
              t2 = read_img(path_fake[i])
     
    
   
    
     
    
    
     
              result1 = np.zeros(t1.shape,dtype=np.float32)
     
    
   
    
     
    
    
     
              result2 = np.zeros(t2.shape,dtype=np.float32)
     
    
   
    
     
    
    
     
              cv2.normalize(t1,result1,alpha=
      0,beta=
      1,norm_type=cv2.NORM_MINMAX,dtype=cv2.CV_32F)
     
    
   
    
     
    
    
     
              cv2.normalize(t2,result2,alpha=
      0,beta=
      1,norm_type=cv2.NORM_MINMAX,dtype=cv2.CV_32F)
     
    
   
    
     
    
    
     
              mse_num = mse(result1, result2)
     
    
   
    
     
    
    
     
              psnr_num = psnr(result1, result2)
     
    
   
    
     
    
    
     
              ssim_num = ssim(result1, result2)
     
    
   
    
     
    
    
     
              list_psnr.append(psnr_num)
     
    
   
    
     
    
    
     
              list_ssim.append(ssim_num)
     
    
   
    
     
    
    
     
              list_mse.append(mse_num)
     
    
   
    
     
    
    
            
     
    
   
    
     
    
    
             
      #输出每张图像的指标：
     
    
   
    
     
    
    
             
      print(
      "{}/".
      format(i+
      1)+
      "{}:".
      format(
      len(path_real)))
     
    
   
    
     
    
    
             
      str = 
      "\\"
     
    
   
    
     
    
    
             
      print(
      "image:"+path_real[i][(path_real[i].index(
      str)+
      1):])
     
    
   
    
     
    
    
             
      print(
      "PSNR:", psnr_num)
     
    
   
    
     
    
    
             
      print(
      "SSIM:", ssim_num)
     
    
   
    
     
    
    
             
      print(
      "MSE:",mse_num)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     	
      #输出平均指标：
     
    
   
    
     
    
    
         
      print(
      "平均PSNR:", np.mean(list_psnr))  
      # ,list_psnr)
     
    
   
    
     
    
    
         
      print(
      "平均SSIM:", np.mean(list_ssim))  
      # ,list_ssim)
     
    
   
    
     
    
    
         
      print(
      "平均MSE:", np.mean(list_mse))  
      # ,list_mse)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      if __name__ == 
      '__main__':
     
    
   
    
     
    
    
     
          main()

举例3——计算Y通道或RGB通道的PSNR和SSIM

Python计算Y通道或者RGB通道的PSNR_SSIM_未知量0520的博客-CSDN博客_folder_gt

添加：PSNR/SSIM计算结果，保存文件（txt），便于后期导入excel列表分析。
代码介绍：PSNR_SSIM效果和matlab计算的结果一致（本人没有验证）。
代码功能，能够计算图像的Y_channel 或者RGB_channel状态下的PSNR_SSIM结果
用法：将真实图片，生成图片分别放入两个文件夹，代码中有选择两种方式（only_Y, RGB），切换注释相应的代码行即可。
注意：安装相应的代码库。


  
   
    
     
    
    
     
      '''
     
    
   
    
     
    
    
     
      calculate the PSNR and SSIM.
     
    
   
    
     
    
    
     
      same as MATLAB's results
     
    
   
    
     
    
    
     
      https://blog.csdn.net/qq_45041702/article/details/120997743
     
    
   
    
     
    
    
     
      
     
    
   
    
     
    
    
     
      '''
     
    
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
     
      import math
     
    
   
    
     
    
    
     
      import numpy 
      as np
     
    
   
    
     
    
    
     
      import cv2
     
    
   
    
     
    
    
     
      import glob
     
    
   
    
     
    
    
     
      import os
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      main():
     
    
   
    
     
    
    
         
      # Configurations
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
         
      # GT - Ground-truth;
     
    
   
    
     
    
    
         
      # Gen: Generated / Restored / Recovered images
     
    
   
    
     
    
    
     
          folder_GT = 
      '/content/drive/MyDrive/Experiment/codes/26_PSNR_SSIM/All/groud_truth_png'
     
    
   
    
     
    
    
     
          folder_Gen = 
      '/content/drive/MyDrive/Experiment/codes/26_PSNR_SSIM/All/1_ESPCN_png'
     
    
   
    
     
    
    
        
     
    
   
    
     
    
    
         
      #save the psnr and ssim score by txt
     
    
   
    
     
    
    
     
          PS_path = 
      '/content/drive/MyDrive/Experiment/codes/26_PSNR_SSIM/Score'
     
    
   
    
     
    
    
         
      if 
      not os.path.exists(PS_path):
     
    
   
    
     
    
    
             
      print(
      'NO_path to sava the NIQE_Score,Making....')
     
    
   
    
     
    
    
     
              os.makedirs(PS_path)
     
    
   
    
     
    
    
         
      else:
     
    
   
    
     
    
    
             
      print(
      "The NIQE_Score_path has existed")
     
    
   
    
     
    
    
     
          PS_txt = 
      open(PS_path +
      '/score1.txt', 
      'a' )
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          crop_border = 
      4  
      # same with scale
     
    
   
    
     
    
    
     
          suffix = 
      ''  
      # suffix for Gen images
     
    
   
    
     
    
    
     
          test_Y = 
      False  
      # True: test Y channel only; False: test RGB channels
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          PSNR_all = []
     
    
   
    
     
    
    
     
          SSIM_all = []
     
    
   
    
     
    
    
     
          img_list = 
      sorted(glob.glob(folder_GT + 
      '/*'))
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
         
      if test_Y:
     
    
   
    
     
    
    
             
      print(
      'Testing Y channel.')
     
    
   
    
     
    
    
         
      else:
     
    
   
    
     
    
    
             
      print(
      'Testing RGB channels.')
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
         
      for i, img_path 
      in 
      enumerate(img_list):
     
    
   
    
     
    
    
     
              base_name = os.path.splitext(os.path.basename(img_path))[
      0]
     
    
   
    
     
    
    
             
      print(base_name)
     
    
   
    
     
    
    
     
              im_GT = cv2.imread(img_path) / 
      255.
     
    
   
    
     
    
    
             
      #不同格式图像
     
    
   
    
     
    
    
             
      # im_Gen = cv2.imread(os.path.join(folder_Gen, base_name + suffix + '.tif')) / 255.
     
    
   
    
     
    
    
     
              im_Gen = cv2.imread(os.path.join(folder_Gen, base_name + suffix + 
      '.png')) / 
      255.
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
             
      if test_Y 
      and im_GT.shape[
      2] == 
      3:  
      # evaluate on Y channel in YCbCr color space
     
    
   
    
     
    
    
     
                  im_GT_in = bgr2ycbcr(im_GT)
     
    
   
    
     
    
    
     
                  im_Gen_in = bgr2ycbcr(im_Gen)
     
    
   
    
     
    
    
             
      else:
     
    
   
    
     
    
    
     
                  im_GT_in = im_GT
     
    
   
    
     
    
    
     
                  im_Gen_in = im_Gen
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
             
      # crop borders
     
    
   
    
     
    
    
             
      if crop_border == 
      0:
     
    
   
    
     
    
    
     
                  cropped_GT = im_GT_in
     
    
   
    
     
    
    
     
                  cropped_Gen = im_Gen_in
     
    
   
    
     
    
    
             
      else:
     
    
   
    
     
    
    
                 
      if im_GT_in.ndim == 
      3:
     
    
   
    
     
    
    
     
                      cropped_GT = im_GT_in[crop_border:-crop_border, crop_border:-crop_border, :]
     
    
   
    
     
    
    
     
                      cropped_Gen = im_Gen_in[crop_border:-crop_border, crop_border:-crop_border, :]
     
    
   
    
     
    
    
                 
      elif im_GT_in.ndim == 
      2:
     
    
   
    
     
    
    
     
                      cropped_GT = im_GT_in[crop_border:-crop_border, crop_border:-crop_border]
     
    
   
    
     
    
    
     
                      cropped_Gen = im_Gen_in[crop_border:-crop_border, crop_border:-crop_border]
     
    
   
    
     
    
    
                 
      else:
     
    
   
    
     
    
    
                     
      raise ValueError(
      'Wrong image dimension: {}. Should be 2 or 3.'.
      format(im_GT_in.ndim))
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
             
      #不同通道数（Y通道和RGB三个通道），需要更改
     
    
   
    
     
    
    
             
      # calculate PSNR and SSIM
     
    
   
    
     
    
    
             
      # PSNR = calculate_psnr(cropped_GT * 255, cropped_Gen * 255)
     
    
   
    
     
    
    
     
              PSNR = calculate_rgb_psnr(cropped_GT * 
      255, cropped_Gen * 
      255)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
              SSIM = calculate_ssim(cropped_GT * 
      255, cropped_Gen * 
      255)
     
    
   
    
     
    
    
             
      print(
      '{:3d} - {:25}. \tPSNR: {:.4f} dB, \tSSIM: {:.4f}'.
      format(
     
    
   
    
     
    
    
     
                  i + 
      1, base_name, PSNR, SSIM))
     
    
   
    
     
    
    
     
              PSNR_all.append(PSNR)
     
    
   
    
     
    
    
     
              SSIM_all.append(SSIM)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
              single_info = 
      '[{}],PSNR(dB),{:.4f}, SSIM,{:.4f}'
     
    
   
    
     
    
    
     
              PS_txt.write(single_info.
      format(base_name,PSNR,SSIM))
     
    
   
    
     
    
    
     
              PS_txt.write(
      "\n")
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          Mean_format = 
      'Mean_PSNR: {:.4f}, Mean_SSIM: {:.4f}'
     
    
   
    
     
    
    
     
          Mean_PSNR =  
      sum(PSNR_all) / 
      len(PSNR_all)
     
    
   
    
     
    
    
     
          Mean_SSIM =  
      sum(SSIM_all) / 
      len(SSIM_all)
     
    
   
    
     
    
    
         
      print(Mean_format.
      format(Mean_PSNR,Mean_SSIM))
     
    
   
    
     
    
    
         
     
    
   
    
     
    
    
     
          PS_txt.write(Mean_format.
      format(Mean_PSNR,Mean_SSIM))
     
    
   
    
     
    
    
     
          PS_txt.write(
      '\n')
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      calculate_psnr(
      img1, img2):
     
    
   
    
     
    
    
         
      # img1 and img2 have range [0, 255]
     
    
   
    
     
    
    
     
          img1 = img1.astype(np.float64)
     
    
   
    
     
    
    
     
          img2 = img2.astype(np.float64)
     
    
   
    
     
    
    
     
          mse = np.mean((img1 - img2)**
      2)
     
    
   
    
     
    
    
         
      if mse == 
      0:
     
    
   
    
     
    
    
             
      return 
      float(
      'inf')
     
    
   
    
     
    
    
         
      return 
      20 * math.log10(
      255.0 / math.sqrt(mse))
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      calculate_rgb_psnr(
      img1, img2):
     
    
   
    
     
    
    
         
      """calculate psnr among rgb channel, img1 and img2 have range [0, 255]
     
    
   
    
     
    
    
     
       """
     
    
   
    
     
    
    
     
          n_channels = np.ndim(img1)
     
    
   
    
     
    
    
     
          sum_psnr = 
      0
     
    
   
    
     
    
    
         
      for i 
      in 
      range(n_channels):
     
    
   
    
     
    
    
     
              this_psnr = calculate_psnr(img1[:,:,i], img2[:,:,i])
     
    
   
    
     
    
    
     
              sum_psnr += this_psnr
     
    
   
    
     
    
    
         
      return sum_psnr/n_channels
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      ssim(
      img1, img2):
     
    
   
    
     
    
    
     
          C1 = (
      0.01 * 
      255)**
      2
     
    
   
    
     
    
    
     
          C2 = (
      0.03 * 
      255)**
      2
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          img1 = img1.astype(np.float64)
     
    
   
    
     
    
    
     
          img2 = img2.astype(np.float64)
     
    
   
    
     
    
    
     
          kernel = cv2.getGaussianKernel(
      11, 
      1.5)
     
    
   
    
     
    
    
     
          window = np.outer(kernel, kernel.transpose())
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          mu1 = cv2.filter2D(img1, -
      1, window)[
      5:-
      5, 
      5:-
      5]  
      # valid
     
    
   
    
     
    
    
     
          mu2 = cv2.filter2D(img2, -
      1, window)[
      5:-
      5, 
      5:-
      5]
     
    
   
    
     
    
    
     
          mu1_sq = mu1**
      2
     
    
   
    
     
    
    
     
          mu2_sq = mu2**
      2
     
    
   
    
     
    
    
     
          mu1_mu2 = mu1 * mu2
     
    
   
    
     
    
    
     
          sigma1_sq = cv2.filter2D(img1**
      2, -
      1, window)[
      5:-
      5, 
      5:-
      5] - mu1_sq
     
    
   
    
     
    
    
     
          sigma2_sq = cv2.filter2D(img2**
      2, -
      1, window)[
      5:-
      5, 
      5:-
      5] - mu2_sq
     
    
   
    
     
    
    
     
          sigma12 = cv2.filter2D(img1 * img2, -
      1, window)[
      5:-
      5, 
      5:-
      5] - mu1_mu2
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          ssim_map = ((
      2 * mu1_mu2 + C1) * (
      2 * sigma12 + C2)) / ((mu1_sq + mu2_sq + C1) *
     
    
   
    
     
    
    
     
                                                                  (sigma1_sq + sigma2_sq + C2))
     
    
   
    
     
    
    
         
      return ssim_map.mean()
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      calculate_ssim(
      img1, img2):
     
    
   
    
     
    
    
         
      '''calculate SSIM
     
    
   
    
     
    
    
     
       the same outputs as MATLAB's
     
    
   
    
     
    
    
     
       img1, img2: [0, 255]
     
    
   
    
     
    
    
     
       '''
     
    
   
    
     
    
    
         
      if 
      not img1.shape == img2.shape:
     
    
   
    
     
    
    
             
      raise ValueError(
      'Input images must have the same dimensions.')
     
    
   
    
     
    
    
         
      if img1.ndim == 
      2:
     
    
   
    
     
    
    
             
      return ssim(img1, img2)
     
    
   
    
     
    
    
         
      elif img1.ndim == 
      3:
     
    
   
    
     
    
    
             
      if img1.shape[
      2] == 
      3:
     
    
   
    
     
    
    
     
                  ssims = []
     
    
   
    
     
    
    
                 
      for i 
      in 
      range(img1.shape[
      2]):
     
    
   
    
     
    
    
     
                      ssims.append(ssim(img1[..., i], img2[..., i]))
     
    
   
    
     
    
    
                 
      return np.array(ssims).mean()
     
    
   
    
     
    
    
             
      elif img1.shape[
      2] == 
      1:
     
    
   
    
     
    
    
                 
      return ssim(np.squeeze(img1), np.squeeze(img2))
     
    
   
    
     
    
    
         
      else:
     
    
   
    
     
    
    
             
      raise ValueError(
      'Wrong input image dimensions.')
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def 
      bgr2ycbcr(
      img, only_y=True):
     
    
   
    
     
    
    
         
      '''same as matlab rgb2ycbcr
     
    
   
    
     
    
    
     
       only_y: only return Y channel
     
    
   
    
     
    
    
     
       Input:
     
    
   
    
     
    
    
     
       uint8, [0, 255]
     
    
   
    
     
    
    
     
       float, [0, 1]
     
    
   
    
     
    
    
     
       '''
     
    
   
    
     
    
    
     
          in_img_type = img.dtype
     
    
   
    
     
    
    
     
          img.astype(np.float32)
     
    
   
    
     
    
    
         
      if in_img_type != np.uint8:
     
    
   
    
     
    
    
     
              img *= 
      255.
     
    
   
    
     
    
    
         
      # convert
     
    
   
    
     
    
    
         
      if only_y:
     
    
   
    
     
    
    
     
              rlt = np.dot(img, [
      24.966, 
      128.553, 
      65.481]) / 
      255.0 + 
      16.0
     
    
   
    
     
    
    
         
      else:
     
    
   
    
     
    
    
     
              rlt = np.matmul(img, [[
      24.966, 
      112.0, -
      18.214], [
      128.553, -
      74.203, -
      93.786],
     
    
   
    
     
    
    
     
                                    [
      65.481, -
      37.797, 
      112.0]]) / 
      255.0 + [
      16, 
      128, 
      128]
     
    
   
    
     
    
    
         
      if in_img_type == np.uint8:
     
    
   
    
     
    
    
     
              rlt = rlt.
      round()
     
    
   
    
     
    
    
         
      else:
     
    
   
    
     
    
    
     
              rlt /= 
      255.
     
    
   
    
     
    
    
         
      return rlt.astype(in_img_type)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      if __name__ == 
      '__main__':
     
    
   
    
     
    
    
     
          main()

结果展示：

举例4——调用SSIM算法，结合opencv阈值分割和轮廓提取，找两图差异

SSIM---结构相似性算法（OpenCV+Python)_hedgehog__的博客-CSDN博客_python 结构相似性通过调用skimage.metrics包下的SSIM算法，结合OpenCV的阈值分割及轮廓提取算法，找出两幅图像的差异。


  
   
    
     
    
    
     
      # https://blog.csdn.net/hedgehog__/article/details/107257755
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      import cv2
     
    
   
    
     
    
    
     
      import imutils
     
    
   
    
     
    
    
     
      from skimage.metrics 
      import structural_similarity
     
    
   
    
     
    
    
     
      import time
     
    
   
    
     
    
    
     
      from skimage 
      import filters, img_as_ubyte
     
    
   
    
     
    
    
     
      import numpy 
      as np
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      start = time.time()
     
    
   
    
     
    
    
     
      # 读入图像，转为灰度图像
     
    
   
    
     
    
    
     
      src = cv2.imread(
      'C:/Users/Hedgehog/Desktop/right.jpg')
     
    
   
    
     
    
    
     
      img = cv2.imread(
      'C:/Users/Hedgehog/Desktop/left.jpg')
     
    
   
    
     
    
    
     
      grayA = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)
     
    
   
    
     
    
    
     
      grayB = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 计算两个灰度图像之间的结构相似度
     
    
   
    
     
    
    
     
      (score, diff) = structural_similarity(grayA, grayB, win_size=
      101, full=
      True)
     
    
   
    
     
    
    
     
      diff = (diff * 
      255).astype(
      "uint8")
     
    
   
    
     
    
    
     
      cv2.namedWindow(
      "diff", cv2.WINDOW_NORMAL)
     
    
   
    
     
    
    
     
      cv2.imshow(
      "diff", diff)
     
    
   
    
     
    
    
     
      print(
      "SSIM:{}".
      format(score))
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 找到不同的轮廓以致于可以在表示为 '不同'的区域放置矩形
     
    
   
    
     
    
    
     
      # 全局自适应阈值分割（二值化），返回值有两个，第一个是阈值，第二个是二值图像
     
    
   
    
     
    
    
     
      dst = cv2.threshold(diff, 
      0, 
      255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[
      1]
     
    
   
    
     
    
    
     
      cv2.namedWindow(
      "threshold", cv2.WINDOW_NORMAL)
     
    
   
    
     
    
    
     
      cv2.imshow(
      'threshold', dst)
     
    
   
    
     
    
    
     
      # findContours找轮廓，返回值有两个，第一个是轮廓信息，第二个是轮廓的层次信息（“树”状拓扑结构）
     
    
   
    
     
    
    
     
      # cv2.RETR_EXTERNAL：只检测最外层轮廓
     
    
   
    
     
    
    
     
      # cv2.CHAIN_APPROX_SIMPLE：压缩水平方向、垂直方向和对角线方向的元素，保留该方向的终点坐标，如矩形的轮廓可用4个角点表示
     
    
   
    
     
    
    
     
      contours, hierarchy = cv2.findContours(dst.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
     
    
   
    
     
    
    
     
      print(contours)
     
    
   
    
     
    
    
     
      newimg = np.zeros(dst.shape, np.uint8)  
      # 定义一个和图像分割处理后相同大小的黑色图
     
    
   
    
     
    
    
     
      # drawContours画轮廓，将找到的轮廓信息画出来
     
    
   
    
     
    
    
     
      cv2.drawContours(newimg, contours, -
      1, (
      255, 
      255, 
      255), 
      1)
     
    
   
    
     
    
    
     
      cv2.namedWindow(
      "contours", cv2.WINDOW_NORMAL)
     
    
   
    
     
    
    
     
      cv2.imshow(
      'contours', newimg)
     
    
   
    
     
    
    
     
      # cnts = cnts[0] if imutils.is_cv3() else cnts[0] 取findContours函数的第一个返回值，即取轮廓信息
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      # 找到一系列区域，在区域周围放置矩形
     
    
   
    
     
    
    
     
      for c 
      in contours:
     
    
   
    
     
    
    
     
          (x, y, w, h) = cv2.boundingRect(c)  
      # boundingRect函数：计算轮廓的垂直边界最小矩形，矩形是与图像上下边界平行的
     
    
   
    
     
    
    
     
          cv2.rectangle(src, (x, y), (x + w, y + h), (
      0, 
      255, 
      0), 
      2)  
      # rectangle函数：使用对角线的两点pt1，pt2画一个矩形轮廓
     
    
   
    
     
    
    
     
          cv2.rectangle(img, (x, y), (x + w, y + h), (
      0, 
      255, 
      0), 
      2)  
      # 画矩形的图, pt1, pt2,(对角线两点的坐标), 矩形边框的颜色，矩形边框的粗细
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      end = time.time()
     
    
   
    
     
    
    
     
      print(end - start)
     
    
   
    
     
    
    
     
      # 用cv2.imshow 展现最终对比之后的图片
     
    
   
    
     
    
    
     
      cv2.namedWindow(
      "right", cv2.WINDOW_NORMAL)
     
    
   
    
     
    
    
     
      cv2.imshow(
      'right', src)
     
    
   
    
     
    
    
     
      cv2.namedWindow(
      "left", cv2.WINDOW_NORMAL)
     
    
   
    
     
    
    
     
      cv2.imshow(
      'left', img)
     
    
   
    
     
    
    
     
      cv2.waitKey(
      0)
     
    
   
    
     
    
    
     
      cv2.destroyAllWindows()