[Wang_Simoncelli_2005b]

Reduced-Reference Image Quality Assessment Using A Wavelet-Domain Natural Image Statistic Model

Resumen:

Proponen una método RR basado en un modelo de las estadísticas de las imágenes naturales en el dominio de la transformad Wavelet. Es decir, de las estadísticas propias de los coeficientes wavelets. La idea general en las aproximaciones basadas en las estadísticas de imágenes naturales es que las distorsiones realizadas en las imágenes modifican la naturalidad de éstas y por tanto sus estadísticas. Medir la "desnaturalización" de las imágenes basándose en las diferencias con modelos de las estadísticas de las escenas naturales puede ser usado para cuantificar la degradación de calidad de las imágenes. En particular, observan que la distribución marginal de los coeficientes wavelet en una determinada subbanda se modifican o varían de forma diferente para distintos tipos de distorsión de la imagen. Utilizan entonces una medida de "distancia de información" entre distribuiciones de probabilidad para cuantificar estas variaciones y examinar si ésta distancia proporciona una medída útil de la calidad de las imágenes en comparacion con las evaluaciones subjetivas. Como no asumen ningún tipo de distorsión específica, el método propuesto es potencialmente util para una gran variedad de distorsiones. El código matlab está disponible en LCV

Utilizan una descomposición wavelet basada en la steerable pyramid (transformación wavelet redundante que evita el aliasing entre subbandas y es invariante a rotaciones y desplazamientos espaciales). Las distribuciones marginales de las respuestas de este tipo de filtros pasobanda orientados aplicados a imágenes naturales son altamente "kurtoticas" (con picos centrales muy agudos y caidas laterales más acentuadas que las gausianas, ver imagen 2a del paper), y que además tienen importantes implicaciones en la codificación neural de la escena visual [14]. En la figura se ve como estas distribuciones marginales de los coeficientes wavelets obetenidos con la transformación aplicada (steerable pyramid), varían conforme se aplican distintas distorsiones a la imagen. El estudio de estas variaciones con imágenes contaminadas con ruido blanco se han aplicando y usado anteriormente para algoritmos de eliminación de ruido [18-21]

Utilizan la distancia Kullback-Leibler (KLD) [22] entre las distribuciones de coeficientes de la imágen de referencia y la distorsionada o cuantificada. Este estimador necesita de ambos histogramas para ser calculados, por lo que el histograma de la imagen de referencia puede ser pasasdo como información de referencia al receptor. El problema es que enviar todo el histograma puede ser problematico pues depende del ancho del bin, y por tanto el número de muestras a enviar, y esta variación entre enviar más o menos resolución (más o menos muestras del histograma) puede afectar al cálculo de la distancia KLD y por tanto a la percepción de calidad. Por ello utilizan un modelo GGD (Generalized 2-parameter Gausian Density Model [18,20,29,30]) para mediante sus parámetros modelar dicho histograma. Se calculan los valores de los parámetros que mejor ajustan el modelo al histograma de referencia y se envían por el canal RR los valores de dichos parámetros, en total 2,3 valores numéricos, alpha, beta y algún otro valor de ajuste, junto con una estimación del error (ver paper). En el destino aplican los valores recibidos por el canal RR al modelo GGD para tener el histograma de la distribución marginal de coeficientes de la imagen de referencia, que junto con el obtenido de la imagen comprimida recibida permite calcular la distancia KLD.

Por último aplican una formula para determinar el índice de calidad o de distorsión entre la referencia y la distorsionada.

Los resulstados obtenidos igualan o mejoran el estado del arte de facto propuestos por el SSIM y el Lubin's Sarnoff Model. No hay otra métrica RR que utilice tan poca información de referencia y además sea independiente del tipo de distorsión medida. Es fácil de implemantar y computacionalmente eficiente usando solo unos pocos parámetros. Puesto que la medida está basada en la distribución marginal de los coeficientes wavelet el método es insensible a pequeñas distorsiones geométricas espaciales como traslaciones, rotaciones y escalado.

Aunque es ampliamente entendido que las distribuiciones marginales en respuesta a filtros pasobanda aplicados a imágenes naturales tienen una conexión con la percepción humana de imágenes naturales, su relación con la valoración subjetiva de calidad no ha sido probada. Los resultados experimentales del paper abren una via para ello. Además pretenden mejorar el método con la inclusión de estadísticas conjuntas de los coeficientes wavelet [11,21,38-41] que den un modelo más potente de caracterización de las estructuras estadísticas de las imágenes naturales.

Bibliografía disponible:

[]
[]