[Wang_Bovik_2002]

A Universal Image Quality Index

Resumen:

Proponen un nuevo índice universal de calidad para imágenes, fácil de calcular y aplicable a numerosas aplicaciones de procesamiento de imagenes. La palabra universal hace referencia a que la aproximación a la medida de calidad no depende de la imagen que es evaluada, ni de las condiciones de visionado de la misma ni de las características de los distintos observadores. Actualmente el PSNR y el MSE son usados "universalmente", independientemente de su rendimiento.

La métrica propuesta está diseñada por el modelado de cualquier distorsión de la imagen como una combinación de tres factores: perdida de correlación, distorsión de luminancia y distorsión de contraste. Es una definición matemática en la que no se aplica explicitamente ninguna característica del sistema visual humano.

Ver el paper para la formulación. El rango dinámico de la métrica es [-1,1] y el mayor valor, 1, se alcanza solo si las imágenes son identicas. Se trata de una métrica Full Reference en la que se comparan las medidas de distorsión entren ambas, es decir, la perdida de correlación lineal entre ambas, las diferencias o distorsión de luminancia y de contraste. La ecuación (2) del paper muestra un producto de tres terminos, cada uno de los cuales mide dichas distorsiones.

El primer termino mide el grado de correlación lineal entre las dos imágenes con un rango dinámico entre [-1,1]. A pesar de que las imagenes puedan estar linealmente correlacionadas, puede existir distorsión en luminancia o contraste. El segundo componente del producto mide lo aproximadas que están las luminancias de ambas imágenes con un rango dinámico de [0,1] con 1 si la luminancia media de las imágenes es la misma. El tercer termino mide lo aproximados que son los contrastes de las imágenes mediante la desviación típica de la luminancia de cada imágen. Es decir la desviación típica de la luminancia puede verse como una estimación del contraste. El rango del tercer parámetro es también [0,1] y solo se da 1 cuando las desviaciones típicas de ambas imágenes son iguales.

Debido a que la calidad de la imágen es variable en el espacio, en la práctica en vez de evaluar la imagen completa se hace un barrido con una ventana de BxB pixels para el que se calcula la métrica local. La métrica total será el promedio de la suma de las metricas locales.

Los ajustes a los inidices subjetivos son muy buenos. Ver paper. Para un conjunto de imagenes con el mismo valor de MSE pero claramente distorsionadas el índice Q de la métrica se ajusta perfectamente a la valoracíon subjetiva de la calidad de estas. Exepto para las imágenes en las que únicamente se realza el contraste. Esto es así porque perceptualmente un realce del contraste mejora la calidad perceptual de la imagen, por lo que es mejor valorada en los índices subjetivos, pero como la métrica lo que mide es la distorsión con el original, siendo este perfecto sin el realce de contraste, es lógico asignarle a la imagen modificada menor indice de calidad que a la original.

En las concluisiones argumenta que parece sorprendente que una mera y simple forumulación matematica defina un indice de calidad cuyo rendimiento sea tan bueno sin incorporar ningún modelo del sistema visual humano. Piensan que el éxito se debe a que el propio sistema visual tiene una fuerte habilidad en medir la distrosión estrucutral de las imagenes (básicamente lo que la matemática propuesta hace) que se produce en los procesos que las degradan. La diferencia con el MSE radica en que este es sensible a la energía producida por los errores en vez de medir la distorsión de la estructura de la imagen.

A traves de la página de Wang se tiene acceso a códido de la métrica en Matlab y C++, a imágenes de tests y mucho más.

Bibliografía disponible:

[]
[]