Métricas de calidad objetivas

Volver
Para la evaluación de codecs de imagen y vídeo se suele utilizar la métrica de rendimiento R/D (Rate/Distortion) que identifica el balance entre la tasa de bits, medida en bits por muestra (bps) y la calidad de la imagen reconstruida, médida en decibelios (dBs) con la métrica PSNR (Peak Signal-to-Noise Ratio). Sin embargo, también es bien conocido por la comunidad científica que las medidas de calidad del PSNR no suelen estar próximas a la percepción de calidad del ser humano, siendo en ocasiones incluso opuestas.
Nuestro propósito es estudiar y analizar el comportamiento de otras métricas de calidad con el objeto de determinar si la métrica de calidad objetiva PSNR es la más adecuada para determinadas aplicaciones y contextos. En particular, nuestro interés se centra en determinar qué métricas de calidad son las más idóneas, desde el punto de vista de calidad perceptual humana, para la evaluación comparativa de nuevos codecs de imagen y vídeo. Para ello, hemos realizado un estudio detallado de diversas métricas de calidad objetivas propuestas en la literatura, en donde se ha analizado la calidad de sus medidas, el tiempo que tardan en realizar una medición y la cantidad de memoria que necesitan [10]. Este estudio se llevó a cabo, utilizando distintos codecs de imagen y vídeo con diversas colecciones de imagenes y vídeo de test.
Por otro lado, hemos llevado a cabo un estudio similar al anterior en el que analizamos el comportamiento de las métricas de calidad, incluida el PSNR, en aplicaciones de envío de vídeo codificado a través de redes inalámbricas IP [11]. En este contexto, el video reconstruido contiene nuevas distorsiones causadas por los errores en el transporte de los paquetes de vídeo en redes inalámbricas. Se utilizó un modelo de pérdida de paquetes para redes inalámbricas MANET que permitía generar los patrones de pérdidas típicos de estas redes en función de la topología, tráfico, movilidad de los nodos,etc. Este modelo nos permitió observar el impacto en la calidad de los errores provocados en el transporte de un flujo de vídeo en redes MANET. En este punto las distintas métricas valoran la distorsión percibida pudiendo determinar cuáles son las que ofrecen medidas más ajustadas a la calidad subjetiva del ser humano.
En general, los resultados que hemos obtenido indican que (1) la métrica PSNR no es tan mala como se apuntaba en un principio, siendo válida para la evaluación comparativa de codecs de imagen y vídeo en general. Aunque no se ajusta a la calidad subjetiva del ser humano, es una métrica que se calcula muy rápido y no consume memoria. (2) La más precisa y, en consecuencia, más cercana a la percepción de la calidad humana es la métrica VIFF, pero requiere una cantidad significativa de tiempo de cáculo en comparación con el PSNR. (3) Las métricas NR (No-reference) no ofrecen resultados de calidad satisfactorios y además no son capaces de medir adecuadamente la calidad de vídeo ante la presencia de errores en el bitstream (transmisión de vídeo en redes propensas a error).
Aquí podrá encontrar más información acerca de las métricas de calidad y temas relacionados.
Volver