[Wolf_Pinson_1999]

Spatial-temporal distortion metrics for in-service quality monitoring of any digital video system

Resumen:

El interes del ITS (Institute for Telecommunication Sciences, Boulder, Colorado) ha sido el desarrollo de métricas de calidad de vídeo que integren los siguientes atributos: 1) Los resultados emulen respuestas subjetivas, 2) Trabajen sobre un amplio rango de calidad, desde muy bajo bit-rate a muy alto bit-rate, 3) Computacionalmente eficientes y 4) Bandwidth eficientes, comprimir la información de calidad en el menor ancho de banda posible.

Utilizan una técnica RR que cuyo esquema se muestra en la figura

Utiliza la información RR en la forma de características extraidas del procesamiento espacio-temporal (S-T) de regiones tando de los streams de video de entrada y salida. Una característica se define como una cantidad de información asociada con una región S-T especifica de la secuencia de vídeo, por ejemplo, medidas estadísticas como la media, desviación estándard, etc... calculadas utilizando todos los pixels de una región S-T. Esta información se comprime siguiento la ITU-R Recommendation BT.601.

La métrica tiene el objetivo de evaluar las distorsiones espaciales a lo largo del tiempo. El algoritmo utilizado se esquematiza en la figura. La componente de luminancia de la componente Rec.601 de entrada y salida (señal Y de la Rec.601) se procesan con filtros de realce de bordes. Los video streams asi procesados se dividen en regiones S-T. De ellas se extraen las características que cuantifican la actividad espacial como función de la orientación angular. Se calculan las distorsiones de calidad comparando las ganancias y pérdidas de los valores obtenidos en las regiones S-T respecto la entrada y salida utilizando funciones que emulan el emnascaramiento. Se realiza pooling espacial y luego temporal sobre estas distorsiones para obtener el valor final de la métrica.

Los filtros de realce de bordes y el tamaño de las regiones S-T se puede optimizar basándose en la correlación con las distorsiones perceptuales. A distancias de 4-6 alturas de cuadro el tamaño óptimo de región S-T alcanza compresiones de 384:1 respecto al stream no comprimido por Rec.601.

Los streams de entrada y salida se deben calibrar antes del procesamiento. La calibración incluye la compensación de la ganancia y niveles del sistema (compensation for system gain and level offset) asi como el spatial and temporal registration of the images.

Explican cada uno de los bloques de la métrica.

Han utilizado siete conjuntos de test subjetivos acordes a las ITU-R Recommendation BT.500 y la ITU-T Recommentation P.910 realizados entre 1992 y 1998 que describen brevemente en el paper y emplazan a las referencias para mayor descripción.

El conocimiento adquirido en la evaluacíon de las secuencias de test ha servido para definir los filtros de realce de bordes y el tamaño de las regiones S-T.

Bibliografía disponible:

[]
[]