[VanDenBrandenLambrecht_Verscheure_1996]

Perceptual Quality Measure using a SpatioTemporal Model of the Human Visual System

Resumen:

Presentan una métrica de valoración de video basándose en un modelo multicanal del HVS. (ver paper y su articulo posterior VanDenBrandemLambrecht_1996 para mas detalles). La métrica evalua tanto la calidad de la secuencia globalmente como características importantes de esta como contornos y texturas.

La estructura del articulo es similar a la de VanDenBrandemLambrecht_1996 y mucho de su contenido es repedido en aquel, por lo que aquí solo resumiré aquellos aspectos que no estén recogidos en el mencionado.

Respectoa a las características del HVS: La sensibilidad al contraste es mayor para patrones horizontales y verticales que no para diagonales, y también es mayor para objetos moviles que para inmoviles. Un estímulo puede ser percidibo de diferente manera en función del fondo sobre el que se presente, ambas señales (fondo y estímulo) se interfieren y la percepción relativa se modifica, esto es masking. El efecto del enmascaramiento es máximo cuando las señales están fuertemente acopladas (orientación y frecuencias espacial y temporal) y decrece conforme la distancia de las señales aumenta en el dominio espectral. Desde el punto de vista de la visión espacial los mecanismos de ésta están dispuestos en orientación y frecuencia, por lo que tienen una estructura polar, lo que hace que la estructura del banco de filtros no sea separable en coordenadas espaciales cartesianas.

La diferencia respecto al esquema de VanDenBrandemLambrecht_1996 es que primero se hace una segmentación burda de secuencia en areas uniformes, contornos y texturas segun [19] y explicado basicamente en el paper. Para el pooling se propone un esquema multimedida donde no solo se computa la secuencia para obtener una métrica global única sino también para obtener métricas detalladas para cada una de los componentes segmentados, areas uniformes, contornos y texturas. Para incluir el efecto del "foco de atención" la metrica global se calcula para bloques tridimensionales de secuencia. La dimensión temporal de cada bloque se asigna de acuerdo a la persistencia de la imagen en la retina (pero no dice cuanto tiempo), la dimensión espacial cubre 2 grados de ángulo visual que es la dimensión de la fovea. La medida de distorsión se calcula para cada bloque mediante pooling del error sobre los distintos canales (no especifica bien como). Basicament, la magnitud de los canales se combinan en un sumatorio de Minkowski con un exponente alto para ponderar mas las distorsiones mayores. En el paper da la formula de la que llama "Moving Pictures Quality Metric" (MPQM).

El pooling para las metricas de detalle es un poco diferente. Una vez que la señal de error enmascarada se conoce, se utiliza un sumatorio de Minkowski por componentes (texturas, areas uniformes y contornos) lo que da directamente la distorsión de cada una de las características.

Las unidades de medida de la métrica pueden ser dos, lo que llama "decibelios visuales" que se ajustan a lo que llama MPSNR (masked peak signal-to-noise ratio) cuya formula aparece en el paper o bien con una medida escalar como la utilizada en los test subjetivos, para la que también coloca la formula de conversión.

Presentan los resultados para High Bitrate Broadcasting (MPEG-2) y Very Low Bitrate Communications usando H.263. Muestra las graficas y comenta las caracteríscicas con las que se han codificado las secuencias. De las graficas se concluye que a partir de un determinado bitrate, incrementarlo supone un desperdicio de ancho de banda pues el observador final (según los valores de la metrica objetiva) no percibirá el aumento de calidad. Citando a [20] comenta que los valores obtenidos por MPQM son muy consistentes con las metricas subjetivas. Comenta que tal como se cita en otros trabajos [25] (tambien del autor) MPQM da mejor rendimiento que otras métricas desarrolladas para vídeo.

Presentan los resultados para Very Low Bitrate con H.263 utilizando un simulador software con dos secuencias indicando en el paper las características del experimento.

Bibliografía disponible:

[]

[]