[Wolf_Pinson_2005]

Low Bandwidth Reduced Reference Video Quality Monitoring System

Resumen:

El paper presenta un sistema de monitorización de la Calidad de Video, de tipo Reduced Reference utilizando menos de 10 kbits/s para la información de referencia del stream de vídeo. Este sistema utiliza técnicas de extracción de características similares a las utilizadas por la VQM de NTIA (General Video Quality Model, Pinson_Wolf_2004), el cual ha sido estandarizado por ANSI e ITU. Es decir, utiliza técnicas similares al estandar adpotado por el VQEG Full Reference Telefision (FRTV) Phase 2, ANSI e ITU. Estas técnicas están explicadas en el documento técnico de Wolf_Pinson_2002. Realmente el estandar VQM, aunque presentado al VQEG en la fase FR, se puede considerar como una métrica RR con un canal de referencia de gran ancho de banda. Aqui reducen el tamaño de la referencia y proponen por tanto, utilizando las mismas técnicas del estandar, una nueva métrica RR. Se presentan resultados de 18 data sets de secuencias subjetivamente ponderadas que incluyen más de 2500 video clips. El método se ha implementado en una herramienta de monitorización de calidad que utiliza internet como canal de referencia entre emisor y receptor del video procesado.

La metrica propuesta utiliza las mismas tres características que las usadas por NTIA General VQM detalladas en las secciones 4.2.2 y 4.3 de Wolf_Pinson_2002 Cada una extraida de una región Spatio-Temporal (S-T) de 32x32 lineas_pixels y 1 seg de duración, mientras que la NTIA General VQM utiliza 8x8x0.2s. Las dos primeras características miden la cantidad de gradientes espaciales y su distribución angular de las regions S-T de la componente Y de luminancia, mientras que la tercera utiliza un vector 2-dimensional para medir la cantidad de información de crominancia azul y roja de cada región S-T. Para un video de 30 frames por segundo (fps) estas características llegan a una compresión de 30000:1

Una cuantización de 9 bits de precisión es suficiente para las características tanto espaciales como temporales y utiliza un cuantizador no lineal de 9 bits. Como en 1 segundo se pierden varios frames de información, las estadísticas para el parametro temporal no son ajustadas. Han desarrollado un nuevo (respecto el VQM) cuantificador temporal que mide la información temporal absoluta de movimiento en los tres planos de la imagen, (Y, Cb, Cr) que utiliza el error cuadratico medio (RMS) entre dos regiones S-T separadas 0.2 seg. Esta separación tiene incluso más resolución que el HVS.

A grandes rasgos, el calculo del valor final de la métrica se realiza mediante la ponderación de varios parámetros por el índice obtenido para cada parámetro de tests subjetivos. Cada parámetro se encarga de obtener información de distintos aspectos relativos a la percepción de la calidad del video. El NTIA General VQM dispone de 7 parámetros, de los cuales en esta nueva métrica mantiene algunos y otros son sustituidos o añadidos, como por ejemplo, el comentado anteriormente relativo a la precisión temporal. Para el calculo de cada uno de los parametros se realizan varios pasos, explicados con detalle en Pinson_Wolf_2004, por ejemplo, aplicar umbrales perceptuales a cada una de las características extraidas de las S-T Regions, realizar pooling sobre el espacio y tiempo.

Para un video de 30 fps en formato 525-lineas una subregión de 384-lineas x 672 pixels centrada segun la recomendación ITU-R BT.601 produce un VQM bit-rate antes de codificación alguna (por ejemplo Huffman) que es menor de 10 kbits/s. Puesto que a esa tasa de bits internet está disponible donde sea, el nuevo 10kbits/sVQM puede ser usado para monitorizar la calidad de video en sitemas end-to-end.

Respecto a la correlación de esta métrica con los resultados de tests subjetivos, muestran cómo mantiene practicamente identica la correlación que mantenía la NTIA General VQM.

Bibliografía disponible:

[]

[]