[Carli_Farias_Gelasca_Tedesco_Neri_2005]

Quality Assessment Using Data Hiding on Perceptually Imporatant Areas

Resumen:

Utilizan una tecnica de ocultación de información para introducir una marca debil en zonas perceptualmente importantes de la imagen. Para estimar la importancia de las zonas de la imagen se basan en características perceptuales sabidas de captar la atención visual, como movimiento, contraste y color. El emisor introduce la marca en las zonas seleccionadas y el receptor la extrae de las mismas zonas. La degradación de la marca proporciona una medida de calidad de video. Los resultados muestran que mejora el PSNR y que la medida de calidad propuesta crece monotonicamente conforme lo hace los indices subjetivos.

El trabajo es una extensión de [9,8,10]. En [8] se muestra que la inclusión de una marca embebida en el video no afecta sustancialmente a la visibilidad ni incrementa las molestias visuales significativamente.

Una mascara binaria se multiplica por una matriz de ruido pseudo-aleatorio no correlacionado, se escala y se añade a los coeficientes DCT correspondientes a las frecuencias medio-altas de los bloques 8x8 en la componente de luminancia de las zonas seleccionadas.

La importancia particular de un área (bloque 8x8) se calcula teneiendo en cuenta tres aspectos: movimiento, contraste y color. Se generan mapas de imporatancia individual para estos aspectos y luego se ponderan para obtener un mapa de importancia global por el que se seleccionan las regiones. Los mapas de importancia individual son binarios, 1 indica importante, 0 no importante, respecto al aspecto evaluado. Comenta que se podían haber utilizado mapas difusos pero por simplicidad se utilizan los binarios.

Motion: Los ojos son atraidos involuntariamente hacia el movimiento. En terminos de calidad, los defectos del fondo se hacen menos visibles si existe movimiento en la escena. Esto es cierto si la velocidad de éstos está detro de unos umbrales. Si el movimiento es muy lento, no se percibe, por lo que las distorsiones del fondo captan la atención. Si el movimiento es muy rápido el HVS no distingue bien los detalles espaciales cuando sigue los objetos. Por encima de un umbral, las distorsiones de los objetos moviles no contribuyen mucho a la calidad percibida. Utilizan un algoritmo [10] basado en flujo optico para determinar la cantidad de movimiento espacio-temporal (velocidad). Se construye el mapa de importancia de movimiento comparando esta medida de velocidad dada por el algoritmo con los dos umbrales que han determinado mediante experimentos subjetivos en [12].

Contraste: Las regiones con alto contraste capturan la atención del observador. Por tanto los defectos en estas regiones se hacen mas visibles y perceputalmente mas molestos. Para construir el mapa de importancia de contraste estiman el contraste local respecto a los pixeles vecinos calculando la diferencia de luminancia respecto la media. Para determinar el umbral para marcar el pixel en el mapa han realizado un test informal subjetivo (que no comentan).

Color: Los objetos con colores birllantes o destacados atraen la visión [13]. Para construir el mapa de importancia de color estman el brillo y la saturación de los pixels de un frame tras pasar a un espacio de color HVS (no indican cual) y lo comparan con los umbrales que dicen que salen de sus experimentos (pero no dicen como ni lo citan). La saturación y el brillo varían en el intervalo [0,1].

Selección de regiones: Utilian un sumatorio ponderado para los tres efectos, aunque luego los ponderan con igual peso, 1. El mapa general de importancia tiene valores de 3,2,1,0 en función de la suma ponderada de los valores de los mapas individuales. La selección de regiones la hacen para los valores 3 y 2, globalmente relevante y bastante relevante respectivamente, según su clasificación.

Métrica objetiva: El trasmisor realiza un análisis de relevancia e inserta la marca en las zonas seleccionadas. El receptor realiza el mismo análisis y extrae la marca de las mismas zonas. Se calcula el PSNR entre la estimada (recibida) y la original dando la PSNRw. También calculan el Bit Error Rate (BER), porcentaje de diferencias entre las dos marcas.

Para evaluar la metrica simulan bluring en areas específicas (fondo, region de interes y todo el frame). Usan la métrica propuesta (PSNRw) para calcular la calidad del video, y además calculan el PSNR entre la secuencia original y la recibida para comprarlo con el PSNRw. Según los resultados que obtienen en sus pruebas el PSNRw se ajusta más a la calidad visual que el PSNR. Han realizado experimentos psicofísicos para determinar que la PSNRw crece monotonicamente conforme lo hacen los indices de calidad subjetivos.

Bibliografía disponible:

[]
[]