lunes, 10 de diciembre de 2007

Velocidad y Tiempo en Cine, TV y Video

Ariel-NM [blackhat4all@gmail.com]

Sabido es que el cine y la televisión se basan en las peculiaridades de la visión humana, específicamente, en la persistencia de las imágenes en la retina. La rápida sucesión de imágenes crea la sensación de un movimiento continuo. En este artículo se discutirán los diferentes formatos que comúnmente se emplean para medir la velocidad con que se suceden las imágenes a fin de crear la ilusión de movimiento así como la duración de de una obra (o fragmento de una obra) de cine o video. Muchos de estos formatos se podrán encontrar en los programas de animación, edición de video, efectos especiales e incluso en aquellos destinados al procesamiento de audio.

FRECUENCIA DE CUADROS

La rapidez con que se reemplazan las imágenes se denomina velocidad de cuadros o frecuencia de cuadros (frame rate, en inglés) y se expresa en cuadros o fotogramas por segundo (fps). Se puede demostrar que la persistencia de la imagen en la retina tiene una duración promedio de 1/15,5 segundo, aproximadamente. Invirtiendo la fracción, eso significa que puede crearse una sensación de continuidad si las imágenes se suceden a una velocidad de 15,5 cuadros por segundo. O redondeando: 16 cuadros por segundo.

EL CINE

Como es de suponer, el cine fue el primer medio en adoptar diferentes estándares para esta velocidad. En los tiempos del cine mudo se estableció al estándar mínimo de 16 fotogramas por segundo. Esto, por supuesto, permitía un máximo ahorro de película. Posteriormente, con el arribo del cine sonoro, se fijó la velocidad a un nuevo estándar de 24 fps, el cual ha permanecido hasta nuestros días. Esta aceleración en la frecuencia de cuadros nada tiene que ver con la visión pero sí, como es de suponer, con el audio.

El asunto estriba en que la solución para lograr un buen sincronismo entre la imagen y el sonido, la mejor solución fue insertar este último en la película. Para ello se aprovecha el pequeño espacio libre que queda entre los fotogramas (las imágenes) y las perforaciones de arrastre a cada lado de la cinta de celuloide. En esa estrecha banda se graba el audio pero no como suele hacerse en una cinta magnética sino como información luminosa. El sonido aparece ahí como una banda transparente que se ensancha y se estrecha continuamente a lo largo de la película. De ahí proviene su nombre: banda sonora.

Al pasar un haz de luz a través de la banda sonora, la intensidad luminosa que se obtiene del otro lado dependerá de la apertura que tenga la zona transparente en cada instante. En otras palabras: al ensancharse y estrecharse, la banda sonora sirve como una cortinilla que se abre o se cierra rápidamente a medida que pasa la película. Del otro lado de la lámpara se coloca una celda fotoeléctrica que convierte las variaciones de la intensidad de la luz en variaciones de voltaje, obteniéndose así una imagen eléctrica del sonido muy similar a la que proviene de un micrófono. Esta señal eléctrica se amplifica y se entrega a los altavoces.

Cuanto más lenta sea la velocidad de la película, mayor cantidad de sonido ha de quedar atrapado en un tramo de la misma, lo cual significa que el ancho de la banda sonora ha de variar muy rápidamente. En los albores del cine sonoro no se disponía de una tecnología capaz de generar una banda sonora nítida y fiel al sonido con una velocidad tan lenta como 16 cuadros por segundo. Entonces se decidió incrementar la rapidez de la película para que estas variaciones quedaran más espaciadas y por tanto, más “legibles” por la celda fotoeléctrica. Luego de algunos experimentos (y teniendo en cuenta que debía ahorrarse la mayor cantidad posible de película) se determinó la velocidad óptima de 24 cuadros por segundo.

LA TELEVISIÓN Y EL VIDEO

Por su parte, la televisión creó nuevos estándares.
Por razones tecnológicas e históricas, actualmente existen en el mundo tres sistemas generales de video y televisión: NTSC, PAL y SECAM. No es objeto de este artículo discutir las peculiaridades de estos sistemas y solo diremos que entre sus diferencias están el número de líneas horizontales en que se subdivide la imagen y la velocidad con que se suceden los fotogramas.

El sistema de televisión NTSC (National Television System Comitee) es el que se emplea en toda Norteamérica, y una buena parte de América Latina y el Caribe, incluyendo nuestro país. El sistema PAL se ha extendido por casi toda Europa y es mayoritario en África y Asia. Por su parte, el SECAM impera aún en ciertas regiones de Francia, algunos países africanos y el antiguo campo socialista, incluyendo las repúblicas que aglutinaba la Unión Soviética.

Adaptado de Wikipedia

Retornando al tema que nos ocupa: el sistema NTSC se caracteriza por una frecuencia de cuadros de 30 fps. Por su parte, los sistemas PAL y SECAM trabajan a 25 fps. La siguiente figura ilustra comparativamente las tres bases de tiempo fundamentales que se emplean en la actualidad:


UNIDADES DE TIEMPO

Por supuesto, además de la frecuencia con que se suceden los fotogramas, otro parámetro a medir cuando se trabaja con imágenes en movimiento es la duración de la obra o de las unidades en esta se subdivide (tomas, planos, secuencias, escenas…).

La duración de cualquier fenómeno, obviamente, se mide en unidades de tiempo. La unidad para las mediciones temporales adoptada por el Sistema Internacional es el segundo (s). En algunos trabajos que exigen gran exactitud, puede que se necesite medir el tiempo con una precisión de hasta la milésima de segundo, esto es, en milisegundos (ms), como sucede en los equipos de fotofinish que se emplean en las competiciones deportivas. Por supuesto, semejante precisión no tiene mucha aplicación en asuntos de arte, donde suelen emplease, además del segundo, el minuto (m) y la hora (h).

[Un detalle: la “duración” de una película aún sigue midiéndose en pies…]

En la mayoría de las aplicaciones de diseño / animación el tiempo se mide en fotogramas. Esta es una vieja práctica que proviene de los albores de los animados, donde lo que contaba era la cantidad de dibujos necesarios para mostrar una determinada acción en cierto intervalo de tiempo. Por ejemplo, en un animado con miras a su exhibición en el cine, 24 dibujos se corresponden con un segundo de duración aunque a menudo, a fin de ahorrar trabajo a los dibujantes, se realizan solo 12 dibujos y cada uno se repite dos cuadros. La mayoría de las veces, a los animadores les resulta más visible pensar en fotogramas que en segundos.

Sin embargo, en ocasiones se requiere medir la duración de una toma en fotogramas y, a la vez, en unidades convencionales de tiempo. Para unificar ambos requisitos se ideó el sistema SMPTE.

FORMATO SMPTE

SMPTE son las siglas de Society of Motion Picture and Television Engineers, organización internacional radicada en los Estados Unidos que se ha dedicado a poner un poco de orden y concierto en los estándares de los medios que manipulan imágenes y audio. Y aunque la traducción es Sociedad de Ingenieros del Cine y la Televisión, sus estándares abarcan también el procesamiento de imágenes en el campo de la medicina.

A esta organización le debemos el formato de medida del tiempo SMPTE. Este formato está disponible en prácticamente todos los programas de animación, edición de video y procesamiento de audio. Genéricamente puede representarse como:

hh:mm:ss:ff

donde h son las horas; m, los minutos; s, los segundos y f representa los fotogramas.

En principio, el conteo de cada par de dígitos arranca en cero. El conteo opera de acuerdo a la frecuencia de cuadros del medio en cuestión.

Por ejemplo, supongamos que el cursor del tiempo de una aplicación como 3D Studio, Premiere o Audition se encuentra justo a inicio de la escala. En tal caso, la cifra del contador (en formato SMPTE) será:

00:00:00:00

Esto significa que nos encontramos en el fotograma cero, y que han transcurrido cero segundos, cero minutos y cero horas; en fin que estamos al inicio de todo. Supongamos además que nuestra animación, video o banda sonora se prevé para una velocidad de cuadros de 30 fps. En ese caso, a medida que el cursor del tiempo avanza, se incrementará el número de fotogramas pero no se indicará el primer segundo hasta que hayan transcurrido 30 cuadros.

Pero el conteo de los fotogramas comienza en cero, no en 1, de modo que cada segundo contiene una treintena de fotogramas que van desde el cero hasta el 29.

Esta sería la lectura en el fotograma 29:

00:00:00:29

Y esta sería la lectura en el fotograma 30:

00:00:01:00

Nótese que, con el arribo al cuadro 30 (que sería el primero de la siguiente treintena), se incrementa el contador de los segundos y regresa a cero el contador de fotogramas.

ALGUNAS PRECISIONES

Hablando con exactitud, al introducirse la señal de color en la televisión hubo que corregir la velocidad de cuadros de la norma NTSC a 29,97 fps (el equivalente a multiplicar 30 x 0,999). No obstante, la aproximación a 30 fps funcionará perfectamente en la mayoría de los casos. También suele emplearse un estándar de video de 23.976 fps en aquellas obras que pretenden ser presentadas también en soporte de celuloide. Nótese cuán cercana es esa frecuencia de cuadros al estándar de cine de 24 fps.

Finalmente también se emplea un estándar antiguo de 15 fps para juegos de video pero este asunto no es de nuestro interés.

EL CENTELLEO

Una secuencia de imágenes a una velocidad igual o mayor a 16 fps garantiza perfectamente la continuidad aparente del movimiento pero no evita el molesto centelleo que se observa fundamentalmente en las regiones periféricas de la visión, puesto que es en esa zona de la retina donde más abundan los bastoncillos, células encargadas de sensibilizarse ante la información de luminancia (escala de grises, intensidad de la luz) de todo cuanto vemos.

Para evitar el centelleo (parpadeo; flickering, en inglés), se inventó un sencillo y eficaz dispositivo que recuerda las aspas de un ventilador: durante el tiempo en que la imagen permanece detenida en pantalla, las aspas interrumpen tres veces el paso de la luz. En un cine actual, la frecuencia de cuadros sigue siendo de 24 fps pero a los efectos de las pulsaciones de la luz, esta opera a 3 x 24 = 72 destellos por segundo. A esa velocidad de pulsaciones, la mayoría de las personas dejan de sentir el molesto centelleo. Esas aspas que se emplean en los proyectores convencionales de cine son el equivalente de la frecuencia de refrescamiento en los monitores. (A mí, en particular, me resulta molesto el centelleo de la pantalla del monitor a la frecuencia estándar de 60 Hz (60 ciclos por segundo) y generalmente la subo a 75Hz.)

Debe quedar claro que la frecuencia de las pulsaciones nada tiene que ver con la frecuencia de cuadros necesaria para la continuidad del movimiento. La película sigue pasando a 24 fps independientemente de cuántas aspas tenga el “ventilador”, es decir, de cuantas veces se interrumpa el paso de la luz entre un fotograma y el siguiente.

Ahora bien, ¿qué ocurre en la televisión?

CAMPOS Y ENTRELAZADO

Por razones fisiológicas (para minimizar el centelleo) y por razones tecnológicas (incapacidad de la primitiva electrónica de válvulas para alcanzar altas velocidades de conmutación), en los albores de la televisión se determinó subdividir en dos partes cada fotograma.

Se conoce que la imagen televisiva está compuesta por cierto número de líneas horizontales, cifra que varía de un sistema de televisión a otro. Las líneas se clasifican en pares e impares. En una imagen de televisión, durante el tiempo que corresponde a un fotograma se muestran primeramente las líneas impares y luego las pares.

En otras palabras, en lugar de mostrarse un fotograma completo durante 1/30 de segundo (en NTSC) se muestra sucesivamente dos semi-fotogramas denominados campos (fields, en inglés). Si congeláramos uno de esos campos, veríamos una imagen un tanto borrosa debido a que solo aparecerían allí la mitad de las líneas separadas al doble de la distancia normal.

De este modo, durante el tiempo asignado a un fotograma la pantalla del televisor centellea dos veces, es decir 2 x 30 = 60 veces en un segundo. La persistencia de las imágenes en la retina es quien se encarga de entrelazar las líneas de ambos campos y ofrecernos una imagen completa.

Al exportar un video desde un programa de edición, este generalmente brinda las opciones de generar cada uno de los campos por separado, ambos campos ya entrelazados (interlaced, en inglés) o como imagen continua (no subdividida en líneas) para mostrar todo el fotograma a la vez como suele mostrarse en el cine o en las computadoras. A esta opción (un fotograma completo por vez) se le denomina progresiva.

aclaración y compromiso

Por motivo de una pequeña descoordinación, en el número anterior de BlackHat se ofreció en la carpeta Tools un cronómetro para animadores programado en Flash (el Itty-Bitty Animation Timer v3.0, de Timothy Albee) y descargado a través del WoS desde el sitio: http://ta-animation.com/TA_FineArt/Tools/index.htm.

El funcionamiento del cronómetro es bien simple: basta con un clic (izquierdo) sobre la imagen de la cabeza del zorro y mantener el botón pulsado durante el intervalo de tiempo que se quiera medir. El cronómetro permite elegir el formato de la medición e incluso establecer por teclado los valores iniciales.



Artículos relacionados


No hay comentarios: