NATAN FISCHER
← Volver al Blog
Publicado el 2026-06-17

Por Qué Algunas Sesiones de Locución Duran 20 Minutos y Otras 3 Horas

Descubrí qué factores determinan si tu sesión de locución en español dura 20 minutos o 3 horas y cómo optimizar el tiempo de grabación.

Por Qué Algunas Sesiones de Locución Duran 20 Minutos y Otras 3 Horas

La diferencia entre una sesión de 20 minutos y una de 3 horas rara vez tiene que ver con la duración del guión. Tiene que ver con todo lo que pasa antes de apretar el botón de grabar y con cuántas personas opinan después de cada toma.

El guión llegó cinco minutos antes

Cuando el guión llega en el momento de la sesión — o peor, durante la sesión — todo se ralentiza. El locutor necesita leerlo, entenderlo, marcar las pausas, identificar las palabras que pueden trabarse. Un guión de 30 segundos puede necesitar 10 minutos de preparación si nunca lo viste antes.

Y si el guión tiene problemas de traducción (que siempre tiene cuando viene del inglés), hay que resolverlos en vivo. Una frase que suena natural en inglés puede ser imposible de decir en español sin sonar como un robot recitando un manual de instrucciones. Según estudios de localización, el español es aproximadamente un 30% más extenso que el inglés para transmitir el mismo contenido, lo que significa que los guiones traducidos literalmente casi siempre necesitan edición antes de funcionar.

Mandá el guión con 24 horas de anticipación. La sesión va a durar la mitad.

Cuántas personas están dirigiendo

Una persona que sabe lo que quiere: sesión rápida. Tres personas con opiniones distintas sobre qué significa "más energía": sesión larga.

He visto sesiones donde el cliente directo tiene una idea, el director creativo de la agencia tiene otra, y el brand manager del cliente final tiene una tercera. Cada toma genera una discusión de dos minutos sobre si era "demasiado comercial" o "no suficientemente comercial". Multiplica eso por 15 tomas y ya perdiste una hora en conversaciones que no son sobre la locución.

El récord personal: una sesión de 4 horas para un spot de 15 segundos. Cuatro personas en la llamada. Terminamos usando la tercera toma.

¿Tenés música de referencia o estás adivinando?

Grabar sin la música que va a ir en el spot es como intentar bailar sin escuchar la canción. El locutor puede dar una interpretación perfecta que después no encaja con el tono de la música, y hay que empezar de nuevo.

Cuando tengo la música desde el principio, me meto en el estado emocional correcto desde la primera toma. Cuando no la tengo, estoy adivinando, y las primeras tres o cuatro tomas son básicamente de calibración hasta que encontramos el tono.

El problema de las 50 tomas

Hay clientes que piden toma tras toma tras toma, buscando algo que no saben cómo describir. "Probá con más... no sé, ¿calidez? Pero también autoridad. Pero relajado." Después de la toma 20, estamos todos cansados y las interpretaciones empiezan a sonar forzadas.

Un estudio de la Universidad de California sobre fatiga vocal encontró que los locutores profesionales pueden mantener consistencia de calidad durante aproximadamente 2 horas de grabación continua antes de que la fatiga afecte la interpretación. Después de eso, cada toma nueva es peor que la anterior, aunque el cliente siga buscando "algo diferente".

La primera toma suele ser la mejor porque es la más natural, la que sale sin pensar demasiado. Si después de 10 tomas no encontraste lo que buscás, probablemente el problema está en el brief, no en la interpretación.

Sesiones dirigidas vs sesiones de entrega

Las sesiones donde el cliente está conectado en vivo por Source Connect duran más. Siempre. Hay feedback inmediato, ajustes en tiempo real, conversaciones sobre intención y tono. Todo eso suma tiempo, pero también suma precisión.

Las sesiones de entrega — donde grabo solo y mando el archivo — son más rápidas en términos de mi tiempo, pero transfieren el riesgo al cliente. Si lo que mandé no era exactamente lo que querían, hay que hacer una segunda ronda. (A veces la sesión "corta" termina siendo más larga en total porque hay tres rondas de revisiones en vez de una sesión bien dirigida.)

¿Cuál es la duda más frecuente que escucho antes de una sesión? "¿Cuánto tiempo necesitamos bloquear?" La respuesta honesta: depende de cuántas personas van a opinar y de qué tan claro tengas el brief.

El guión que cambia durante la sesión

El escenario más lento de todos: el cliente escucha la toma, decide que no le gusta la frase, y la reescribe en el momento. Ahora el guión es diferente, hay que grabar de nuevo, y de paso alguien sugiere cambiar otra línea "ya que estamos".

He tenido sesiones donde el guión final tenía un 40% de diferencia con el guión que recibí originalmente. Cada cambio suma tiempo — no solo para grabar la nueva versión, sino para entender cómo encaja el cambio con el resto del texto, ajustar el ritmo, mantener la coherencia de tono.

Si el guión no está aprobado, no empieces la sesión. Es más barato posponer un día que pagar tres horas de tiempo de estudio mientras se edita en vivo.

El factor técnico que nadie considera

Las sesiones remotas agregan una capa de complejidad técnica. La conexión de internet del cliente, la calidad del audio de monitoreo, los delays de Source Connect. Todo eso es tiempo muerto. En una sesión presencial, el feedback es instantáneo. En una remota, hay latencia, hay "¿me escuchás bien?", hay "se cortó un segundo, ¿podés repetir?".

Según datos de la industria de producción de audio, las sesiones remotas tienen aproximadamente un 15-20% de overhead técnico comparado con sesiones presenciales. (Esto no significa que las sesiones remotas sean peores — de hecho, funcionan mejor de lo que la mayoría cree — pero hay que contabilizar ese tiempo.)

El cálculo real

Un spot de 30 segundos con un cliente que sabe lo que quiere, guión aprobado, música de referencia disponible: 20 minutos incluyendo setup técnico.

El mismo spot con tres stakeholders, guión que llegó esa mañana, sin música, y con "flexibilidad" para hacer cambios sobre la marcha: fácilmente 2 horas.

La duración de la sesión es una función de la preparación multiplicada por la cantidad de tomadores de decisión dividida por la claridad del brief. Esa fórmula no aparece en ningún manual de producción, pero es la que uso para dar estimados desde hace 20 años.

Lo que podés controlar

Mandá el guión con anticipación. Designá una sola persona para dar feedback durante la sesión. Tené la música lista. Aprobá el guión antes de empezar. Cada una de estas cosas puede cortar tu sesión a la mitad.

Y si todo eso no es posible — si el proyecto es caótico por naturaleza, si hay múltiples stakeholders, si el guión está en flux — entonces bloqueá tiempo de sobra y aceptá que la sesión va a ser larga. No hay nada malo en una sesión de 3 horas si produce el resultado correcto. El problema es cuando bloqueaste 45 minutos y recién vas por la toma 12.


¿Necesitás una locución en español para tu próximo proyecto? Escribime y te respondo en menos de una hora.

Escribime

CompartirXLinkedInFacebook

Artículos relacionados