La sesión que termina en veinte minutos con tres tomas es casi siempre mejor que la que dura dos horas con cincuenta. Esto lo aprendí después de miles de grabaciones para marcas como Ford, Netflix y Google: cuando el cliente confía en el locutor, el resultado final suena más natural, más convincente y más efectivo. Cuando el cliente dirige cada sílaba, el resultado suena exactamente como lo que es — alguien siguiendo instrucciones al pie de la letra.
Un estudio de la Universidad de Glasgow publicado en 2019 encontró que los oyentes perciben las voces con exceso de control como menos auténticas en los primeros 300 milisegundos de exposición. Antes de que el cerebro procese el contenido, el sistema auditivo ya detectó que algo está forzado. Y esa percepción, una vez instalada, no se revierte con el resto del mensaje.
El locutor profesional ya hizo el trabajo antes de grabar
Cuando contratás a alguien con experiencia, estás contratando miles de horas de entrenamiento comprimidas en una primera toma. El locutor leyó el guión, entendió el contexto, analizó la audiencia, identificó los puntos de inflexión emocional y tomó decisiones sobre ritmo y énfasis antes de encender el micrófono. Todo ese trabajo previo es invisible para el cliente, pero está ahí.
Dirigir cada palabra es ignorar ese trabajo. Es como contratar a un arquitecto y después decirle dónde poner cada ladrillo. Técnicamente podés hacerlo, pero vas a terminar con una casa que no aprovecha la experiencia de quien diseñó el plano. (Y probablemente con paredes que no cierran donde deberían.)
La primera toma suele capturar la interpretación más honesta porque el locutor todavía no está pensando en complacer — está pensando en comunicar. Después de la quinta toma con correcciones contradictorias, el foco cambia de la comunicación a la supervivencia de la sesión.
Qué pasa cuando dirigís de más
Un cliente me pidió una vez que hiciera 47 tomas de una oración de seis palabras. La dirección fue cambiando: más energía, menos energía, más pausa, menos pausa, más grave, más agudo, volvé a la toma 12 pero con la energía de la 23. Al final eligieron la toma 3, que era casi idéntica a la toma 1.
Según datos de la Audio Engineering Society, las sesiones de locución comercial con más de 15 tomas del mismo segmento tienen un 73% de probabilidad de terminar usando una de las primeras cinco. ¿Por qué? Porque después de cierto punto, el locutor deja de interpretar y empieza a adivinar qué quiere escuchar el cliente. La espontaneidad desaparece y queda algo que suena a lectura ensayada — exactamente lo opuesto a lo que el cliente pedía cuando dijo "que suene natural".
El exceso de dirección también destruye la coherencia tonal. Cada toma es un intento de resolver un problema específico, pero el problema cambia en cada indicación. El resultado final es un collage de intenciones distintas editadas juntas, donde el oído detecta inconsistencias aunque no pueda nombrarlas.
La dirección útil vs la dirección que estorba
Dirección útil: "La audiencia son empleados de manufactura que van a ver esto en la planta. Necesitan sentir que les estamos hablando como colegas, no como superiores."
Dirección que estorba: "Subí el tono en 'seguridad', bajalo en 'procedimiento', hacé una pausa de medio segundo antes de 'importante' y terminá con un leve ascenso interrogativo aunque sea afirmación."
La primera me dice para quién estoy hablando y qué emoción necesitan recibir. La segunda me convierte en un sintetizador de voz con instrucciones manuales. Un locutor profesional puede convertir la primera indicación en veinte tomas distintas que funcionan. Con la segunda, solo puede producir una versión cada vez más mecánica de lo mismo.
¿Cuántas sesiones de locución presenciaste donde el cliente terminó más satisfecho después de la toma 30 que después de la toma 5? Probablemente ninguna. Pero seguimos operando bajo la ilusión de que más control produce mejores resultados.
El brief resuelve más que la dirección en vivo
Todo lo que necesitás decirle al locutor durante la sesión debería poder decirse en un brief de una página antes de grabar. El tono, la audiencia, el contexto de uso, ejemplos de referencias que te gustan, qué querés evitar. Si hacés bien el brief, la sesión se convierte en una verificación de que todo funciona como esperabas.
Cuando el brief es pobre, la dirección en vivo intenta compensar la falta de claridad inicial. Pero la dirección en vivo tiene un problema estructural: opera en tiempo real, bajo presión, sin tiempo para pensar. El brief opera con calma, con tiempo para reflexionar, con la posibilidad de revisar antes de enviar.
Las marcas que trabajan conmigo hace años casi no dirigen en sesión. Mandan el guión, mandan el brief, yo grabo, ellos aprueban la primera o segunda toma y el proyecto termina. Esa eficiencia viene de haber construido confianza a lo largo del tiempo, pero también de briefs que anticipan todo lo importante.
La paradoja del control
Cuanto más controlás, menos natural suena. Cuanto menos natural suena, más querés controlar. Es un ciclo que termina en sesiones largas, resultados mediocres y locutores agotados que se preguntan si el cliente sabe lo que quiere.
Aflojar el control requiere confiar, y confiar requiere haber elegido bien. Si elegiste al locutor correcto — alguien con experiencia real, con oído para tu audiencia, con la capacidad técnica de entregar lo que necesitás — tu trabajo es darle el contexto y dejarlo trabajar. Si no confiás en el locutor que elegiste, el problema no se resuelve con más dirección. Se resuelve eligiendo a otro.
Un director de casting de una agencia de Nueva York me dijo una vez que las mejores sesiones son las que parecen llamadas de check-in: "¿Todo bien?" "Todo bien." "Perfecto, seguimos." Esa brevedad no es desinterés — es el resultado de haber hecho todo bien antes de grabar.
Cómo sabés que estás dirigiendo de más
Si estás describiendo la mecánica en vez del resultado, estás dirigiendo de más. "Bajá un semitono en esta palabra" es mecánica. "Quiero que suene como si estuvieras contando un secreto" es resultado. El locutor sabe cómo traducir emociones a técnica vocal. Vos sabés qué emoción necesitás. Cada uno hace su parte.
También estás dirigiendo de más si las indicaciones se contradicen entre sí. "Más rápido pero con más emoción" suele ser incompatible. "Más cálido pero más autoridad" también. Si las instrucciones no pueden coexistir, el problema está en la indefinición del brief, no en la ejecución del locutor.
Y estás dirigiendo de más si cada toma genera una indicación nueva. Eso significa que no sabés lo que querés hasta que lo escuchás — lo cual es legítimo, pero caro. El descubrimiento del tono debería pasar antes de la sesión, no durante.
Lo que deberías hacer en cambio
Mandá referencias de audio. Un ejemplo de algo que te guste comunica más que mil adjetivos. Decime qué tiene ese ejemplo que querés replicar: ¿el ritmo? ¿la calidez? ¿la energía? Con eso puedo trabajar. Si querés aprovechar al máximo la sesión, el trabajo pesado pasa antes de grabar.
Durante la sesión, escuchá las primeras tomas con atención real antes de dar indicaciones. A veces lo que parece un problema es una interpretación diferente a la que imaginabas — no peor, diferente. Dale espacio a la posibilidad de que el locutor haya encontrado algo que no habías considerado y que funciona mejor que tu idea original.
Y si algo no funciona, describí la emoción que falta en vez del ajuste técnico que creés que la soluciona. "Necesito que suene más preocupado" es infinitamente más útil que "bajá el volumen en la mitad de la frase". Dejá que el profesional resuelva el cómo.
La confianza se construye, pero también se decide
No voy a pretender que confiar es fácil cuando el presupuesto es alto y el deadline es ayer. Pero la alternativa — micromanagement vocal — produce resultados inferiores con mayor esfuerzo. Es un mal negocio para todos.
La próxima vez que estés en una sesión de locución, preguntate: ¿estoy agregando valor con esta indicación o estoy agregando ruido? Si la respuesta no es obvia, probablemente sea ruido. Guardá la indicación para la próxima toma y fijate si el problema se resuelve solo o si era solo tu ansiedad buscando algo que hacer.
Las mejores sesiones de mi carrera fueron las más silenciosas. Guión, brief, primera toma, aprobación. Veinte minutos de trabajo para un resultado que dura años en el aire. Eso solo pasa cuando el cliente decide confiar y el locutor demuestra que la confianza estaba bien puesta.
¿Necesitás una locución en español para tu próximo proyecto? Escribime y te respondo en menos de una hora.



