La primera toma suele ser la mejor. Eso no es filosofía de locutor zen ni misticismo de estudio: es un patrón que se repite sesión tras sesión, año tras año. Según un estudio de la Audio Engineering Society, la frescura interpretativa de las primeras tomas correlaciona con mayor engagement en el oyente. Pero entonces, ¿por qué tantas sesiones terminan siendo maratones de 40 tomas que cuestan tiempo, dinero y paciencia?
Porque la sesión no se aprovecha bien. Y eso casi nunca es culpa del locutor.
El guión llega traducido y sin editar
El español es aproximadamente un 30% más largo que el inglés. Esto está documentado: cualquier traductor profesional lo sabe, cualquier estudio de subtitulado lo confirma. Un guión de 30 segundos en inglés no cabe en 30 segundos en español a menos que alguien lo edite. Y cuando nadie lo edita, el locutor tiene que correr. La entrega suena apresurada, poco natural, forzada. El cliente pide otra toma más lenta. Pero más lenta no entra en el tiempo. Y así empezamos el loop infinito.
Antes de la sesión, asegurate de que el guión esté adaptado al español, no simplemente traducido. Si el tiempo es fijo, el texto tiene que cortarse. Si el texto es sagrado, el tiempo tiene que extenderse. No hay magia que resuelva física.
Mandá la música antes
El locutor no necesita la mezcla final masterizada. Necesita saber el tono emocional del spot. ¿Es épico? ¿Íntimo? ¿Urgente? ¿Reflexivo? La música comunica todo eso en cinco segundos. Y grabar contra esa música permite que la interpretación se sincronice emocionalmente desde el principio.
No tenés la música todavía. Entiendo. Pero entonces describí el tono con precisión. "Algo cálido pero no lento, optimista pero no infantil" es mil veces más útil que "profesional". Profesional no significa nada. Todo el mundo quiere que suene profesional. Es como decir "quiero que el diseño sea lindo". (Mi favorito personal es "quiero que suene a locutor pero que no suene a locutor". Eso me lo dicen desde 2014.)
La dirección tiene que ser concreta
"Más emoción" es una dirección que no funciona. ¿Más emoción de qué tipo? ¿Alegría? ¿Nostalgia? ¿Urgencia? ¿Orgullo? El locutor puede darte cualquiera de esas emociones, pero necesita saber cuál. Y si no sabés cuál querés, el problema está en el brief, no en la interpretación.
Lo que sí funciona: "Hablale a alguien que acaba de perder un familiar". "Imaginá que estás contando un secreto a tu mejor amigo". "Sos el narrador de un documental de naturaleza de Netflix". Esas direcciones construyen una imagen. La emoción sale de la imagen. Según investigaciones de la Universidad de Southern California sobre comunicación vocal, los oyentes detectan incongruencias emocionales en menos de 200 milisegundos. Si la emoción no es genuina, se nota.
¿Vas a dirigir en vivo o vas a escuchar después?
Esa decisión cambia todo. Si vas a estar en la sesión vía Source Connect o Zoom, podés ajustar en tiempo real. Si vas a recibir archivos y dar feedback por escrito, el brief inicial tiene que ser mucho más detallado. Ambos modelos funcionan. Pero mezclarlos genera caos: cliente que no está en la sesión pero quiere opinar toma por toma, o cliente que está en la sesión pero no dice nada hasta el día siguiente.
Definí el modelo antes de empezar. Y si vas a dar feedback por escrito, sé específico con los timecodes. "No me gusta la toma 3" no ayuda. "En la toma 3, a los 12 segundos, el énfasis en 'solución' suena demasiado vendedor" sí ayuda.
El acento no es decorativo
Un spot para todo Latinoamérica necesita español neutro. Un spot para México puede tener acento mexicano. Un spot para España necesita castellano peninsular. Pero un spot para México con acento argentino genera rechazo instantáneo. Las rivalidades regionales son reales, documentadas, y afectan la percepción de marca. Un estudio de Nielsen Hispanic encontró que el 66% de los consumidores hispanos en Estados Unidos prefieren contenido en español, pero no cualquier español: el acento importa.
Si no hablás español, pedí asesoramiento de alguien que sí lo hable. El instinto de "suena bien" desde el inglés no funciona. Viggo Mortensen y Anya Taylor-Joy hablan mejor español que Jennifer Lopez y Selena Gomez, aunque los apellidos sugieran lo contrario. Los primeros crecieron hablando español en Argentina. Las segundas apenas lo hablan.
Menos tomas, mejor resultado
Hay un fenómeno que veo repetirse: el cliente pide 20, 30, 40 tomas. El equipo escucha todo. Discuten. Vuelven a escuchar. Y al final eligen la toma 2. A veces la toma 1. La interpretación más natural, menos pensada, menos contaminada por la sobredirección.
Esto tiene explicación técnica. Cada toma adicional agrega carga cognitiva al locutor. La lectura se vuelve más consciente, menos orgánica. El texto empieza a sonar a texto en lugar de a pensamiento. Es como pedirle a alguien que repita "gracias" 50 veces: en algún momento la palabra pierde todo sentido.
Tres tomas con dirección clara le ganan a treinta tomas con dirección vaga. Siempre.
El brief importa más que el equipo
Empecé grabando con un micrófono de 100 dólares en un placard forrado con frazadas. Hoy tengo un estudio tratado acústicamente con Source Connect. Pero la diferencia real entre una sesión que funciona y una que no funciona nunca estuvo en el equipo. Siempre estuvo en la preparación del cliente.
Un brief claro incluye: el guión adaptado al español, el tiempo exacto disponible, la audiencia objetivo, el tono emocional deseado, la música de referencia si existe, y ejemplos de lo que NO querés. Ese último punto es subestimado. A veces es más fácil definir qué evitar que qué buscar.
La revisión posterior no reemplaza la preparación
Sí, puedo hacer revisiones. Sí, puedo regrabar frases. Pero cada revisión es tiempo adicional, costo adicional, y sobre todo pérdida de la energía original de la sesión. La voz del martes no suena igual que la voz del viernes. El estado emocional cambia. La interpretación muta.
Las mejores sesiones son las que no necesitan revisiones porque todo estaba claro desde el principio.
El último dato que nadie te cuenta
Las marcas que vuelven una y otra vez al mismo locutor lo hacen porque encontraron algo que funciona y no quieren arriesgarlo. Según datos de la industria publicitaria, la consistencia de voz en campañas aumenta el reconocimiento de marca hasta en un 20%. Pero esa consistencia solo es posible si las sesiones están bien preparadas desde el día uno.
Una sesión caótica genera audio mediocre. El audio mediocre genera dudas. Las dudas generan cambio de locutor. El cambio de locutor genera inconsistencia de marca. Es una cadena que empieza mucho antes de que el micrófono se encienda.
¿Necesitás una locución en español para tu próximo proyecto? Escribime y te respondo en menos de una hora.



