La música primero. Casi siempre.
Sé que esto va en contra de lo que muchos productores hacen por defecto — grabar la voz, mandar el audio al editor, y después salir a buscar una pista que "pegue" con lo que ya tienen. Funciona, técnicamente. Pero es trabajar al revés, y después de más de dos décadas en esto, puedo decirte que el resultado se nota. Un locutor que graba contra la música entra en un estado emocional completamente distinto al que graba contra silencio y después le ponen un tema encima.
Por qué la música cambia la interpretación
Hay algo que la música hace que ningún brief escrito puede replicar. Cuando me mandan la pista antes de grabar, no necesito que me expliquen si quieren algo "emotivo pero no cursi" o "energético pero no gritón". La música ya me lo dice. Los tempos lentos bajan naturalmente la velocidad de la lectura. Una percusión intensa te empuja hacia adelante. Los espacios entre notas te invitan a hacer pausas. Es información que el cuerpo del locutor procesa sin tener que pensarla, y esa naturalidad se escucha en la toma final.
Un estudio de la Universidad de McGill publicado en 2014 encontró que la música activa el sistema de recompensa del cerebro y afecta la producción de dopamina. Los investigadores trabajaron con neuroimágenes para ver exactamente qué pasaba cuando los participantes escuchaban música que les generaba "escalofríos" emocionales. No es metáfora: la música literalmente cambia tu estado neurológico mientras la escuchás. Y si eso le pasa a un oyente pasivo, imaginate lo que le pasa a un locutor que tiene que interpretar un texto mientras la escucha.
El caso (limitado) para grabar primero la voz
Hay proyectos donde la voz tiene que venir antes. E-learning de compliance donde el tiempo exacto de cada segmento importa para la plataforma. IVR donde cada opción del menú tiene duración específica. Audiolibros donde la música es secundaria o inexistente. En esos casos, la música se convierte en un elemento que se adapta a la voz — se baja durante las palabras importantes, sube en las transiciones, desaparece cuando necesita desaparecer.
Pero esos son casos técnicos con restricciones específicas.
Para publicidad, videos corporativos, documentales de marca, contenido de redes sociales — básicamente todo lo que tiene una dimensión emocional — la música primero es la regla que funciona mejor. Y no solo porque ayuda al locutor. También porque le da al cliente algo concreto contra qué evaluar las tomas, en lugar de imaginar cómo va a sonar "cuando esté todo junto".
¿Qué pasa cuando el cliente no tiene música todavía?
Esta es la situación más común. El proyecto está aprobado, el guión está listo, pero nadie eligió la música porque "eso viene después". Y acá es donde las producciones se complican.
Mi recomendación siempre es la misma: aunque no tengan la pista final, consigan una referencia. Puede ser una canción que les guste el tono, una pista de biblioteca que se acerque a lo que buscan, o incluso el audio de otra publicidad que tenga el mood que imaginan. Algo. Cualquier cosa es mejor que grabar contra silencio y esperar que después todo encaje por arte de magia.
(Una vez me mandaron como referencia un video de YouTube de una competencia de baile porque les gustaba "la energía del momento en que el bailarín se tira al piso". No era música, pero me dio más información que cualquier brief escrito sobre qué tipo de intensidad buscaban.)
La sincronización no es opcional
Cuando la música viene después de la locución, el editor tiene que hacer malabares. Cortar silencios, estirar pausas, acelerar secciones para que los acentos musicales coincidan con los momentos importantes del texto. Es trabajo que se puede hacer, pero que siempre se nota un poco. Según datos de Epidemic Sound, el 83% de los videos con música bien sincronizada al contenido tienen tasas de retención mayores que los que no la tienen. La sincronización no es un lujo de producción — es parte de lo que hace que el contenido funcione.
Cuando la música viene primero, esa sincronización pasa naturalmente durante la grabación. El locutor hace las pausas donde la música respira. Las palabras importantes caen donde la música las apoya. Los cambios de energía coinciden porque el locutor los está sintiendo en tiempo real mientras graba. No hay magia en esto. Es simplemente trabajar con el material en lugar de contra él.
El español y el problema del 30%
Este punto es específico para producciones en español traducidas del inglés, que son la mayoría de las que hago. El español es aproximadamente un 30% más largo que el inglés. Un guión que entra perfecto en 30 segundos en inglés necesita 39 segundos en español — o hay que cortarlo.
Si la música ya está elegida y tiene una duración fija, eso define cuánto se puede decir. Y es mejor saberlo antes de grabar que después, cuando el cliente te pide que "hables más rápido" para meter todo en el tiempo disponible. Una locución apresurada suena apresurada. No hay forma de esconderlo. Pero un guión editado para que entre naturalmente en el tiempo suena como si siempre hubiera sido así.
La producción típica que funciona
El orden que mejor funciona en mi experiencia es este: primero el guión revisado y aprobado, después la música elegida (o al menos la referencia), después la grabación, después la edición. El locutor graba escuchando la música en los auriculares. Las pausas caen donde tienen que caer. Los acentos coinciden con los momentos musicales. El editor recibe material que ya está más o menos sincronizado y solo tiene que pulir detalles.
El orden que genera problemas es el inverso: guión, grabación contra silencio, búsqueda de música que "pegue", edición frenética para hacer que todo funcione junto. Se puede hacer. Lo he visto hacer mil veces. Pero el resultado siempre tiene esa cualidad de "partes ensambladas" en lugar de "pieza coherente".
Cuando el presupuesto decide por vos
A veces la música viene después porque el presupuesto no da para una pista de biblioteca hasta que se apruebe el corte final. A veces viene primero porque el cliente ya tiene los derechos de una canción específica y hay que trabajar con eso. A veces no hay música porque el proyecto es un tutorial interno que nadie va a ver más de una vez.
Las restricciones reales de cada proyecto siempre mandan. Pero cuando tenés la opción — cuando la producción te da flexibilidad para elegir el orden — música primero es la decisión que genera menos fricción y mejores resultados.
Lo que cambia cuando hay dirección en vivo
Las sesiones con dirección en vivo por Source Connect o Zoom cambian un poco esta dinámica. Si el cliente está escuchando en tiempo real, puede pedir ajustes sobre la marcha. "Más lento en esta parte", "más energía cuando decís el nombre de la marca", "hacé una pausa antes del número de teléfono". Esa retroalimentación inmediata compensa parcialmente la falta de música durante la grabación.
Pero incluso en esas sesiones, cuando el cliente tiene la música lista y la compartimos durante la grabación, el proceso es más fluido. Las instrucciones son más precisas. "Más lento" se convierte en "seguí el tempo de la música". "Más energía" se convierte en "subí cuando sube la percusión". La música funciona como un lenguaje común entre el locutor y el director que las palabras solas no pueden replicar.
El error que veo repetirse
El error más común es tratar la música y la locución como elementos independientes que se juntan al final. "Vos grabá la voz, nosotros después le ponemos música". Como si fueran capas que se apilan sin afectarse mutuamente. Funcionan así técnicamente — el software te permite poner cualquier audio sobre cualquier otro audio. Pero el resultado es mecánico en lugar de orgánico, y las audiencias lo perciben aunque no sepan identificar qué es lo que está mal.
La música y la voz son una conversación. Y como en cualquier conversación, el orden en que hablás cambia lo que decís.
¿Necesitás una locución en español para tu próximo proyecto? Escribime y te respondo en menos de una hora.



