Cuando empezó a popularizarse el grabar en casa…
Sucedió por una sencilla razón:
El equipo analógico de las décadas pasadas estaba siendo reemplazado lenta pero inexorablemente…
Por una nueva generación de interfaces de audio y otro equipamiento digital que era más barato y más fácil de usar.
Y esa tendencia se ha mantenido desde entonces.
A día de hoy…el audio digital es el estándar en casi todos los estudios, tanto profesionales como amateurs.
Sin embargo, sorprendentemente, hay poca gente que de verdad entienda de qué va.
Por eso, en el post de hoy os traigo una completa introducción a los conceptos básicos del Audio Digital para Grabar Música.
Estos son los 9 temas que veremos:
- El Auge de la Era Digital
- Conversores Digitales
- Frecuencia de Muestreo
- Profundidad de Bits
- Ruido de Cuantización
- Tramado
- Latencia
- Reloj Maestro
- Codificación Mp3
Empecemos…
1. El Auge de la Era Digital
Aunque el audio digital es el estándar en la música actual…
No siempre ha sido así.
Originariamente, la información musical solo existía como ondas de sonido en el aire.
Luego, a medida que avanzaba la tecnología, la gente fue descubriendo nuevas formas de convertir esa información a otros formatos, incluyendo:
- notas en una página
- señales eléctricas dentro de un cable
- ondas de radio en la atmósfera
- relieve en discos de vinilo
Pero al final, con el auge de los ordenadores, el audio digital acabó siendo el formato dominante en la industria de la producción musical, puesto que permitía copiar y transportar canciones de forma sencilla y gratuita.
Y el dispositivo que hizo que todo eso fuera posible fue…el conversor digital.
Veamos cómo funcionan…
2. Conversores Digitales
En los estudios de grabación hay 2 tipos de conversores digitales:
- Los que son un dispositivo independiente, que normalmente se ven en los estudios más avanzados, o…
- Los que están integrados en las interfaces de audio, que se suelen ver en los home studios.
Para convertir el audio a código binario, toman decenas de miles de muestras (samples) por segundo para hacerse una imagen «aproximada» de la forma de onda analógica.
La imagen no es exacta porque en los intervalos entre muestras, el conversor básicamente tiene que adivinar lo que está pasando.
Como puedes ver en el diagrama, en el que:
- la línea roja es la señal analógica, y…
- la línea negra es la conversión…
Los resultados no son perfectos, pero son lo suficientemente buenos como para generar una calidad de sonido excelente.
¿Cómo de excelente? Eso depende en gran medida de…
3. Frecuencia de Muestreo
Echa un vistazo a esta imagen:
Como puedes ver…
Al tomar más muestras por segundo, la frecuencia de muestreo más alta:
- Recaba información más real,
- Acude menos a la estimación, y
- Genera una imagen mucho más precisa de la señal analógica.
Lógicamente, el resultado final es…una mejor calidad de sonido.
Hablemos de datos en concreto:
Las frecuencias de muestreo normales en el audio profesional oscilan alrededor de:
- 44.1 kHz (CD de audio)
- 48 kHz
- 88.2 kHz
- 96 kHz
- 192 kHz
El mínimo de 44.1kHz se debe a un principio matemático conocido como…
El Teorema de Muestreo de Nyquist-Shannon
Para grabar audio digital de forma precisa, los conversores tienen que captar todo el espectro de escucha humano, que se sitúa entre 20Hz – 20kHz.
Según el Teorema de Muestreo de Nyquist-Shannon…
Para capturar una frecuencia específica se necesitan al menos 2 muestras para cada ciclo…para medir tanto el punto superior como el inferior de la onda de sonido.
Eso significa que las frecuencias de grabación de hasta 20kHz requieren de una tasa de muestreo de 40kHz o más, lo cual explica por qué los CDs de audio están justo por encima de ese mínimo, a 44.1 kHz.
El Coste de una Frecuencia de Muestreo Elevada
Aunque es cierto que las frecuencias de muestreo elevadas producen una mejor calidad de sonido…eso tiene un precio.
Ese precio se traduce en:
- Mayor carga de procesamiento.
- Menor número de pistas.
- Archivos de audio más pesados.
Así que siempre das algo a cambio. Los estudios profesionales pueden soportar frecuencias de muestreo más altas porque utilizan un equipo mejor.
Pero para la mayoría de home studios, la gente suele encontrarse con que la configuración estándar de 48 kHz es la mejor.
Siguiente…
4. Profundidad de Bits
Para poder entender qué es la profundidad de bits, primero tenemos que saber qué son los bits.
Un bit (o dígito binario) es una única unidad de código binario, con un valor de 1 o de 0.
Cuantos más bits, más combinaciones posibles. Por ejemplo…
Como puede ver en el diagrama de debajo, 4 bits permiten un total de 16 combinaciones.
Cuando se usan para codificar información, a cada uno de estos números se le asigna un valor específico.
Al aumentar el número de bits, los posibles valores crecen exponencialmente.
- 4 Bits = 16 valores posibles
- 8 Bits = 256 valores posibles
- 16 Bits = 16,536 valores posibles
- 24 Bits = 16,777,215 valores posibles
Con la profundidad de bits en el audio digital, a cada valor se le asigna una amplitud específica de la forma de onda.
A mayor profundidad de bits, mayor incremento de volumen entre alto y bajo…y mayor rango dinámico en la grabación.
Una buena regla general es: por cada bit extra, el rango dinámico aumenta en 6dB.
Por ejemplo:
- 4 Bits = 24 dB
- 8 Bits = 48 dB
- 16 Bits = 96 dB
- 24 Bits = 144 dB
Al final, lo que esto significa es que…a mayor profundidad de bits, menos ruido.
Porque al añadir más margen de procesamiento (o headroom), la señal útil (en el extremo alto del espectro) puede grabarse más alto por encima del ruido de fondo (en el extremo bajo del espectro).
Siguiente…
5. Ruido de Cuantización
Impresiona que una grabación a 24 bits pueda resultar en casi 17 millones de valores posibles ¿verdad?
Sin embargo, eso sigue siendo mucho menos que el infinito número de posibles valores que existen en una señal analógica.
Por eso, en casi todas las muestras, el valor real se encuentra en algún punto intermedio entre dos posibles valores. La solución del conversor es simplemente redondearlo o «cuantizarlo» al valor más cercano.
La distorsión resultante, conocida como ruido de cuantización tiene lugar en 2 fases del proceso de grabación:
- al principio, durante la conversión A/D, y
- al final, durante la masterización
Con la masterización, la frecuencia de muestreo/profundidad de bits de la pista final suele reducirse al hacer la conversión al formato digital final (CD, mp3, etc.).
Cuando eso pasa, parte de la información se borra y se «re-cuantiza», generando más distorsión en el sonido.
La solución más frecuente para lidiar con ese problema es…
6. Tramado
Al reducir un archivo de 24 bits a 16 bits, se utiliza el tramado para enmascarar gran parte de la distorsión resultante…
Añadiendo un nivel bajo de «ruido aleatorio» a la señal de audio.
Como puede ser difícil visualizar el concepto en audio, para explicarlo se suele acudir a la analogía popular del tramado en imágenes.
Así es como funciona:
Cuando una foto a color se convierte a blanco y negro, se hace una estimación matemática para determinar si cada pixel en color debe ser «cuantizado» en un pixel negro, o en uno blanco…
Al igual que sucede cuando se cuantizan las muestras del audio digital.
Como puedes ver en esta imagen, la foto del «antes» es bastante mala ¿verdad?
Pero con el tramado…
- un pequeño número de pixels blancos se distribuyen al azar en las partes negras, y…
- un pequeño número de pixels negros se distribuyen al azar en las partes blancas…
Al añadir ese «ruido aleatorio» a la imagen, la foto del «después» queda mucho mejor. Pues bien, el tramado en el audio funciona de forma muy parecida.
Siguiente…
7. Latencia
El GRAN PROBLEMA de los estudios digitales actuales es la cantidad de latencia que se acumula en la cadena de señal, especialmente con los DAWs.
Con todos los cálculos que se procesan, la señal de audio tarda en salir del sistema entre unos cuantos milisegundos y unas cuantas DOCENAS de milisegundos.
- Entre 0-11 ms de latencia – es lo suficientemente corto, por lo que una persona normal no lo nota.
- Entre 11-22 ms – se escucha un molesto retraso al que cuesta acostumbrarse.
- Más de 22 ms – hay tanto retraso que se hace imposible tocar o cantar a tempo con la pista.
En una cadena de señal digital normal suele haber 4 fases que contribuyen al total de latencia:
- Conversión A/D
- Buffer del DAW
- Delay de los Plugins
- Conversión A/D
La conversión A/D y la D/A son las menos nocivas, contribuyendo a la latencia total con menos de 5 ms.
Sin embargo…
El buffer del DAW y ciertos plugins (incluidos los compresores y los instrumentos virtuales) pueden añadir hasta 20, 30 o 40 ms o más.
Para mantener la latencia al mínimo:
- Desactiva todos los plugins innecesarios durante la grabación.
- Juega con la configuración del buffer del DAW hasta encontrar cuál es el tiempo mínimo con el que tu ordenador pueda trabajar sin bloquearse.
Como verás, los tiempos del buffer se miden en muestras, NO en milisegundos. Para hacer la conversión:
- Divide el número de muestras por la frecuencia de muestreo (en kHz) de la sesión para averiguar el tiempo de latencia en milisegundos.
Por ejemplo: 1024 muestras ÷ 44.1 kHz = 23 ms.
Si odias las mates, aquí va una forma fácil de recordarlo a 44.1 kHz:
- 256 muestras = 6 ms
- 512 muestras = 12 ms
- 1024 muestras = 24 ms
En la MAYORÍA de los casos, seguir estos pasos debería reducir la latencia hasta un nivel manejable.
Pero a veces, cuando el equipo es demasiado viejo o demasiado barato, puede que no lo consigas.
En ese caso…
Ultimo Recurso
Muchas interfaces baratas tienen una perilla de «mix» o «mezcla» que te permite intercambiar entre la reproducción de la sesión y la señal que se está grabando en directo.
Al dividir la señal en directo del micrófono/guitarra y enviar la mitad al ordenador para ser grabada y la otra mitad directamente a los auriculares de estudio, evitas la latencia al esquivar la cadena de señal por completo.
El inconveniente de esta técnica es que…la señal en directo se escucha totalmente seca y sin ningún efecto.
Dado que los ordenadores son cada vez más rápidos, esperemos que eso deje de suponer un problema en un futuro cercano.
Siguiente…
8. Reloj Maestro
Cuando dos o más dispositivos intercambian información digital a tiempo real…
Sus relojes internos tienen que estar sincronizados para que las muestras se mantengan alineadas…
Evitando que aparezcan esos molestos ruidos en el sonido.
Para sincronizarlos, un dispositivo funciona como «maestro» y el resto como «esclavos«.
En los home studios sencillos, el reloj de la interfaz de audio suele liderar por defecto.
En los estudios profesionales, que requieren de una conversión digital premium y un complejo ruteo de señal…
Se utiliza un dispositivo independiente especial llamado reloj digital maestro (o word clock). Como afirman muchos propietarios de estudios, las mejoras en el sonido provocadas por estos relojes de gama alta pueden ser mucho menos sutiles de lo que imaginas.
Siguiente…
9. Codificación Mp3/AAC
A día de hoy, los archivos de audio comprimidos son totalmente normales en el mundo del audio digital.
Porque con los límites de almacenamiento de los iPods, smartphones y el streaming en Internet, los archivos tienen que ser lo menos pesados posible.
Utilizando la compresión de datos, los formatos mp3, AAC y otros similares pueden reducir el tamaño de los archivos de audio a una décima parte de su tamaño original.
El codificado se basa en un principio de la escucha humana conocido como «enmascaramiento sonoro«…
Que hace posible eliminar gran cantidad de información musical manteniendo un nivel aceptable en la calidad de sonido.
Los productores experimentados pueden notar la diferencia, pero el consumidor medio no.
La cantidad exacta de información que se elimina depende de la tasa de bits del archivo.
A mayor tasa de bits, menos información se elimina, conservando un mayor nivel de detalle.
Por ejemplo, con mp3:
- 320 kbit/s es la máxima tasa de bits posible.
- 128 kbit/s es el mínimo recomendado.
- 256 kbit/s es el punto medio y la opción preferida para la mayoría.
Para encontrar la tasa de bits ideal para TU música, siempre debes echarle un vistazo a las recomendaciones del destino (iTunes, YouTube, Soundcloud etc.).