o som gravado - de uma pessoa falando por exemplo - possui trechos mais altos e trechos mais baixos: mesmo dentro de uma única frase, algumas palavras e/ou sílabas são normalmente pronunciados com tonalidade mais forte do que outras. Essa diferença é mais ou menos acentuada conforme o modo particular da fala da pessoa em questão. A mesma coisa acontece com outros sons (música, ambiente, etc...). Essa diferença de volume entre os trechos mais fortes e mais fracos chama-se curva dinâmica. Quanto maior a diferença, maior a curva dinâmica do som.

Comprimir este áudio é tornar as partes mais fortes um pouco mais suaves e, ao mesmo tempo, as partes muito suaves um pouco mais fortes, ou seja, atenuar sua curva dinâmica. O som de modo geral torna-se assim mais uniforme, uma vez que a distância entre picos e vales fica reduzida.

Existem compressores físicos (aparelhos eletrônicos) e virtuais (software). Os primeiros possuem geralmente botões do tipo "input" / "output" e medidores de intensidade sonora (VU meters) para ajuste do nível de compressão desejado. Os segundos podem consistir-se em programas separados, destinados somente a este fim, podem ser parte integrante de programas de tratamento de som ou ainda ser parte das opções disponíveis em programas de edição-não-linear.

A figura abaixo ilustra o que ocorre com o som após uma determinada taxa de compressão ter sido aplicada:

Observando-se o desenho, percebe-se a diminuição dos "picos e vales". Alguns tipos de ajustes podem ser efetuados no processo de compressão. Ao invés de permitir por exemplo que a compressão seja efetuada para qualquer nível de pico / vale, pode-se determinar que a mesma seja efetuada somente a partir de determinado nível de pico sonoro, ajuste denominado Threshold. O compressor atuará então a partir do volume especificado: para picos inferiores a este nível de volume, o som permanecerá inalterado. Outro ajuste comum é a taxa de compressão utilizada, ou seja, o quanto a distância entre picos e vales será diminuída, ajuste este denominado Ratio.

Não é recomendado aplicar-se uma taxa muito alta de compressão no caso de som gravado a partir de vozes de atores na interpretação de um texto pois, a variação de tonalidade, neste caso, é proposital para dar realce a determinados trechos e assim transmitir de maneira mais fácil as emoções e sentimentos ali presentes. Também a música não é uma boa candidata a passar por este processo, o que pode deixar o som apagado, sem brilho, de certa forma "achatado". Por outro lado, uma taxa mais alta de normalização já é aceita na voz de um narrador em um documentário por exemplo.

A compressão acarreta a diminuição do volume do som como um todo, uma vez que os picos são atenuados. Para corrigir isso, o volume geral de saída do som pode ser aumentado através de um ajuste denominado Output gain . Quando o ajuste atinge seu nível máximo, o processo denomina-se normalização.

Quando bem utilizada, a compressão do áudio é indispensável. Um exemplo ocorre em filmes, onde sem alguma compressão ter sido feita na trilha sonora, o som da explosão de uma bomba teria que ter intensidade inúmeras vezes maior do que o dos atores falando; o som demasiado forte da explosão dentro da sala do cinema traria incômodo aos expectadores e, ao mesmo tempo, estes mal conseguiriam ouvir a voz dos atores, ajustada em um nível muito baixo. Por outro lado, traillers de cinema e comerciais de TV costumam empregar níveis altos de compressão, para chamar a atenção das pessoas.