
Enel processament del so, elcepstrum de freqüència mel (amb acrònim anglèsMFC) és una representació de l'espectre de potència a curt termini d'un so, basat en unatransformada de cosinus lineal d'unespectre de potència logarítmica en unaescala de freqüència melno lineal.
Els coeficients cepstrals de freqüència Mel (amb acrònim anglèsMFCC) són coeficients que formen col·lectivament un MFC.[1] Es deriven d'un tipus de representaciócepstral del clip d'àudio (un "espectre d'un espectre") no lineal. La diferència entre elcepstrum i elcepstrum de freqüència mel és que al MFC, les bandes de freqüència estan igualment espaciades a l'escala mel, que s'aproxima a la resposta del sistema auditiu humà més de prop que les bandes de freqüència espaciades linealment utilitzades en l'espectre normal. Aquesta deformació de freqüència pot permetre una millor representació del so, per exemple, enla compressió d'àudio que podria reduir l'amplada debanda de transmissió i els requisits d'emmagatzematge dels senyals d'àudio.
Els MFCC es deriven habitualment de la següent manera:[2]
Aplicacions:
Els MFCC s'utilitzen habitualment com a paràmetres en sistemes dereconeixement de veu,[3] com ara els sistemes que poden reconèixer automàticament els números parlats en un telèfon.
Els MFCC també estan trobant cada vegada més usos en aplicacions derecuperació d'informació musical, com ara classificació degènere, mesures de similitud d'àudio, etc.[4]