Korrelasjon, ellersamvariasjon (skrives vanligvis somcorr eller barer), er istatistikk og sannsynlighetsregning et mål på styrken og retningen mellom to kvantitativevariabler[1]. Korrelasjon bli ofte målt i enkorrelasjonskoeffisient.
Empirisk observert korrelasjon er ikke tilstrekkelig for å fastslå at det erkausalitet (dvs. at en variabel forårsaker en annen), da korrelasjon også kan være resultat avspuriøse sammenhenger.
Fire datasett som alle har korrelasjonen 0,81. (Eksempel hentet fra Francis Anscombe.)
Korrelasjonskoeffisient (ofte kun referert til som korrelasjonen) er et mål på den underliggende avhengigheten mellom tostokastiske variabler. Målet vil alltid ligge mellom -1 og 1: En korrelasjon nær null betyr at det ikke eksisterer noen lineær sammenheng mellom de to variablene. En positiv korrelasjonskoeffisient indikerer en positiv sammenheng, mens en negativ korrelasjonskoeffisient indikerer en negativ sammenheng[2].
Korrelasjonen mellom og noteres ofte som. For to stokastiske variabler og er korrelasjonen definert som:
Denne korrelasjonskoeffisienten er alltid -1 ≤ Corr ≤ 1. Dersom korrelasjonen mellom og er lik -1 eller +1, så er det en lineær sammenheng mellom de to. Med andre ord finnes det to konstanter og slik at:
En investor som ønsker 2 aksjer som er uavhengige av hverandre vil søke å kjøpe 2 aksjer med lav korrelasjon. Da vil ikke porteføljen stige/falle like raskt som hvis aksjene hadde positiv korrelasjon.