Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Dalamteori probabilitas danstatistika,korelasi, juga disebutkoefisien korelasi, adalah nilai yang menunjukkan kekuatan dan arah hubungan linier antara duapeubah acak (random variable).
Korelasi linier antara 1000 pasang pengamatan. Data digambarkan pada bagian kiri bawah dan koefisien korelasinya ditunjukkan pada bagian kanan atas. Setiap titik pengamatan berkorelasi maksimum dengan dirinya sendiri, sebagaimana ditunjukkan pada diagonal (seluruh korelasi = +1).
Korelasi ρX, Y antara duapeubah acakX danY dengan nilai yang diharapkan μX dan μY dansimpangan baku σX dan σY didefinisikan sebagai:
Karena μX = E(X),σX2 = E(X2) − E2(X) dandemikian pula untukY, maka dapat pula ditulis
Korelasi dapat dihitung bila simpangan baku finit dan keduanya tidak sama dengan nol. Dalam pembuktianketidaksamaan Cauchy-Schwarz, koefisien korelasi tak akan melebihi dari 1 dalamnilai absolut. Korelasi bernilai 1 jika terdapat hubungan linier yang positif, bernilai -1 jika terdapat hubungan linier yang negatif, dan antara -1 dan +1 yang menunjukkan tingkatdependensi linier antara dua variabel. Semakin dekat dengan -1 atau +1, semakin kuat korelasi antara kedua variabel tersebut.
Jika variabel-variabel tersebutsaling bebas, nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksiketergantungan linier antara kedua variabel. Misalnya, peubah acakX berdistribusi uniform pada interval antara -1 dan +1, danY =X2. Dengan demikian nilaiY ditentukan sepenuhnya olehX, sehingga
Koefisien korelasi Pearson merupakanstatistik parametrik, dan ia kurang begitu menggambarkan korelasi bila asumsi dasarnormalitas suatu data dilanggar. Metode korelasinon-parametrik sepertiρ Spearman andτ Kendall berguna ketika distribusi tidak normal. Koefisien korelasi non-parametrik masih kurangkuat bila dibandingkan dengan metode parametrik jika asumsi normalitas data terpenuhi, tetapi cenderung memberikan hasil distrosi ketika asumsi tersebut tak terpenuhi.
Metode pengukuran yang lain untuk mengetahui dependensi antara dua peubah acak
Untuk mendapatkan suatu pengukuran mengenai dependensi data (juga nonlinier), dapat digunakanrasio korelasi yang mampu mendeteksi hampir segala dependensi fungsional.
Banyak orang yang keliru menganggap bahwa informasi yang diberikan dari sebuh koefisien korelasi sudah cukup mendefinisikan struktur ketergantungan (dependensi) antara peubah acak. Namun untuk mengetahui adanya ketergantungan antara peubah acak harus dipertimbangkan pulakopula antara keduanya. Koefisien korelasi dapat didefinisikan sebagai struktur ketergantungan hanya pada beberapa kasus, misalnya dalamfungsi distribusi kumulatif padadistribusi normal multivariat.
Matriks korelasin peubah acakX1, ...,Xn adalahn × n matrik dimanai,j adalah corr(Xi, Xj). Jika ukuran korelasi yang digunakan adalah koefisien momen-produk, matriks korelasi akan sama denganmatriks kovarians peubah acak yang telah distandarkanXi /SD(Xi) untuki = 1, ..., n. Sehingga, matriks korelasi merupakan matriks definit tak-negatif.
Matriks korelasi selalu simetris, yakni korelasi antara dan adalah sama dengan korelasi antara and).