Movatterモバイル変換

Linearna regresija

Izvor: Wikipedija

Primjer linearne regresije s jednom nezavisnom varijablom

U statistici,linearna regresija se odnosi na svaki pristup modeliranju relacija između jedne ili više varijabli označene sY, te jedne ili više varijabli označene saX, na način da takav model linearno ovisi o nepoznatim parametrimaestimiranih izpodataka. Najčešće se linearna regresija odnosi na model u kojem jeuvjetna srednja vrijednost odY, uz danu vrijednostX,afina funkcija odX.

Mnogo rjeđe, linearna regresija se može odnositi na model u kojemmedijan, ili neki drugikvantil uvjetne distribucijeY za daniX se izražava kao linearna funkcija odX. Kao i svi drugi obliciregresijske analize,linearna regresija se fokusira narazdiobu uvjetne vjerojatnosti odY za daniX, a ne narazdiobu zajedničke vjerojatnosti odY iX, što je domenamultivarijantne analize (eng.multivariate analysis)

Linerana regresija je bila prvi tipregresijske analize koja je detaljno proučavana i koja se ekstenzivno koristila u praktičnim primjenama. Razlog za ovo je taj što se modeli koji linerano ovise o svojim nepoznatim parametrima lakše modeliraju nego modeli s nelinearnom ovisnošću o parametrima. Također, statistička svojstva rezultirajućih estimatora se lakše određuju.

Linearna regresija ima mnogo praktičnih primjena. Većina aplikacija linearne regresije pada u jednu od sljedeće dvije široke kategorije:

Ako je ciljpredviđanje iliprognoza, linearna regresija se može koristiti za podešavanje preditivnog modela prema promatranom skupu podataka vrijednostiY iX. Nakon razvoja ovakvog modela, ako je data vrijednost zaX bez pripadajuće vrijednostiY, podešeni model se može koristiti za predviđanje vrijednostiY.
Ako imamo varijabluY i veći broj varijabliX₁, ...,X_p koje mogu biti povezane sY, možemo koristiti lineranu regresijsku analizu za kvantificiranje jačine relacije izmeđuY and theX_j, za procjenu koji jeX_j uopće vezan zaY, te da bi identificirali koji podskupovi odX_j sadrže redundantne informacije oY, tako da, kad je jedan od njih poznat, ostali više ne daju korisne informacije.

Linearni regresijski modeli se često podešavaju uz pomoćmetode najmanjih kvadrata, iako se mogu koristit i drugi načini, kao što je minimiziranje "nedostatka podešenja" (eng.lack of fit) u nekim drugimnormama, ili minimiziranjem penalizirane verzijefunkcije gubitaka najmanjih kvadrata, kao kodTikhonove regularizacije.

Nasuprot tome, pristup metodom najmanjih kvadrata se može iskoristiti za podešavanje neliearnih modela. Prema tome, pojmovi "najmanjih kvadrata" i "linearni model" jesu usko povezani, ali nisu sinonimi.

Uvod

[uredi |uredi kôd]

Uz zadani skuppodataka $\{y_{i},\,x_{i1},\ldots ,x_{ip}\}_{i=1}^{n}$ odnstatističkih jedinica, model linearne regresije pretpostavlja da se relacija između zavisne varijable $y_{i}$ ip-vektora regresora $x_{i}$ može aproksimativno uzeti kaolinearna. "Aproksimativno" se ovdje odnosi na "smetnje"ε_i— nepromatranu slučajnuvarijablu koja dodaješum u linearnu relaciju između zavisne varijable i regresora. Stoga, model ima oblik

y_{i}=\beta _{1}x_{i1}+\cdots +\beta _{p}x_{ip}+\varepsilon _{i}=x'_{i}\beta +\varepsilon _{i},\qquad i=1,\ldots ,n,

gdje je $x_{i}'\beta$ unutarnji produkt izmeđuvektora $x_{i}$ i $\beta$ .

Često su ovihn jednadžni složene u vektorski oblik kao

Y=X\beta +\varepsilon ,\,

gdje je

Y={\begin{pmatrix}y_{1}\\y_{2}\\\vdots \\y_{n}\end{pmatrix}},\quad X={\begin{pmatrix}x'_{1}\\x'_{2}\\\vdots \\x'_{n}\end{pmatrix}}={\begin{pmatrix}x_{11}&\cdots &x_{1p}\\x_{21}&\cdots &x_{2p}\\\vdots &\ddots &\vdots \\x_{n1}&\cdots &x_{np}\end{pmatrix}},\quad \beta ={\begin{pmatrix}\beta _{1}\\\vdots \\\beta _{p}\end{pmatrix}},\quad \varepsilon ={\begin{pmatrix}\varepsilon _{1}\\\varepsilon _{2}\\\vdots \\\varepsilon _{n}\end{pmatrix}}.

Neke napomene vezane uz terminologiju:

$y_{i}\,$ se nazivaregresand,zavisna varijabla,endogena varijabla,variabla odgovora ilimjerena varijabla. Odluka o tome koja se varijabla u skupu podataka modelira kao zavisna varijabla, a koja kao nezavisna može se temeljiti na pretpostavci da je jedna od varijabli posljedica ili pod utjecajem druge varijable.

Literatura

[uredi |uredi kôd]

Cohen, J., Cohen P., West, S.G., & Aiken, L.S. (2003).Applied multiple regression/correlation analysis for the behavioral sciences. (2nd ed.) Hillsdale, NJ: Lawrence Erlbaum Associates
Charles Darwin.The Variation of Animals and Plants under Domestication. (1869)(Chapter XIII describes what was known about reversion in Galton's time. Darwin uses the term "reversion".)
Draper, N.R. and Smith, H.Applied Regression Analysis Wiley Series in Probability and Statistics (1998)
Francis Galton. "Regression Towards Mediocrity in Hereditary Stature,"Journal of the Anthropological Institute, 15:246-263 (1886).(Facsimile at:)
Robert S. Pindyck and Daniel L. Rubinfeld (1998, 4h ed.).Econometric Models and Economic Forecasts,, ch. 1 (Intro, incl. appendices on Σ operators & derivation of parameter est.) & Appendix 4.3 (mult. regression in matrix form).

Vanjske poveznice

[uredi |uredi kôd]

https://web.archive.org/web/20070420165256/http://homepage.mac.com/nshoffner/nsh/CalcBookAll/Chapter%201/1functions.html
Investment Volatility: A Critique of Standard Beta Estimation and a Simple Way Forward, C.TofallisDownloadable version of paper, subsequently published in theEuropean Journal of Operational Research 2008.
Scale-adaptive nonparametric regression (with Matlab software).
In Situ Adaptive Tabulation Arhivirana inačica izvorne straniceod 2. svibnja 2009. (Wayback Machine): Combining many linear regressions to approximate any nonlinear function.
Earliest Known uses of some of the Words of Mathematics. See: for "error", for "Gauss-Markov theorem", for "method of least squares", and for "regression".
Perpendicular Regression Of a Line at MathPages
Online regression by eye (simulation).
Leverage Effect Interactive simulation to show the effect of outliers on the regression results
Linear regression as an optimisation problem
Visual Statistics with Multimedia Arhivirana inačica izvorne straniceod 6. ožujka 2016. (Wayback Machine)
Multiple Regression by Elmer G. Wiens. Online multiple and restricted multiple regression package.
CAUSEweb.org Many resources for teaching statistics including Linear Regression.
Arhivirana inačica izvorne straniceod 12. veljače 2012. (Wayback Machine) "Mahler's Guide to Regression"
Linear Regression - Notes, PPT, Videos, Mathcad, Matlab, Mathematica, Maple atNumerical Methods for STEM undergraduate
Restricted regression Arhivirana inačica izvorne straniceod 24. srpnja 2011. (Wayback Machine) - Lecture in the Department of Statistics, University of Udine

Dobavljeno iz "https://hr.wikipedia.org/w/index.php?title=Linearna_regresija&oldid=6895830"

Kategorije:

[8]ページ先頭