Regresija pret korelāciju
Statistikā ir svarīgi noteikt attiecību starp diviem nejaušiem mainīgajiem. Tas dod iespēju prognozēt vienu mainīgo attiecībā pret citiem. Regresijas analīze un korelācija tiek izmantota laika prognozēs, finanšu tirgus uzvedībā, fizisko attiecību nodibināšanā ar eksperimentiem un daudz reālākos pasaules scenārijos.
Kas ir regresija?
Regresija ir statistikas metode, ko izmanto divu mainīgo attiecību noteikšanai. Bieži vien, kad tiek vākti dati, var būt mainīgie, kas ir atkarīgi no citiem. Precīzu saistību starp šiem mainīgajiem var noteikt tikai ar regresijas metodēm. Šīs attiecības noteikšana palīdz izprast un paredzēt viena mainīgā uzvedību pret otru.
Visbiežāk izmanto regresijas analīzi, lai novērtētu atkarīgā mainīgā vērtību noteiktai vērtībai vai neatkarīgo mainīgo vērtību diapazonam. Piemēram, izmantojot regresiju, mēs varam noteikt sakarību starp preces cenu un patēriņu, pamatojoties uz datiem, kas savākti no nejaušas izlases. Regresijas analīze rada datu kopas regresijas funkciju, kas ir matemātisks modelis, kas vislabāk atbilst pieejamajiem datiem. To var viegli attēlot ar izkliedes diagrammu. Grafiski regresija ir līdzvērtīga dotajai datu kopai vispiemērotākās līknes atrašanai. Līknes funkcija ir regresijas funkcija. Izmantojot matemātisko modeli, preces pieprasījumu var prognozēt par noteiktu cenu.
Tāpēc regresijas analīze tiek plaši izmantota prognozēšanā un prognozēšanā. To izmanto arī, lai izveidotu attiecības eksperimentālos datos fizikas, ķīmijas un daudzu dabaszinātņu un inženierzinātņu disciplīnās. Ja attiecība vai regresijas funkcija ir lineāra funkcija, tad procesu sauc par lineāro regresiju. Izkliedes diagrammā to var attēlot kā taisnu līniju. Ja funkcija nav lineāra parametru kombinācija, tad regresija ir nelineāra.
Kas ir korelācija?
Korelācija ir divu mainīgo attiecību stipruma mērs. Korelācijas koeficients kvantitatīvi nosaka viena mainīgā lieluma izmaiņu pakāpi, pamatojoties uz izmaiņām citā mainīgajā. Statistikā korelācija ir saistīta ar atkarības jēdzienu, kas ir statistiskā sakarība starp diviem mainīgajiem.
Pīrsona korelācijas koeficients vai tikai korelācijas koeficients r ir vērtība no -1 līdz 1 (-1≤r≤+1). Tas ir visbiežāk izmantotais korelācijas koeficients un ir derīgs tikai lineārai sakarībai starp mainīgajiem. Ja r=0, sakarība nepastāv, un, ja r≥0, attiecība ir tieši proporcionāla; i., viena mainīgā vērtība palielinās, palielinoties otram. Ja r≤0, attiecība ir apgriezti proporcionāla; t.i., viens mainīgais samazinās, otram palielinoties.
Linearitātes nosacījuma dēļ korelācijas koeficientu r var izmantot arī, lai noteiktu lineāras attiecības starp mainīgajiem.
Kāda ir atšķirība starp regresiju un korelāciju?
Regresija sniedz attiecību formu starp diviem nejaušiem mainīgajiem, un korelācija norāda attiecības stipruma pakāpi.
Regresijas analīze rada regresijas funkciju, kas palīdz ekstrapolēt un prognozēt rezultātus, savukārt korelācija var sniegt tikai informāciju par to, kādā virzienā tā var mainīties.
Precīzākus lineārās regresijas modeļus dod analīze, ja korelācijas koeficients ir lielāks. (|r|≥0,8)