Variance pret kovariāciju
Variance un kovariance ir divi statistikā izmantotie rādītāji. Variance ir datu izkliedes mērs, un kovariance norāda divu nejaušo mainīgo izmaiņu pakāpi kopā. Variance ir drīzāk intuitīvs jēdziens, bet kovariance ir matemātiski definēta sākotnēji ne tik intuitīvi.
Vairāk par novirzi
Variance ir datu izkliedes rādītājs no sadalījuma vidējās vērtības. Tas norāda, cik tālu datu punkti atrodas no sadalījuma vidējā. Tas ir viens no primārajiem varbūtības sadalījuma deskriptoriem un viens no sadalījuma momentiem. Arī dispersija ir populācijas parametrs, un izlases dispersija no kopas darbojas kā kopas dispersijas aplēses. No vienas perspektīvas tas ir definēts kā standarta novirzes kvadrāts.
Vienkāršā valodā to var raksturot kā attāluma starp katru datu punktu kvadrātu vidējo vērtību un sadalījuma vidējo vērtību. Lai aprēķinātu novirzi, tiek izmantota šāda formula.
Var(X)=E[(X-µ)2] populācijai un
Var(X)=E[(X-‾x)2] paraugam
To var vēl vairāk vienkāršot, norādot Var(X)=E[X2]-(E[X])2.
Variance ir dažas paraksta īpašības, un to bieži izmanto statistikā, lai vienkāršotu lietošanu. Izkliede nav negatīva, jo tā ir attālumu kvadrāts. Tomēr dispersijas diapazons nav ierobežots un ir atkarīgs no konkrētā sadalījuma. Pastāvīga gadījuma lieluma dispersija ir nulle, un dispersija nemainās attiecībā uz atrašanās vietas parametru.
Vairāk par kovariāciju
Statistikas teorijā kovariācija ir mērījums tam, cik daudz mainās divi nejaušie mainīgie kopā. Citiem vārdiem sakot, kovariācija ir divu nejaušu mainīgo korelācijas stipruma mērs. To var uzskatīt arī par divu nejaušu lielumu dispersijas jēdziena vispārinājumu.
Divu gadījuma lielumu X un Y kovariācija, kas ir kopīgi sadalīti ar ierobežotu otro impulsu, ir zināma kā σXY=E[(X-E[X])(Y-E[Y])]. No tā dispersiju var uzskatīt par īpašu kovariācijas gadījumu, kur divi mainīgie ir vienādi. Cov(X, X)=Var(X)
Normalizējot kovariāciju, var iegūt lineāro korelācijas koeficientu vai Pīrsona korelācijas koeficientu, ko definē kā ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Grafiski kovariāciju starp datu punktu pāriem var uzskatīt par taisnstūra laukumu ar datu punktiem pretējās virsotnēs. To var interpretēt kā divu datu punktu atdalīšanas lieluma mēru. Ņemot vērā visas populācijas taisnstūrus, par atdalīšanas spēku var uzskatīt taisnstūru pārklāšanos, kas atbilst visiem datu punktiem; divu mainīgo lielumu dispersija. Kovariance ir divās dimensijās divu mainīgo dēļ, bet, vienkāršojot to līdz vienam mainīgajam, viena dispersija tiek iegūta kā atdalīšana vienā dimensijā.
Kāda ir atšķirība starp dispersiju un kovariāciju?
• Variance ir izkliedes/dispersijas mērs populācijā, savukārt kovariance tiek uzskatīta par divu nejaušu lielumu variācijas vai korelācijas stipruma mērījumu.
• Variāciju var uzskatīt par īpašu kovariācijas gadījumu.
• Izkliede un kovariance ir atkarīgas no datu vērtību lieluma, un tās nevar salīdzināt; tāpēc tie tiek normalizēti. Kovariāciju normalizē korelācijas koeficientā (dalot ar divu gadījuma lielumu standartnoviržu reizinājumu), un dispersiju normalizē standartnovirzē (ņemot kvadrātsakni)