Vidējā pret vidējo pret režīmu
Vidējā vērtība, mediāna un režīms ir galvenie centrālās tendences rādītāji, ko izmanto aprakstošajā statistikā. Tie ir pilnīgi atšķirīgi viens no otra, un arī gadījumi, kad tos izmanto datu apkopošanai, ir atšķirīgi.
Nozīmē
Vidējais aritmētiskais ir datu vērtību summa, kas dalīta ar datu vērtību skaitu, t.i.,
[latekss]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Ja dati ir no izlases telpas, tos sauc par izlases vidējo ([latekss]\bar{x} [/latekss]), kas ir parauga aprakstoša statistika. Lai gan tas ir visbiežāk izmantotais parauga aprakstošais rādītājs, tā nav stabila statistika. Tas ir ļoti jutīgs pret novirzēm un svārstībām.
Piemēram, ņemiet vērā konkrētas pilsētas iedzīvotāju vidējos ienākumus. Tā kā visas datu vērtības tiek summētas un pēc tam sadalītas, ārkārtīgi turīgas personas ienākumi būtiski ietekmē vidējos rādītājus. Tāpēc vidējās vērtības ne vienmēr labi atspoguļo datus.
Arī mainīga signāla gadījumā strāva, kas iet caur elementu, periodiski mainās no pozitīvā virziena uz negatīvo virzienu un otrādi. Ja mēs ņemam vidējo strāvu, kas iet caur elementu vienā periodā, tas dos 0, kas nozīmē, ka strāva nav izgājusi caur elementu, kas acīmredzami nav taisnība. Tāpēc arī šajā gadījumā vidējais aritmētiskais nav labs rādītājs.
Vidējais aritmētiskais ir labs rādītājs, ja dati ir vienmērīgi sadalīti. Normālam sadalījumam vidējais ir vienāds ar režīmu un mediānu. Tam ir arī zemākie atlikumi, ņemot vērā vidējo kvadrātisko kļūdu; tāpēc vislabākais aprakstošais pasākums, ja datu kopa ir jāattēlo ar vienu skaitli.
Mediāna
Vidējā datu punkta vērtības pēc visu datu vērtību sakārtošanas augošā secībā tiek definētas kā datu kopas mediāna. Mediāna ir 2. kvartile, 5. decile un 50. procentile.
• Ja novērojumu (datu punktu) skaits ir nepāra, tad mediāna ir novērojums tieši sakārtotā saraksta vidū.
• Ja novērojumu (datu punktu) skaits ir pāra, tad mediāna ir divu vidējo novērojumu vidējā vērtība sakārtotajā sarakstā.
Mediāna novērojumu sadala divās grupās; i., grupa (50%) vērtību, kas ir augstāka par vidējo vērtību, un grupa (50%) vērtību, kas ir zemāka par vidējo. Mediānas tiek īpaši izmantotas šķībos sadalījumos, un tās atspoguļo datus diezgan labāk nekā aritmētiskais vidējais.
Režīms
Režīms ir visbiežāk sastopamais skaitlis novērojumu kopā. Datu kopas režīms tiek aprēķināts, atrodot katra elementa biežumu kopā.
• Ja neviena vērtība nav sastopama vairāk kā vienu reizi, datu kopai nav režīma.
• Pretējā gadījumā jebkura vērtība, kas parādās ar vislielāko biežumu, ir datu kopas režīms.
Kopā var būt vairāk nekā 1 režīms; tāpēc režīms nav unikāla datu kopas statistika. Vienmērīgā sadalījumā ir viens režīms. Diskrētā varbūtības sadalījuma režīms ir punkts, kurā varbūtības masas funkcija sasniedz augstāko punktu. Atveidojot no iepriekš minētajām interpretācijām, mēs varam teikt, ka globālie maksimumi ir režīmi.
Apsveriet visu trīs pasākumu piemērošanu šādai datu kopai.
DATI: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Vidējā=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Mediāna=9 (13. elements)
Režīms=9 (biežums 9=5)
Kāda ir atšķirība starp vidējo, vidējo un režīmu?
• Vidējais aritmētiskais ir vērtību (novērojumu) summa, kas dalīta ar novērojumu skaitu. Tā nav stabila statistika, un tā ir ļoti atkarīga no normālā sadalījuma rakstura aplūkotajā sadalījumā. Atsevišķa novirze var izraisīt ievērojamas vidējās izmaiņas, sniedzot salīdzinoši maldinošas vērtības. Šo jēdzienu var attiecināt uz vidējo ģeometrisko, harmonisko vidējo, svērto vidējo un tā tālāk.
• Mediāna ir novērojumu kopas vidējās vērtības, un to relatīvi mazāk ietekmē novirzes. Tas var sniegt labu aprēķinu kā statistikas kopsavilkums ļoti novirzītos gadījumos.
• Režīms ir visizplatītākās novērojumu vērtības datu kopā. Ja sadalījums ir pozitīvs šķībs, režīms atrodas pa kreisi līdz mediānai un, ja ir negatīvs, režīms atrodas pa labi līdz mediānai.
• Ja tas ir pozitīvi šķībs, vidējais atbilst mediānai; ja negatīvi šķībs vidējais ir pa kreisi no mediānas.
• Normālajā sadalījumā visi trīs, vidējais, režīms un mediāna, ir vienādi.