Atšķirība starp centrālo tendenci un izkliedi

Atšķirība starp centrālo tendenci un izkliedi
Atšķirība starp centrālo tendenci un izkliedi

Video: Atšķirība starp centrālo tendenci un izkliedi

Video: Atšķirība starp centrālo tendenci un izkliedi
Video: СУПЕРСИММЕТРИЯ vs MУЛЬТИВСЕЛЕННАЯ. БОЛЬШОЙ АДРОННЫЙ КОЛЛАЙДЕР — ТОПЛЕС 2024, Jūlijs
Anonim

Centrālā tendence pret izkliedi

Aprakstošajā un secinošajā statistikā tiek izmantoti vairāki indeksi, lai aprakstītu datu kopu, kas atbilst tās centrālajai tendencei, izkliedei un šķībumam: trīs vissvarīgākās īpašības, kas nosaka datu kopas sadalījuma relatīvo formu.

Kas ir galvenā tendence?

Centrālā tendence attiecas uz vērtību sadalījuma centru un nosaka to. Vidējais, režīms un mediāna ir visbiežāk izmantotie indeksi, lai aprakstītu datu kopas centrālo tendenci. Ja datu kopa ir simetriska, tad gan datu kopas mediāna, gan vidējais sakrīt.

Dotā datu kopa, vidējo aprēķina, ņemot visu datu vērtību summu un pēc tam dalot to ar datu skaitu. Piemēram, 10 cilvēku svars (kilogramos) tiek mērīts kā 70, 62, 65, 72, 80, 70, 63, 72, 77 un 79. Tad desmit cilvēku vidējo svaru (kilogramos) var aprēķināt aprēķina šādi. Svaru summa ir 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Vidējais=(summa) / (datu skaits)=710 / 10=71 (kilogramos). Tiek saprasts, ka novirzes (datu punkti, kas atšķiras no parastās tendences) mēdz ietekmēt vidējo. Tādējādi, ja ir novirzes, vidējais vien nedos pareizu priekšstatu par datu kopas centru.

Mediāna ir datu punkts, kas atrodas tieši datu kopas vidū. Viens veids, kā aprēķināt mediānu, ir sakārtot datu punktus augošā secībā un pēc tam atrast datu punktu vidū. Piemēram, ja vienreiz pasūtīts, iepriekšējā datu kopa izskatās šādi: 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Tāpēc (70+72)/2=71 atrodas vidū. No tā redzams, ka mediānai datu kopā nav jābūt. Ārējo vērtību klātbūtne mediānu neietekmē. Tādējādi mediāna kalpos kā labāks centrālās tendences mērs, ja ir novirzes.

Režīms ir visbiežāk sastopamā vērtība datu kopā. Iepriekšējā piemērā gan vērtība 70, gan 72 notiek divas reizes, un tādējādi abi ir režīmi. Tas parāda, ka dažos sadalījumos ir vairāk nekā viena modālā vērtība. Ja ir tikai viens režīms, tiek uzskatīts, ka datu kopa ir unimodāla, šajā gadījumā datu kopa ir bimodāla.

Kas ir dispersija?

Dispersija ir datu izplatības apjoms par sadalījuma centru. Diapazons un standarta novirze ir visbiežāk izmantotie dispersijas mēri.

Diapazons ir vienkārši lielākā vērtība mīnus mazākā vērtība. Iepriekšējā piemērā lielākā vērtība ir 80 un zemākā vērtība ir 62, tātad diapazons ir 80-62=18. Taču diapazons nesniedz pietiekamu priekšstatu par izkliedi.

Lai aprēķinātu standartnovirzi, vispirms tiek aprēķinātas datu vērtību novirzes no vidējā. Noviržu vidējo kvadrātisko sakni sauc par standarta novirzi. Iepriekšējā piemērā attiecīgās novirzes no vidējā ir (70-71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80 - 71)=9, (70 - 71)=-1, (63 - 71)=-8, (72 - 71)=1, (77 - 71)=6 un (79 - 71)=8. novirzes kvadrāti ir (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 Standarta novirze ir √(366/10)=6,05 (kilogramos). Ja vien datu kopa nav ļoti šķība, no tā var secināt, ka lielākā daļa datu ir intervālā 71±6,05, un tas tā ir arī šajā konkrētajā piemērā.

Kāda ir atšķirība starp centrālo tendenci un izkliedi?

• Centrālā tendence attiecas uz un nosaka vērtību sadalījuma centru

• Dispersija ir datu izplatības apjoms par datu kopas centru.

Ieteicams: