Kategoriskie dati pret skaitliskiem datiem
Dati ir fakti vai informācija, kas savākta atsauces vai analīzes nolūkos. Bieži vien šie dati tiek vākti kā attiecīgā subjekta atribūts. Šis atribūts var atšķirties no cita, tāpēc šo mainīgo atribūtu var uzskatīt par mainīgo. Mainīgajiem var būt dažādas vērtību formas, un tās ir raksturīgas savāktajiem datiem.
Mainīgie var būt vai nu kvalitatīvi, vai kvantitatīvi; i., ja mainīgais ir kvantitatīvs, atbildes ir skaitļi un izmērītā atribūta lielumu var norādīt ar noteiktu precizitātes pakāpi. Otrs veids, kvalitatīvie mainīgie, mēra kvalitatīvos atribūtus, un mainīgo pieņemtās vērtības nevar norādīt lieluma vai lieluma izteiksmē. Paši mainīgie ir zināmi kā kategoriski mainīgie, un dati, kas savākti, izmantojot kategorisko mainīgo, ir kategoriski dati.
Vairāk par skaitliskiem datiem
Ciparu dati būtībā ir kvantitatīvi dati, kas iegūti no mainīgā, un vērtībai ir lieluma/lieluma izjūta. Iegūtos skaitliskos datus tālāk iedala vēl trīs kategorijās, pamatojoties uz Stenlija Smita Stīvensa izstrādāto teoriju. Skaitliskie dati var būt kārtas, intervāla vai attiecības. Datu veidu nosaka vērtību mērīšanas metode, un tos sauc par mērījumu līmeņiem.
Cilvēka svars, attālums starp diviem punktiem, temperatūra un akcijas cena ir skaitlisku datu piemēri.
Statistikā lielākā daļa metožu ir atvasinātas skaitlisko datu analīzei. Skaitlisko datu analīzei galvenokārt tiek izmantota aprakstošā pamata statistika un regresijas un citas secināšanas metodes.
Vairāk par kategoriskiem datiem
Kategoriskie dati ir kvalitatīva mainīgā vērtības, bieži vien skaitlis, vārds vai simbols. Tie parāda faktu, ka mainīgais attiecīgajā gadījumā pieder vienai no vairākām pieejamajām izvēlēm. Tāpēc tie pieder pie vienas no kategorijām; tāpēc nosaukums kategorisks.
Cilvēka politiskā piederība, cilvēka tautība, cilvēka mīļākā krāsa un pacienta asins grupa ir kvalitatīvi atribūti. Dažreiz skaitli var iegūt kā kategorisku vērtību, bet pats skaitlis neatspoguļo izmērītā atribūta lielumu. Viens piemērs ir pasta indekss.
Arī jebkuras kategoriskas vērtības pieder nominālajam datu tipam, kas ir cits veids, kura pamatā ir mērījumu līmeņi. Kategorisku datu analīzei izmantotās metodes atšķiras no skaitlisko datu analīzes metodēm, taču pamatā esošais princips var būt vienāds.
Kāda ir atšķirība starp kategoriskiem un skaitliskiem datiem?
• Skaitliskie dati ir vērtības, kas iegūtas kvantitatīvajam mainīgajam, un tiem ir lieluma sajūta, kas saistīta ar mainīgā kontekstu (tātad tie vienmēr ir skaitļi vai simboli ar skaitlisku vērtību). Kategoriskie dati ir vērtības, kas iegūtas kvalitatīvam mainīgajam; kategoriskiem datu skaitļiem nav nozīmes.
• Skaitliskie dati vienmēr pieder pie kārtas, attiecības vai intervāla veida, savukārt kategoriskie dati pieder nominālajam tipam.
• Kvantitatīvo datu analīzei izmantotās metodes atšķiras no kategoriskiem datiem izmantotajām metodēm, pat ja principi ir vienādi, vismaz lietojumprogrammai ir būtiskas atšķirības.
• Skaitliskie dati tiek analizēti, izmantojot statistikas metodes aprakstošajā statistikā, regresijā, laikrindās un daudz ko citu.
• Kategoriskiem datiem parasti tiek izmantotas aprakstošās metodes un grafiskās metodes. Tiek izmantoti arī daži neparametriskie testi.