De kategorisk variabel Det er den som brukes i statistikk for å tildele et ikke-numerisk eller kvalitativt kjennetegn eller en eiendom til noe objekt, individ, enhet, tilstand eller prosedyre. Det er mulig å definere alle slags kategoriske variabler etter hvert behov.
Eksempler på kategoriske variabler er: farge, kjønn, blodgruppe, sivilstand, type materiale, betalingsmåte eller bankkonto, og de brukes mye daglig..
Ovennevnte er variablene, men deres mulige verdier er kvalitative, det vil si av kvalitet eller karakteristisk og ikke av en numerisk måling. For eksempel mulige verdier for variabelen kjønn De er: hann , hembra.
Når denne variabelen er lagret i et dataprogram, kan den deklareres som en tekstvariabel, og de eneste aksepterte verdiene er de som allerede er navngitt: Mann , Hunn.
Men den samme variabelen kjønn kan deklareres og lagres som et heltall hvis a Mann er tildelt 1 allerede Hunn verdien tildeles to. Det er av denne grunn at kategoriske variabler noen ganger blir referert til som enumerert type.
Hovedkarakteristikken til kategoriske variabler er at i motsetning til andre variabler, som kontinuerlig og diskret, er det ikke mulig å gjøre regning med dem. Du kan imidlertid gjøre statistikk med dem, som du vil se senere.
Artikkelindeks
Legg merke til følgende eksempler på kategoriske variabler og deres mulige verdier:
-Blodtype, Verdiområde: A, B, AB, O
-Sivil status, Kategoriske verdier: Enkelt (TIL), Gift (B), Enkemann (C) , Skilt (D).
-Type materiale, Kategorier eller verdier: 1 = Tre, 2 = Metall, 3 = Plast
-Måte å betale, Verdier eller kategorier: (1) Kontanter, (2) Debet, (3) Overføring, (4) Kreditt
I de foregående eksemplene har et nummer blitt assosiert med hver kategori på en helt vilkårlig måte.
Man kunne da tenke at denne vilkårlige numeriske assosiasjonen gjør det lik a diskret kvantitativ variabel, men det er det ikke, siden aritmetiske operasjoner ikke kan gjøres med disse tallene.
For å illustrere ideen, i variabelen Måte å betale, sumoperasjonen gir ikke mening:
(1) Kontanter + (2) Debet vil aldri være lik (3) Overføring
Rangeringen er basert på om de har et implisitt hierarki eller om antallet mulige utfall er mer enn to eller to.
En kategorisk variabel med bare ett mulig utfall er ikke en variabel, den er en kategorisk konstant.
Når de ikke kan være representert med et nummer eller ha noen ordre. For eksempel variabelen: Materielltype, thar nominelle verdier (Tre, metall, plast), har de ikke noe hierarki eller rekkefølge, selv når et vilkårlig nummer er tildelt hvert svar eller kategori.
Variabel: Akademisk ytelse
Nominelle verdier: Høy, Middels, Lav
Selv om verdiene til denne variabelen ikke er numeriske, har de en implisitt rekkefølge eller et hierarki.
Dette er nominelle variabler med to mulige svar, for eksempel:
-Variabel: Svar
-Nominelle verdier: ekte, Forfalskning
Merk at variabelen Svar det har ikke et implisitt hierarki og har bare to mulige utfall, så det er en binær kategorisk variabel.
Noen forfattere kaller denne typen binær variabel, og anser det ikke å tilhøre kategoriske variabler som er begrenset til de med mer enn tre mulige kategorier.
Statistikk kan gjøres med kategoriske variabler, til tross for at de ikke er numeriske eller kvantitative variabler. For å vite trenden eller mest sannsynlige verdien av en kategorisk variabel, ta Mote.
Mote det er i dette tilfellet det mest gjentatte resultatet eller verdien av en kategorisk variabel. I kategoriske variabler er det ikke mulig å beregne verken gjennomsnitt eller median.
Gjennomsnittet kan ikke beregnes fordi aritmetikk ikke kan gjøres med kategoriske variabler. Heller ikke medianen, fordi de kvantitative eller kategoriske variablene ikke har en orden eller hierarki, så det er ikke mulig å bestemme en sentral verdi..
Gitt en viss kategorisk variabel, kan frekvensen eller antall ganger som et resultat av den variabelen gjentas bli funnet. Hvis dette gjøres for hvert utfall, kan det lages en graf over frekvensen mot hver kategori eller utfall..
Her er noen eksempler på hvordan kategoriske variabler kan presenteres grafisk.
Et selskap har register over dataene til 170 ansatte. En av variablene som er i disse registrene er: Sivil status. Denne variabelen har fire kategorier eller mulige verdier:
Enkelt (TIL), Gift (B), Enkemann (C) , Skilt (D).
Selv om det er en ikke-numerisk variabel, er det mulig å vite hvor mange av de totale postene som er i en bestemt kategori og være representert i form av et søylediagram, som vist i følgende figur:
En skobutikk holder rede på salget. Blant variablene som administrerer postene, er skofargen for hver modell. Variabelen:
Color_Shoe_Model_AW3
Den er kategorisk og har fem mulige kategorier eller verdier. For hver kategori av denne variabelen summeres antall salg og prosentandelen av dem fastsettes. Resultatene er presentert i grafen til følgende figur:
Det kan da sies at AW3-skomodellen som er i mote, den som selges hyppigst er Hvit, tett fulgt av Svart.
Det kan også sies at med 70% sannsynlighet vil den neste skoen som selges av denne modellen være Hvit eller Svart.
Denne informasjonen kan være nyttig for butikken når du legger inn nye bestillinger, eller den kan til og med bruke rabatter på de minst solgte farger på grunn av overflødig varelager..
For en bestemt populasjon av blodgivere, vil du representere antall personer som tilhører en bestemt blodgruppe. En grafisk måte å visualisere resultatene på er ved hjelp av et piktogram, som er i bakgrunnen en tabell.
Den første kolonnen representerer variabelen Blodtype og mulige resultater eller kategorier. Den andre kolonnen har representasjon i ikonisk eller billedlig form av antall personer i hver kategori. I vårt eksempel brukes en rød dråpe som et ikon, som hver representerer 10 personer.
Ingen har kommentert denne artikkelen ennå.